Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ Δρ.Χ.Στρουθόπουλος Οι στόχοι της ΨΕΕ είναι οι εξής: • Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό.
Download ReportTranscript Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ Δρ.Χ.Στρουθόπουλος Οι στόχοι της ΨΕΕ είναι οι εξής: • Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό.
Slide 1
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 2
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 3
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 4
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 5
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 6
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 7
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 8
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 9
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 10
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 11
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 12
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 13
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 14
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 15
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 16
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 17
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 18
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 19
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 20
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 21
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 22
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 23
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 24
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 25
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 26
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 27
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 28
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 29
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 30
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 31
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 32
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 33
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 34
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 35
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1cc = dct1d(k1,c,N1);
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1x[k1]= idct1d(n2,&c[k1*N2],N2);
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 36
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 2
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 3
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 4
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 5
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 6
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 7
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 8
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 9
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 10
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 11
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 12
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 13
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 14
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 15
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 16
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 17
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 18
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 19
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 20
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 21
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 22
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 23
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 24
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 25
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 26
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 27
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 28
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 29
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 30
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 31
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 32
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 33
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 34
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 35
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include
#include
/*-------------------------------------------------------------------------*/
float dct1d(int k, float *x, int N)
{ int n; float c=0.0;
if( k == 0 )
{
for( n = 0; n < N; n++) c += x[n];
return c/sqrt((float)N);
}
for( n = 0; n < N; n++) c += x[n]*cos(M_PI*k*(2*n+1)/(2*N));
return c/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float idct1d(int n, float *c, int N)
{
int k; float x=0;
for( k = 1; k < N; k++) x += c[k]*cos(M_PI*k*(2*n+1)/(2*N));
return c[0]/sqrt((float)N) + x/sqrt((float)N/2);
}
/*-------------------------------------------------------------------------*/
float dct2d(int k1, int k2, float *x, int N1, int N2)
{
int n1; float *c, cc; char buf[20];
c = (float*)malloc(N1*sizeof(float));
for(n1 = 0; n1
free(c);
return cc;
}
/*-------------------------------------------------------------------------*/
float idct2d( int n1, int n2, float *c, int N1, int N2)
{
float *x, xx; int k1;
x = (float*)malloc(N1*sizeof(float));
for(k1 = 0; k1
xx = idct1d(n1,x,N1);
free(x);
return xx;
}
Ανακατασκευή με 8 συντελεστές
Ο μετασχηματισμός του Hough
ρ = x συνθ + y ημθ
y
ρ
(ε)
A
ρ
Ο
θ
(α)
x
θ
(β)
Σχήμα 8.
ρν = xκ συνθν + yκ ημθν
y
x y y ( )
x
2
( )
2
y
y
( )
2
y
0
( )
2
2
2
2
max x 2 y 2
Ο μετασχηματισμός του Hough
y
(0,1)
(ε
) (1,0.
5)
τοξεφ(2)
O(0, )
0)
x
(2,0)
3
2
2
J
M
2
2
2
, (
yP
)
xP
2
2
2
2
2
Μορφολογία
• Η επιστήμη της ψηφιακής μορφολογίας είναι σχετικά πρόσφατη,
από τότε δηλαδή που οι ηλεκτρονικοί υπολογιστές έκαναν
εφικτή μια τέτοια προσπάθεια. Από την άλλη τα μαθηματικά
που απαιτούνται είναι μόνο η θεωρία συνόλων που είναι μία
γνωστή επιστημονική περιοχή. Η βασική ιδέα που «κρύβεται»
κάτω από τη ψηφιακή μορφολογία είναι ότι οι εικόνες
αποτελούνται από εικονοστοιχεία(pixels,picture-elements) τα
οποία έχουν μία δυσδιάσταση απεικόνιση. Συγκεκριμένες
μαθηματικές εφαρμογές πάνω σε ομάδες εικονοστοιχείων
μπορούν να οδηγήσουν στην αναγνώριση και στην καταμέτρηση
των ολόκληρων σχημάτων στα οποία ανήκουν. Βασικές
εφαρμογές είναι η erosion(διάβρωση) και η dilation(διαστολή).
Στη διάβρωση τα pixels ενός μικρού προτύπου-pattern που
ταιριάζουν με ένα δεύτερο μεγαλύτερο πρότυπο διαγράφονται
από το δεύτερο. Στη διαστολή ένα σύνολο pixels προστίθεται
σε ένα αρχικό πρότυπο. Ωστόσο εξαρτάται από το είδος της
εικόνας για το πως θα εφαρμοστούν οι παραπάνω διεργασίες αν δηλαδή είναι δύο αποχρώσεων(bilevel δηλαδή άσπρο μαύρο),
ή γκρι αποχρώσεων ή πολύχρωμες
ΣΤΟΙΧΕΙΑ ΨΗΦΙΑΚΗΣ ΜΟΡΦΟΛΟΓΙΑΣ-ΔΥΑΔΙΚΕΣ ΕΦΑΡΜΟΓΕΣ
• Η μεταφορά (translation) ενός συνόλου Α κατά ένα
σημείο x σα σύνολο γράφεται ως εξής:
• (Α)x = {c|c = α + x, a A} 2.1
• Για παράδειγμα εάν το x ήταν το (1,2) τότε, το νέο, πάνω
αριστερά στοιχείο του A θα ήταν το (3,3) + (1,2) = (4,5).
Δηλαδή όλα τα εικονοστοιχεία του A θα μετακινηθούν
κατά μία γραμμή πιο κάτω και κατά δύο στήλες δεξιότερα
σ’αυτήν την περίπτωση. Αυτή η μετακίνηση γίνεται με τον
ίδιο τρόπο και στον τομέα της γραφικής με υπολογιστές
(computer graphics) – μία αλλαγή της θέσης κατά μία
συγκεκριμένη ποσότητα (στην περίπτωση μας η ποσότητα
ήταν η {1,2}).
Slide 36
Τμήμα Πληροφορικης & Επικοινωνιών - ΤΕΙ ΣΕΡΡΩΝ
Δρ.Χ.Στρουθόπουλος
Οι στόχοι της ΨΕΕ είναι οι εξής:
• Η ψηφιοποίηση και κωδικοποίηση εικόνων με σκοπό την
αποθήκευση, μετάδοση και εκτύπωσή τους.
•Η βελτίωση και η αποκατάσταση των εικόνων με σκοπό την
καλύτερη απεικόνισή τους.
•Η ανάλυση και κατανόηση των εικόνων
Η ΨΕΕ συνεργάζεται με τους παρακάτω επιστημονικούς κλάδους:
• Ψηφιακή Επεξεργασία Σημάτων (ΨΕΣ)
• Ρομποτική όραση
• Τεχνητή Νοημοσύνη
• Αναγνώριση Προτύπων
• Νευρωνικά Δίκτυα
• Ασαφής Λογική
• Κωδικοποίηση
• Γραφικά Η/Υ
Η μετατροπή μιας εικόνας σε ψηφιακή μορφή ουσιαστικά
είναι η μετατροπή ενός δισδιάστατου αναλογικού σήματος
σε ψηφιακό και απαιτεί τις διαδικασίες της δειγματοληψίας
και του κβαντισμού.
Η ΨΗΦΙΑΚΗ ΕΙΚΟΝΑ
Εικονοστοιχείο
(picture element, pixel, pel)
Η τιμή I(j,k)
με k=0,1,2….K-1
και j=0,1,2….J-1
είναι ο κωδικός του
χρώματος του
εικονοστοιχείου
στην θέση (k,j) της
ψηφιακής εικόνας
J πλήθος γραμμών
Κ πλήθος στηλών
JxK πλήθος εικονοστοιχείων
ΕΙΔΗ ΨΗΦΙΑΚΩΝ ΕΙΚΟΝΩΝ
Δυαδικές εικόνες (binary images)
I(k,j){0,1}
Εικόνες αποχρώσεων του γκρι (gray level images)
I(k,j)=0,1,...255
Eγχρωμες εικόνες (color images):
κάθε εικονοστοιχείο χρωματίζεται
με χρώματα που προέρχονται από
την ανάμειξη των αποχρώσεων του
κόκκινου, πράσινου και μπλε (RGB).
I(k.j)=(IR(k,j), IG(k,j), IB(k,j))
IR(k,j), IG(k,j), IB(k,j){0,1,2,...,255}
Το σύνολο των χρωμάτων που μπορούν να χρησιμοποιηθούν για τον χρωματισμό
των εικονοστοιχείων της εικόνας λέγεται χρωματική παλέτα.
Εάν C είναι το πλήθος των χρωμάτων, τότε για την κωδικοποίησή τους απαιτούνται
Β bits και ισχύουν οι σχέσεις: C=2B B=log2C
Το Β ονομάζεται βάθος bit (bit depth) της ψηφιακής εικόνας. Εάν η εικόνα έχει
Κ στήλες και J γραμμές τότε για την απεικόνισή της απαιτούνται
JKB bits.
Ο παρακάτω πίνακας παρουσιάζει ενδεικτικές τιμές των παραπάνω μεγεθών.
Είδος εικόνας
J
K
B
bits
bytes
Δυαδική
100
100
1
10000
1250
Αποχρώσεων του γκρι
100
100
8
80000
10000
Έγχρωμη RGB
100
100
24
240000
30000
ΕΥΚΡΙΝΕΙΑ ΕΙΚΟΝΑΣ
J
K
E
JK
A
J
ΜΟΝΑΔΕΣ
pixels/mm2
dpi ( dots per inch :
κουκίδες ανά ίντσα)
Φαινόμενο της σκακιέρας
K
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΔΥΑΔΙΚΕΣ ΕΙΚΟΝΕΣ
Κέντρο Βάρους
J 1 K 1
N I jk
j0 k 0
J 1 K 1
k
k I
j 0 k 0
jk
,
N
J 1 K 1
j
j I
j 0 k 0
N
jk
Κωδικοποίηση κατά μήκος διαδρομής (Run Length encoding, RLE)
Συστοιχία
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
1
1
0
0
1
1
1
0
(0,3),(7,2)
(5,2),(9,2)
(0,5),(7,3)
(0,2),(8,9)
(5,6),(9,10)
(0,4),(7,9)
3,4,2,2
0,5,2,2,2
5,2,3,1
Συνεκτικά και μη συνεκτικά συστατικά (χωρία), (connected components)
Μη συνδεδεμένο χωρίο
(not connected component)
Συνδεδεμένο χωρίο
(connected component)
Κωδικοποίηση αλυσίδας (chain coding)
3
2
1
0
4
5
6
7
Εκκίνηση από (2,2)
0, 0, 0, 0, 0, 7, 6, 6, 6, 6, 7, 6, 4, 3, 5, 4, 4, 4, 4, 2, 3, 2, 2, 2, 2, 1.
Υπογραφή (signature)
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
250
250
100
100
250
50
100
10
250
50
100
10
250
100
250
100
250
250
250
250
10
250
50
50
g
H(g)
h(g)
10
50
100
250
3
0.125
4
0.167
6
0.250
11
0.458
1.000
H (g )
1
I ( k , j) g
12
h (g )
10
8
H (g )
255
Η(g)
g 0
255
h(g) 1
6
4
g 0
2
0
0
50
100
150
200
250
300
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Ιστόγραμμα
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
14
14
25
25
25
25
26
27
27
27
g
H(g)
h(g)
g΄
P(g)
4
4/15
11/15
255*11/15 = 187
26
1
1/15
12/15
255*12/15 = 204
27
3
3/15
15/15
255*15/15 = 255
2 39
2 22
2 05
0
1 88
0
1 71
1
1 54
1
1 37
2
1 20
2
86
3
1 03
3
69
4
52
4
35
5
1
6
5
18
6
241
25
225
255*7/15 = 119
209
7/15
193
5/15
177
5
161
14
145
255*2/15 = 34
129
2/15
97
2/15
113
2
81
10
65
I΄(k,j) = [(G-1)P(I(k,j)]
14
49
P(g) = P(g-1)+ h(g).
14
33
i 0
14
1
P( g ) h(i )
10
17
g
10
ΕΠΕΞΕΡΓΑΣΙΕΣ ΣΤΙΣ ΕΙΚΟΝΕΣ ΑΠΟΧΡΩΣΕΩΝ ΤΟΥ ΓΚΡΙ
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 1ο
Βελτίωση εικόνας με εξισορρόπηση του ιστογράμματος
Παράδειγμα 2ο
Κατωφλίωση και πολυκατωφλίωση
Συχνά
τα
εικονοστοιχεία
ενός
αντικειμένου
μιας
εικόνας
παίρνουν τιμές σε ένα μικρό διάστημα αποχρώσεων. Αυτό
οδηγεί συνήθως στη δημιουργία ενός τοπικού μέγιστου στην
περιοχή του ιστογράμματος της εικόνας. Η εύρεση τέτοιων
τοπικών μεγίστων διευκολύνει τον εντοπισμό των αντικειμένων
της εικόνας και την απόδοσή της με λιγότερες κύριες
αποχρώσεις. Παρακάτω θα περιγράψουμε διάφορες τεχνικές για
τον καθορισμό τιμών του πεδίου των αποχρώσεων μεταξύ των
οποίων εμφανίζονται τοπικά μέγιστα του ιστογράμματος. Οι τιμές
αυτές λέγονται κατώφλια.
Μετατροπή εικόνας αποχρώσεων του γκρι με δυαδική κατωφλίωση
C1
Τ
C2
g
C αν g T
g 1
C 2 αν T g
0 αν I
C ( I
T)
jk
1
jk
I
jk
1 αν I
C ( I
T)
jk
2
jk
Κατωφλίωση - Μέθοδος της διασποράς (Otsu)
G 1
h( g ) 1
g 0
T 1
G 1
p1 h( g )
p2 h( g )
g 0
p1+p2=1.
g T
G 1
T 1
G 1
h( g ) g
h( g ) g
1
μ=p1μ1+p2μ2
2 ( g ) 2 h( g )
g 0
2
g 0
p1
h( g ) g
g T
p2
G 1
μ1
g 0
1
12 ( g 1 ) 2
g 0
22
1
p2
h( g ) 1 1
( g 1 ) 2 h( g )
p1
p1 g 0
G 1
(g
g T
μ2
2
) 2 h( g )
w2 p1 12 p2 22
b2 p1 (1 ) 2 p2 ( 2 ) 2 p1 p2 (1 2 ) 2
b2
1 w2 b2
b2
2
w
2 w2 b2
b2
p1 (1 ) 2
1 p1
2
b2
1
t max ( b2 (T ))
T
t=107
Παράδειγμα
Κατωφλίωση - Μέθοδος της Εντροπίας (Kapur)
ρ(g)
T 1
h(g)
, 1 h(g)
1
g 0
T 1
h(g)
h(g)
1 T-1
log(
) log(1 ) h(g) log(h(g))
1
1 g 0
g 0 Ρ1
E1 (T )
255
h(g)
h(g)
log
, 2 1 1
2
g T Ρ 2
Ε 2
log(1 1 )
1 255
h(g) log(h(g))
1 1 g T
t max ( E (T ))
T
t=111
Παράδειγμα
Πολυκατωφλίωση
h( )
1
17
33
49
65
81
97
113 129 145 161 177 193 209 225 241
G( 0 ) αν f ( x ,y ) T ( 1 )
G( 1 ) αν T ( 1 ) f ( x ,y ) T ( 2 )
I ( x ,y ) .
.
G( J 1 ) αν T ( J 1 ) f ( x ,y )
Πολυκατωφλίωση – ΝΔ Kohonen
w0
o j (t ) I ( x, y ) w j (t )
w1
oc(t) = min{oj(t)}
I
α(t) (I( x, y ) w j (t )) αν j Ν c
Δw j
0 αν j N
c
wj-
x
2
wj1
I(x,y)
wj
wj+1
wj+2
wJ-1
Γειτονιά του j νευρώνα για d(t)=2
wj(t+1)=wj(t)+Δwj(t)
a( t ) a( 0 )( 1
t
)
T
d ( t ) d ( 0 )( 1
t
)
T
Πολυκατωφλίωση – ΝΔ Kohonen
Πολυκατωφλίωση
Συγκριτικά αποτελέσματα
Μέθοδος
Πλήθος
κατωφλίω
ν
ΝΔ
Kohonen
Reddi
Kapur
Παπαμάρκο
υ
1
T0
164
164
42
114
2
T0
T1
151
227
112
191
42
210
167
226
3
T0
T1
T2
106
179
229
97
149
205
42
139
210
117
184
227
4
T0
T1
T2
T3
106
178
224
237
95
142
192
230
42
118
164
210
117
184
227
-
Εύρεση ακμών
Σε μια εικόνα αποχρώσεων του γκρι υπάρχουν περιοχές
εικονοστοιχείων με απότομη αύξηση της φωτεινότητας. Οι
περιοχές αυτές βρίσκονται στα όρια των τμημάτων της εικόνας που
έχουν σημαντικά διαφορετικές αποχρώσεις. Η ανίχνευση των ορίων
αυτών λέγεται προσδιορισμός των ακμών της εικόνας (edge
detection). Η ανίχνευση ακμών είναι εξαιρετικά χρήσιμη εργασία
στην ανάλυση των εικόνων διότι μέσω αυτής προσδιορίζονται τα
περιγράμματα των αντικειμένων της εικόνας. Υπάρχει πληθώρα
αλγορίθμων που αφορούν την επίλυση του προβλήματος, όμως όλοι
βασίζονται στην έννοια της κλίσης της συνάρτησης φωτεινότητας
Ι(k,j) στη θέση (k, j) ενός εικονοστοιχείου της εικόνας. Το
αποτέλεσμα της όλης εργασίας είναι μια νέα δυαδική εικόνα, ιδίων
διαστάσεων με την αρχική, όπου τα εικονοστοιχεία του
αντικειμένου είναι οι ακμές της αρχικής εικόνας, Στο ακόλουθο
σχήμα φαίνονται σε μία διάσταση, τύποι ακμών που διαφέρουν ως
προς την κλίση τους.
Εύρεση ακμών
f f
f (x, y) ,
x y
f f
f ( x, y)
x y
2
2
f
y
f
x
Άλλες μάσκες
1I(k, j) (1K I(k, j),1J I(k, j))
1K I(k, j) I(k, j) I(k 1, j)
1J I(k, j) I(k, j) I(k, j 1)
2 I (k , j ) ( 2 K I (k , j ), 2 J I (k , j ))
2 K I (k , j ) I (k 1, j ) I (k 1, j )
2 J I (k , j ) I (k , j 1) I (k , j 1)
Εύρεση ακμών με τον τελεστή Laplace
Εύρεση ακμών με τον τελεστή Laplace
2 f ( x , y)
x 2
2 f ( x , y)
y 2
1K(k+1,j)- 1K(k,j)= I(k+1,j)-I(k,j)-( I(k,j)-I(k-1,j))= I(k+1,j)-2I(k,j)+I(k-1,j)
1J(k,j+1)- 1J(k,j)= I(k,j+1)-I(k,j)-( I(k,j)-I(k,j-1))= I(k,j+1)-2I(k,j)+I(k,j-1)
2 f ( x, y)
2 f (x, y) 2 f (x, y)
x 2
y 2
1
2=
1
-4
1
1
Συμπίεση ψηφιακών εικόνων
Κωδικοποίηση HUFFMAN
100
100
100
100
100
G 1
G 1
200
10
20
150
100
g 0
g 0
200
50
50
150
100
200
200
200
150
150
80
80
80
80
80
l p( g )l ( g ) h( g )l ( g )
H (G) l H (G) 1
G 1
G 1
g 0
g 0
H (G) p( g ) log2 p( g ) h( g ) log2 h( g )
g
H(g)
h(g)
10
1
0.04
20
1
0.04
50
2
0.08
80
4
0.16
100
7
0.28
150
5
0.2
200
5
0.2
25
1
0
•Ευκρινής
•Μονοσήμαντος
•Στιγμιαία αποκωδικοποιήσιμος
0
0.08
0.16
1
0
0.32
1
0
0.6
1
0
0
\
1
0.4
1
1
g
h(g)
10
20
50
80
100
150
200
00000
00001
0001
001
01
10
11
Για την εικόνα του παραδείγματος απαιτούνται 1×5+1×5+2×4+4×3+7×2+5×2+5×2=54 bits
αντί των 25×3=75 bits που απαιτούνται για κωδικές λέξεις σταθερού μήκους τριών bits (3=[log27]+1)
Μετασχηματισμός συνημιτόνου
g 2 n
g 0 n
1
3
g1 n
Έστω οι ακολουθίες τιμών για n=0,1,2
2
cos( (2n 1))
3
3
2
cos( (2n 1))
3
6
n: 0
1
f (n)
1
3
g0 (n)
1
3
g1 (n)
1
2
g 2 (n)
1
2
6
3
1
3
0
2
2
1
3
1
2
1
6
g 0 g1 g 2 1,
g 0 g1 g T0 g1 0 g 0 g1
g 2 g1 g T2 g1 0 g 2 g1
g 0 g 2 g T0 g 2 0 g 0 g 2
1 1 1
f (1,3,2), g 0 (
,
,
)
3 3 3
1
1
1
2 1
g1 (
,0,
), g 2 (
,
,
)
2
2
6
3 6
f 0 1
f f1 3
f 2 2
1
1
1
6
g 0 (0)
g1 (0) 2
g 2 (0)
3
g 0 g 0 (1) 1 , g1 g1 (1) 0 , g 2 g 2 (1) 2
3
3
1
g 0 (2) 1
g1 (2)
g 2 (2) 1
3
2
6
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
n=1
F0
g0
g2
F2
F1
g1
f
Επειδή η βάση είναι ορθοκανονική
2
F0 g 0 f g 0 (0) f 0 g 0 (1) f1 g 0 ( 2) f 2 g 0 ( n ) f n g T0 f
n 0
2
F1 g1 f g1 (0) f 0 g1 (1) f1 g1 ( 2) f 2 g1 ( n ) f n g1T f
n 0
2
F2 g 2 f g 2 (0) f 0 g 2 (1) f1 g 2 ( 2) f 2 g 2 ( n ) f n g T2 f
n 0
T
F0 g 0
F F1 g1T f g 0 g1 g 2
F2 g T2
F GT f G F G GT f
T
f
f G F
G T G 1 (επειδή η βάση είναι ορθοκανονική)
2
Fk g k (n ) f n
n 0
k 0,1,2
2
f n g k (n ) Fk
k 0
g 0 n
1
2
2
, g1 n
cos( (2n 1)), g 2 n
cos( (2n 1))
3
6
3
3
3
ΤΑ ΠΑΡ ΑΠΑΝΩΕΙΝΑΙΕΙΔΙΚΗΠΕΡ ΙΠΤΩΣΗΤΩΝ ΑΚΟΛΟΥΘΩΝΓΙΑ Ν 3
g 0 n
1
, g k n
N
2
cos(
k (2n 1))
2N
Η οικογένεια των συναρτήσεων είναι ορθοκανονική
1
2
, g k n
cos(
k (2n 1))
2N
N
όπουN φυσικόςαριθμός, n, k 0,...,N - 1
g 0 n
N -1
gk , gm
n 0
2
2
cos(
k (2n 1))
cos(
m(2n 1))
2N
2N
1 k m
g k , g m
0 k m
Σε μία ψηφιακή εικόνα με Ν1 στήλες και Ν2 γραμμές η τιμή απόχρωσης
είναι μία ακολουθία Ι(n1,n2), n1=0,1,…,N1-1, n2=0,1,…,N2-1.
Η ορθοκανονική βάση του διδιάστατου μετασχηματισμού συνημιτόνου είναι:
g k 1k 2 ( n 1 , n 2 ) g k 1 ( n 1 ) g k 2 ( n 2 )
π.χ.
g 00 (n1 , n 2 )
1
,
N1 N 2
2
πk (2n 2 1)
cos( 2
),
N2
2N 2
g 0k 2 (n1 , n 2 )
1
N1
g k 1k 2 ( n 1 , n 2 )
2
πk (2n 1)
2
πk (2n 2 1)
cos( 1 1
)
cos( 2
)
N1
2 N1
N2
2N 2
Ο μονοδιάστατος και διδιάστατος ΜΣ σε γlώσσα C
Συμπίεση εικόνας με τη χρήση του ΜΣ
#include
#include
#include
#include