Mäkká klasifikácia 2
Download
Report
Transcript Mäkká klasifikácia 2
Obrazová klasifikácia
Mäkká klasifikácia – 2.časť
Analýzy spektrálneho miešania
množina techník, pri ktorých sa zmiešané
spektrálne signatúry porovnávajú so sadou
„čistých“ referenčných spektier (meraných
v laboratóriu, v teréne alebo na snímke)
základný predpoklad je, že spektrálne variácie
na snímke sú spôsobené zmiešaním konečného
počtu povrchových materiálov
výsledkom je odhad približných podielov
rozlohy každého pixla pokrytých danými
referenčnými triedami
lepšia reprezentácia reality zemského povrchu
Lineárne modely miešania
Linear mixture models (LMM) – jedny z
najpoužívanejších
„čisté“ spektrálne signatúry sa nazývajú
koncové členy (endmembers)
váha pre každú koncovú signatúru je podielom
plochy pixla pokrytej danou triedou
výsledkom sú podielové obrazy (vrstvy) pre
každú triedu (koncového člena)
lepšia reprezentácia reality zemského povrchu
v Idrisi modul UNMIX
Lineárne modely miešania
suma podielov všetkých tried musí byť = 1
DN každého pixla musí byť sumou DN daných
koncových členoch váženou ich podielom + E
(neznáma chyba)
napr. máme dva koncové členy so spektrálnymi
hodnotami v 3 pásmach:
A (24,132,86)
B (56,144,98)
pixel, v ktorom je ich podiel 50/50, bude mať
spektrálne hodnoty:
X (40,138,92)
Lineárne modely miešania
•
ak má pixel spektrálne hodnoty napr.:
X (32,135,89)
podiel jednotlivých koncových členov A a B
vypočítame pomocou sústavy rovníc:
fA(24) + fB(56) = 32
fA(132) + fB(144) = 135
fA(86) + fB(98) = 89
kde fA a fB sú frakcie (podiely) tried A a B
(v tomto prípade 0,75 a 0,25)
Lineárne modely miešania
•
potom v danom spektrálnom pásme platí:
DNX = fA.DNA + fB.DNB + E
•
sústava rovníc sa dá riešiť, len ak počet
koncových členov neprekročí počet pásiem, resp.
počet pásiem + 1 (vtedy nie je možnosť vypočítať
chybu E)
•
to je limitáciou napr. pri SPOT (5 tried a menej),
ale nie je to prekážkou pri hyperspektrálnych
údajoch, ktoré obsahujú niekoľko desiatok pásiem
•
ďalším obmedzením je predpoklad lineárneho
miešania, čo neplatí napr. pri viacnásobných
odrazoch od pôdy a vegetácie
Lineárne modely miešania
•
tvorba koncových signatúr v Idrisi - modul
ENDSIG
Fuzzy klasifikácia
založená na fuzzy logike (fuzzy logic) –
matematický prístup na kvantifikáciu neurčitých
údajov
dva striktné údaje „áno“ a „nie“ (1 a 0) sa
nahradia kontinuálnym rozsahom od 0 do 1
teória fuzzy (neostrých) množín – zaviedol ju
matematik a inžinier Zadeh v r.1965 ako
metódu zaobchádzania s neurčitými spôsobmi
definovateľným spôsobom
využíva sa napr. pri kontrole procesov,
manažmente a robení rozhodnutí, v ekonomike,
výskume, pri rozoznávaní vzoru
Fuzzy klasifikácia
Fuzzy klasifikácia
binárna príslušnosť je nahradená stupňom
príslušnosti (membership value) k množine,
ktorý sa spojito mení v intervale od 0 do 1
príslušnosť je vyjadrená pomocou tzv. funkcie
príslušnosti (Membership Function, MF, μ)
Fuzzy klasifikácia
funkcia príslušnosti NIE JE pravdepodobnostná
funkcia, ktorá je štatisticky definovaná
príslušnosť v zmysle fuzzy logiky je skôr
priznanie možnosti, že prvok je členom množiny
alebo že daný jav je pravdivý
pri fuzzy klasifikácii stupeň príslušnosti závisí
od toho, ako dobre pixel (objekt) spĺňa
podmienky opisujúce danú triedu
tieto podmienky sú vyjadrené pomocou fuzzy
pravidiel, ktoré patria medzi if-then pravidlá:
Ak DNR Є [0,50] Potom KP = voda
pričom [0,50] je fuzzy množina
Fuzzy klasifikácia
hodnota príslušnosti k danej triede je rovná
hodnote príslušnosti k fuzzy množine
μvoda(pixel) = μ[0,50] (DN(pixel))
stupeň príslušnosti závisí
od tvaru funkcie príslušnosti
podmienky sa môžu aj
kombinovať pomocou fuzzy
operátorov AND, OR a NOT
vo fuzzy logike je operátor
A AND B nahradený minimom
MIN (A,B), operátor A OR B
maximom MAX (A,B)
a operátor NOT B je
nahradený (1 – B)
Fuzzy klasifikácia
1.
2.
definovanie funkcií príslušnosti:
na základe expertných poznatkov (Semantic
Import Approach)
využitím metód numerickej taxonómie
a) na princípe zhlukovania (napr. metóda fuzzy c
priemerov – fuzzy alternatíva metódy
zhlukovania K Means, ktorá sa nazýva aj fuzzy
zhlukovanie – v softvéri Geomatica)
b) na základe trénovacích množín (fuzzy
kontrolovaná klasifikácia – napr. fuzzy metóda
najbližšieho suseda) – nemali by sa vyberať iba
homogénne trénovacie množiny, ale aj zmiešané
(heterogénne)
Fuzzy zhlukovanie
namiesto toho, aby bol neznámy pixel (merací
vektor) zaradený len do jednej triedy bez ohľadu
na to, ako blízko je k danej časti príznakového
priestoru, priradí sa mu hodnota „stupňa
príslušnosti“ vyjadrujúca, ako ďaleko je pixel
(merací vektor) k priemerom všetkých zhlukov
Fuzzy kontrolovaná klas.
1.
Definovanie fuzzy pravidiel (funkcií príslušnosti
uživateľom) – v softvéri eCognition
2. Automatický výpočet funkcií príslušnosti v
príznakovom priestore na základe trénovacích
množín
a) Fuzzy metóda najbližšieho suseda - v softvéri
eCognition
b) Fuzzy metóda minimálnej vzdialenosti – modul
FUZCLAS v softvéri Idrisi
Fuzzy signatúry
môžeme použiť „čisté“ signatúry
niekedy však práve zmiešané signatúry
poskytujú najlepšie výsledky
v Idrisi modul FUZSIG na zber neurčitých
(v širšom zmysle) signatúr
Fuzzy kontrolovaná klas.
FUZCLASS – sigmoidálna funkcia príslušnosti
(najpoužívanejšia v teórii množín)
1.parameter: vzdialenosť z-score, pri ktorej bude
hodnota príslušnosti 0
2.parameter: či majú byť hodnoty príslušnosti
normalizované (t.j. suma MF za pixel = 1)
Fuzzy kontrolovaná klas.
Fuzzy metóda najbližšieho suseda (NN) v eCognition:
hodnota príslušnosti sa vypočíta na základe
vzdialenosti d neznámeho objektu od vzorky:
2
-kd
z(d) = e
kde k je parameter sklonu funkcie:
k = ln(1/sklon funkcie) , pričom
sklon funkcie sa rovná
z(d) pre d=1
- čím menší sklon, tým
bližšie musí byť objekt
k vzorovému objektu,
aby bol klasifikovaný
Fuzzy klasifikácia
výsledkom fuzzy klasifikácie je vrstva/vrstvy,
ktoré vyjadrujú príslušnosť každého
pixla/objektu ku každej klasifikačnej triede
alebo k vybraným triedam (napr. prvým trom s
najvyšším stupňom príslušnosti)
Klasifikačné stromy
patria medzi rozhodovacie stromy (Decision
Trees)
skladajú sa z koreňového uzla (root), medziuzlov
(internode) a listových uzlov (leaf)
koreňový uzol a medziuzly sú rozhodovacie
(vyhodnocuje sa otázka alebo test)
uzly sú spojené vetvami
sú konštruované automaticky na základe
množiny pravidiel
neparametrické (založené na trénovacích
údajoch)
v Idrisi modul CTA
Klasifikačné stromy
klasifikačné stromy (Classification Trees) – na
predpovedanie kategorických premenných
regresné stromy (Regression Trees) – na
predpovedanie spojitých premenných
CART (Classification and Regression Trees) –
kombinácia, používaná pri klasifikácii údajov
DPZ
Umelé neurónové siete
Artificial Neural Networks (ANN) – začali sa vyvíjať
v 80-tych rokoch ako odozva na modely
biologických NN
cieľ – umelé systémy schopné sofistikovaných
výpočtov, aké prebiehajú v ľudskom mozgu
simulujú niektoré vlastnosti človeka ako je
samoadaptácia, samoorganizácia a tolerancia
voči poruchám
husté prepojenie jednoduchých elementov
sú neparametrické
učenie môže byť kontrolované a nekontrolované
siete môžu byť založené na spätnej väzbe a
pozitívnej spätnej väzbe
ANN - MLP
Multi-Layer Perceptron (MLP) – najčastejšie
využívaný v DPZ
sieť s pozitívnou spätnou väzbou šírením dozadu
(back-propagation)
mnohorozmerná nelineárna funkcia
štruktúra MLP:
šírenie dopredu
spätné šírenie
ANN - MLP
typická sieť BP obsahuje jednu vstupnú vrstvu
(údaje DPZ), jednu výstupnú vrstvu (triedy KP)
a jednu alebo viac skrytých vrstiev
každá vrstva obsahuje uzly (neuróny),
pospájané spojeniami s nerovnakou váhou
časť pixlov trén. množín sa
použije na testovanie
šírenie dopredu a späť sa
opakuje, až kým sa sieť
nenaučí charakteristiky tried
v každom kroku sa modifikuje
váhová matica pre spojenia
cieľom je stanoviť vhodné váhy
ANN - SOM
Self-Organizing Map (SOM) – neurónová sieť určená
na kontrolovanú a nekontrolovanú klasifikáciu
vstupná vrstva – údaje DPZ
výstupná vrstva – dvojdimenzionálne (zväčša
štvorcové) pole neurónov (môže byť aj 1D)
každý výstupný neurón je spojený so všetkými
vstupnými
ANN - SOM
má dve fázy:
hrubé ladenie (coarse tuning) – typ
nekontrolovanej klasifikácie
jemné ladenie (fine tuning) – zjemnenie hraníc
medzi triedami na základe trénovacích údajov
medzi tým – priraďovanie neurónov (podzhlukov) do trénovacích tried – labeling
vzniká tzv. príznaková mapa (Feature Map) –
charakterizuje vstupné vzorky a je analogická
k mapovaniu kôry ľudského mozgu, na ktorej je
založené spracovanie priestorových informácií
triedy s vysokou variabilitou – veľa neurónov
triedy s nízkou variabilitou – málo neurónov
ANN – Fuzzy ARTMAP
Fuzzy ARTMAP – neurónová sieť založená na
adaptívnej rezonančnej teórii (ART) – biologická
teória spracovania kognitívnych informácií
okrem iného bola navrhnutá na riešenie dilemy
stability-plasticity – vykazuje vysokú stabilitu
(zachováva to, čo sa už naučila), ale zároveň sa
vie prispôsobiť novým informáciám
fuzzy ART – zhlukovací algoritmus, ktorý pracuje
s fuzzy analógovými vstupnými vzormi (reálne
čísla od 0 do 1)
ANN – Fuzzy ARTMAP
architektúra siete:
nekontrolovaná klasifikácia:
F1 – vstupná vrstva (údaje DPZ)
F2 – vrstva kategórií (počet neurónov dynamicky
rastie počas učenia)
kontrolovaná klasifikácia:
mapovacia vrstva
(Map Field Layer)
výstupná vrstva
(Output Layer)
počet neurónov =
počet tried
vzťah jedna k jednej