Transcript PPS

SVEUČILIŠTE U ZAGREBU
FAKULTET KEMIJSKOG INŽENJERSTVA I TEHNOLOGIJE
Izračunavanje temperature
vrelišta uz pomoć umjetnih
neuronskih mreža
Studenti: Popčević Jelena
Varga Ines
Žuvela Petar
1943. godina
Pitts i Mulock su prvi dokazali da neuroni mogu imati dva stanja (umirujuće i pobuđujuće) =>
temelj za razvoj neuronskih mreža
1949. godina
Hebb je dao prijedlog za pravilo kojim se opisuje proces učenja (Hebbovo pravilo)
1956. godina
Rochester i skupina autora predstavljaju prvu simulaciju Hebbovog modela na Dartmouth
Summer Conference
1958. godina
prva neuronska mreža „Perceptron“, koju je razvio Frank Rosenblatt, u kojoj se učenje razvija u
dva sloja, nije mogla rješavati probleme klasifikacije koji nisu bili linearno djeljivi
1969. godina
Minsky i Papert objavljuju rad u kojem oštro kritiziraju nedostatke „Perceptrona“ => prekid
ulaganja u razvoj neuronskih mreža
1974. godina
Paul Werbos je razvio višeslojnu Perceptron mrežu – prvu verziju Backpropagation mreže koja
prevladava nedostatak Perceptrona uvođenjem učenja u „skrivenom sloju“
1986. godina
Rumelhart, Hinton i Williams usavršavaju „Backpropagation“ mrežu koja vraća ugled
neuronskim mrežama jer omogućuje aproksimiranje gotovo svih funkcija i rješavanje praktičnih
problema
 Umjetne neuronske mreže su metoda umjetne inteligencije
inspirirane i strukturirane prema ljudskom mozgu.
Umjetna neuronska mreža
Biološka neuronska mreža
n
z j   w ji  xi
i 1
y j  f (z j )
z j     w ji
s
s
 xi
s 1
i

s
s
s 1 
s
x j   f   w ji   xi    f ( z j  )
 i

TIP MREŽE
OPIS
Acikličke
Ne sadrže povratne veze.
Cikličke
Sadrže povratne veze.
Djelomično
Svaki neuron u prvom sloju ne mora nužno biti
povezane
Potpuno
povezane
povezan sa svakim neuronom u drugom sloju.
Svaki neuron prethodnog sloja povezan je sa svakim
neuronom sljedećeg sloja.
Sastoji se od jednog sloja neurona tzv. izlaznog sloja.
Ali osim izlaznog sloja neurona, jednoslojna mreža
Jednoslojne
sadrži i ulazni sloj, koji sadrži ulazne podatke. On se
ne broji kao sloj neurona, jer u njemu nema
nikakvog računanja.
Razlikuju se od jednoslojnih u tome što imaju jedan
ili više skrivenih slojeva između ulaznog i izlaznog
Višeslojne sloja. Upravo je skriveni sloj onaj u kojem se uče
međuzavisnosti u modelu, informacije neurona se
ovdje obrađuju i šalju u neurone izlaznog sloja.
SHEMATSKI PRIKAZ
1. FAZA UČENJA
(TRENIRANJA)
2. FAZA TESTIRANJA
1. FAZA UČENJA
(TRENIRANJA)
 Učenje je proces mijenjanja
težina u mreži, a odvija se kao
odgovor na podatke izvana
koji su predstavljeni ulaznom
sloju i u nekim mrežama
izlaznom sloju
 3 VRSTE UČENJA:
NADGLEDANO
NENADGLEDANO
UČENJE
PODRŠKOM
Definirati model
podacima iz
prošlosti
Ulazne
varijable
Izlazne
varijable
Podjela
podataka
TRENIRANJE
• 70%
2 poduzorka
treniranje
testiranje
3 poduzorka
treniranje
testiranje
validacija
TESTIRANJE
• 10%
VALIDACIJA
• 20%
•
•
•
Što je događa u fazi •
učenja?
•
Da li je moguće
pretrenirati mrežu?
podešavanja težina u mreži
proces se odvija u više iteracija
u svakoj iteraciji računaju se nove težine
kod nadgledanih algoritama i nova greška
mreža se trenira u nekoliko tisuća iteracija
• Da, nakon određenog broja iteracija mreža gubi svojstvo
generalizacije (svojstvo dobre klasifikacije za nepoznate
ulaze) i postaje stručnjak za obradu podatka iz skupa
primjera za učenje dok preostale podatke obrađuje loše
2. FAZA TESTIRANJA
Razlike između faze učenja i
testiranja
• mreža više ne uči
• težine fiksne na vrijednostima koje su
dobivene kao rezultat prethodne faze učenja
• mreži se predstavljaju novi ulazni vektori koji
nisu sudjelovali u procesu učenja
• mreža za predstavljen novi ulazni vektor
mora da ti izlaz
PREDNOSTI
NEDOSTACI
• točnije su od ostalih statističkih
tehnika
• uči složene odnose i mogućnost
uključivanja kvalitativnih i
kvantitativnih podataka
• odlična moć predviđanja
• slaba sposobnost objašnjavanja
• dugo vrijeme treniranja može
predstavljati problem
• ako je potrebno često trenirati mrežu
to može učiniti aplikacije
neupotrebljivim
OBRADA
GOVORA
OBRADA
SIGNALA
MEDICINA
Primjena
KONTROLA
PROCESA
KOMPRESIJ
A SLIKE
PREPOZNAV
ANJE
ZNAKOVA
 novija metoda
 razvijena početkom 60-tih godina prošlog stoljeća uvođenjem
dvaju ekstratermodinamičkih metoda:
LFER
• Linear free energy
relationships
• metoda između bioloških
aktivnosti strukturalno
sličnih lijekova i kemijskih
supstituenata na
zajedničkoj molekuli
Free-Wilson
• Free-Wilson analiza
temeljena na zbrajanju
doprinosa različitih
supstitucijskih grupa i
višestrukih položaja
supstituenata na biološku
aktivnost
 matematički oblik opisan je jednadžbom:
Veličina  f (fizikalnokemijska/strukturalna svojstva)
 Prva primjena QSAR metodologije :
→ Corwin Herman Hansch, 1969. god. predstavio jednadžbu koja
je povezala biološku aktivnost s određenim elektroničkim
svojstvima i hidrofobnosti seta struktura
1
log  k1 log P  k2 (log P) 2  k3 s  k4
C
 temelji se na: određivanju relacija između specifične promjenjive
veličine (aktivnosti) i fizikalno-kemijskih i/ili strukturalnih
svojstava koja su određena vrijednostima - DESKRIPTORI
 QSAR odnos
P  C  a1  a2   a3  ...
P1  C  a11  a2 1  a3 1  ...
P2  C  a12  a2 2  a3 2  ...
.
.
.
Pn  C  a1n  a2 n  a3 n  ...
n QSAR jednadžbe
Za određivanje koeficijenata potrebno je odabrati
pripadajuću metodu od tri slučaja:
n jednadžbi s n
n jednadžbi s m
nepoznanica nepoznanica (n > m)
n jednadžbi s m
moguće je provesti
pri čemu se koriste
nepoznanica (n < m)
Gauss – Jordanove
metode višestruke
pri čemu sustav
transformacije pri
linearne regresije,
jednadžbi nema
čemu vektor rješenja
kao i metoda
rješenja
sadrži QSAR
parcijalnih
koeficijente
najmanjih kvadrata
FARMACEUTSKA
INDUSTRIJA –
određivanje
učinkovitosti lijekova
ZAŠTITA OKOLIŠA –
određivanje akutnih
toksičnosti
(koncentracije
dovoljne za pojavu
pomora riba)
PRIMJENA
ANALITIČKA KEMIJA određivanje ovisnosti
između fizikalnokemijskih i/ili
strukturalnih svojstava i
tR u tekućinskoj
kromatografiji
Tv(ANN)
Tv (eksp.)
Tv(ANN)
Tv (eksp.)
133,631
242,4828
178,7029
133,7803
176,8881
100,7528
146,7127
180,5087
158,0855
185,0233
233,1188
75,25432
145,7496
93,51875
199,0473
192,279
162,1013
186,218
91,16086
125,9409
212,9976
186,2269
178,1284
73,6352
185,8164
176,358
210
252
164
156
118,5
80
179
231
160,5
186
269
68
116
75
139
295
100
281
198
142
122
146,5
148
128
257
180
169,7372
142,2768
166,9445
109,9049
130,9041
154,5679
129,6752
205,6429
117,0997
79,13346
155,6121
157,4732
227,1264
80,76426
149,8917
183,0153
111,0812
155,8788
147,3234
123,6295
203,6799
208,2676
147,7615
210,7403
118,9759
169
119
153
95
223
170
94
163
45
89
233
152
203
113,5
156
189
209
120
178
131
234
106
157
242
90
Kako se dobivene vrijednosti u potpunosti ne
podudaraju s originalnim vrijednostima
temperature vrelišta za tih 50 spojeva, može se
zaključiti da je za provedbu QSAR-a ipak
učinkovitija neka druga metoda poput metode
parcijalnih najmanjih kvadrata