Transcript Comparison of Symbolic and Subsymbolic Approach in Artificial
Slide 1
Porovnanie symbolického a
subsymbolického prístupu
emergencie stratégie hry
Peter Lacko
Ústav aplikovanej informatiky
Fakulta informatiky a informačných technológií
Slide 2
Strojové hranie hier
Problém hrania hier je pre nás zaujímavý hlavne
z nasledovných dôvodov:
hra je štruktúrovaný dobre definovaný problém
pravidlá sú presne definované
dá sa jednoducho rozoznať úspech alebo neúspech
ľubovoľný stav hry má presnú reprezentáciu
hráč má všetky informácie o prostredí hry
hráčove informácie sú presné
dobre sa dá merať úspešnosť riešenia
Slide 3
Porovnanie prístupov umelej inteligencie
Dnešná umelá inteligencia ponúka dva rôzne
prístupy riešenia problémov:
klasické prístupy v umelej inteligencii (symbolický) tieto presadzujú symbolickú reprezentáciu vedomostí
a ich sekvenčné spracovanie
moderné prístupy v umelej inteligencii
(subsymbolický) - tieto sú založené vo veľkej miere na
neurónových sieťach, vo väčšine prípadov používajú
nesymbolickú reprezentáciu vedomostí a sú vhodne
použiteľné v oblastiach rozpoznávania vzorov.
Slide 4
História hrania hier
Arthur L. Samuel
Pôsobil na MIT,
IBM, DOD
IBM 704 (1954)
Prvý masovo
produkovaný
počítač s
aritmetikou
pohyblivej
desatinnej čiarky
cca 4000 operácií
za sekundu
Slide 5
História hrania hier
Učenie naspamäť
Zapamätávajú sa všetky pozície odohrané a
ohodnotené počas hry
Učenie zovšeobecňovaním
Zlepšenie – skúsenosti zovšeobecniť a ukladať
len zovšeobecnenia
Riešenie – program je schopný vyberať si sám
termy ohodnocovacieho polynómu a meniť im
ich koeficienty. (možných termov je 38, v
polynóme ich je 16)
Slide 6
Algoritmus MiniMax
vygenerujú sa všetky stavy, ktoré
môžu počas hry z aktuálneho stavu
nastať
rozhodne sa, ktorý nasledovný stav
je najlepší
listy vygenerovaného stromu sa
ohodnotia bodovaciou funkciou
postupne sa ohodnotia stavy na
vyšších úrovniach
najlepší nasledovný ťah je ten, ktorý
maximalizuje hodnotu koreňa stromu
vykoná sa ťah, ktorý vedie
k najlepšiemu nasledovnému stavu
Slide 7
Symbolický prístup
Veľkosti prehľadávacích stromov pre rôzne hry
Tic-Tac-Toe
105 uzlov
Dáma
1031 uzlov
Šach
10123 uzlov
Go
10360 uzlov
Nie je možné vygenerovať celé stromy hier
Orezávanie do hĺbky s heuristickou funkciou
a-b orezávanie
Slide 8
Symbolický prístup
Výpočet časovej náročnosti vyriešenia hry šach
Počet možností
1046
Počet možností vďaka α-b orezávaniu
1023
Pozícií preskúmaných za sekundu
109
Vyriešenie šachu
1014 sekúnd 104 tisícročí
Slide 9
Hranie dámy - Chinook
Chinook zaviedol niečo úplne nové na poli počítačovej
dámy – databázu koncoviek
táto dávala programu perfektné znalosti o všetkých
pozíciách na šachovnici s osem a menej figúrkami vo
forme víťazstvo/remíza/prehra
celá osem-figúrková databáza mala približne 6GB
v komprimovanej forme a obsahovala 443 miliárd pozícií
v roku 1996 program Chinook skončil na prvom mieste
amerického šampionátu
poradie najlepších hráčov sveta americkej federácie
dámy bolo nasledovné:
Chinook 2816
Ron King 2632
Asa Long 2631z
Slide 10
Hranie šachu
víťazstvo počítačového systémy Deep Blue v turnaji proti
svetovému šampiónovi Garry Kasparovi v roku 1997
Deep Blue bol masívny paralelný systém navrhnutý na
prehľadávanie stromov hry šach. Pri prehľadávaní do
hĺbky bola rýchlosť približne od 100 do 330 miliónov
ťahov za sekundu.
vyhodnocovacia funkcia bola implementovaná v hardvéri
šachových čipov, čo zabezpečovalo vysoký výkon.
Vyhodnocovala 8000 rôznych „vzorov“, ktorým
priraďovala ohodnotenie
knižnica otvorení obsahovala približne 4000 pozícií.
databáza koncoviek obsahovala všetky možné hry s 5
a menej figúrkami na šachovnici.
Slide 11
Subsymbolický prístup
tvorený novými prístupmi v umelej inteligencií ako
neurónové siete a evolučné algoritmy.
neurónové siete
štrukturálna plasticita, ktorá znamená, že sa napríklad mení počet
skrytých neurónov
parametrická plasticita, ktorá zodpovedá zmene váh spojov a
prahových koeficientov skrytých a výstupných neurónov.
v11
x1
1
y1
v1i
..
.
v1I
..
.
j
xi
w1
yj
wj
wJ
..
.
xI
vJi
vJI
vJ1 ...
yJ
J
1
r
Slide 12
TD-Gammon
Učenie s trestom a odmenou
Vyžadoval len malé množstvo znalostí hry backgammon
a dokázal sa naučiť túto hru extrémne dobre
Po odohraní 300000 hier, kedy TD-Gammon (so 40
skrytými neurónmi) hral sám proti sebe, bol schopný hrať
asi na rovnakej úrovni ako ostatné programy
Vylepšený TD-Gammon, ktorý mal 160 skrytých
neurónov a prehľadával strom hry 3 ťahy dopredu,
dosahoval už majstrovské výsledky
Naučil sa hrať niektoré otvorenia inakšie ako boli
dovtedajšie konvencie medzi najlepšími hráčmi. Po
ďalších analýzach začali aj ľudský hráči hrať tieto
otvorenia.
Slide 13
Evolučné princípy
Stochastická metóda optimalizácie
Základnou myšlienkou je napodobnenie biologických
procesov evolúcie
Genetický algoritmus prebieha nad množinou jedincov, ktorí
tvoria populáciu. Každý jedinec je ohodnotený jeho fitness
Kvázináhodným výberom sa vyberú dvaja rodičovskí jedinci. Výber
zabezpečuje vyššiu pravdepodobnosť vstupu do reprodukcie
jedincom s vyšším fitness.
Reprodukcia prebieha len s určitou pravdepodobnosťou. Ak jedinci
neprechádzajú reprodukciou, vracajú sa nezmenení do populácie.
Reprodukcia prebieha v dvoch krokoch – kríženie a mutácia.
Vrátenie nových potomkov do populácie.
Slide 14
Evolučné hranie dámy
Tento prístup bol založený na evolučne optimalizovaných
neurónových sieťach. Neurónová sieť ohodnocovala hracie
plochy. Toto ohodnotenie bolo potom spracované
algoritmom MiniMax, ktorý bol zodpovedný za výber ťahu
Úprava váh prebiehala evolučne, teda populácia sietí hrala
turnaje hier. Výsledok turnaja siete predstavoval jej fitness.
Po odohraní turnajov sa jedinci s najväčším fitness
reprodukovali. Počiatočná populácia mala váhové vektory
neurónovej siete nastavené na náhodné hodnoty.
Vypočítali 100 generácií sietí, z tejto populácie vybrali
najlepšiu sieť
Neurónová sieť dosiahla po 100 hrách ohodnotenie 1825 čo
je dobrý výsledok, keďže počiatočné ohodnotenie siete bolo
1600. Sieť teda bola schopná poraziť živých hráčov, ktorí
nevedeli, že hrajú so strojom.
Slide 15
Budúcnosť
Stále existujú hry,
ktoré počítač nie je
schopný riešiť lepšie
ako človek
Príklad – GO
Stavový priestor 10360
Počiatočné vetvenie 361
Komplexné stratégie
Rozpoznávanie vzorov
Slide 16
Zhrnutie
v niektorých hrách sa dosiahli vynikajúce výsledky
stále existujú problémy, ktoré nie je počítač
schopný riešiť lepšie ako človek
každý z prístupov, keď je použitý správne, je
schopný hrať hru na majstrovskej úrovni
pri symbolickej umelej inteligencii sa pokúšame
vytvoriť algoritmy, ktoré by priamo používali znalosti,
ktoré máme o danej hre
pri subsymbolickom prístupe si tieto znalosti
vytvára algoritmus akoby sám
stále sa zvyšujúci výkon počítačov a kapacity ich
pamätí zlepšuje výsledky klasických algoritmov
a umožňuje skúšanie nových prístupov
Slide 17
Ďakujem za Vašu pozornosť
Porovnanie symbolického a
subsymbolického prístupu
emergencie stratégie hry
Peter Lacko
Ústav aplikovanej informatiky
Fakulta informatiky a informačných technológií
Slide 2
Strojové hranie hier
Problém hrania hier je pre nás zaujímavý hlavne
z nasledovných dôvodov:
hra je štruktúrovaný dobre definovaný problém
pravidlá sú presne definované
dá sa jednoducho rozoznať úspech alebo neúspech
ľubovoľný stav hry má presnú reprezentáciu
hráč má všetky informácie o prostredí hry
hráčove informácie sú presné
dobre sa dá merať úspešnosť riešenia
Slide 3
Porovnanie prístupov umelej inteligencie
Dnešná umelá inteligencia ponúka dva rôzne
prístupy riešenia problémov:
klasické prístupy v umelej inteligencii (symbolický) tieto presadzujú symbolickú reprezentáciu vedomostí
a ich sekvenčné spracovanie
moderné prístupy v umelej inteligencii
(subsymbolický) - tieto sú založené vo veľkej miere na
neurónových sieťach, vo väčšine prípadov používajú
nesymbolickú reprezentáciu vedomostí a sú vhodne
použiteľné v oblastiach rozpoznávania vzorov.
Slide 4
História hrania hier
Arthur L. Samuel
Pôsobil na MIT,
IBM, DOD
IBM 704 (1954)
Prvý masovo
produkovaný
počítač s
aritmetikou
pohyblivej
desatinnej čiarky
cca 4000 operácií
za sekundu
Slide 5
História hrania hier
Učenie naspamäť
Zapamätávajú sa všetky pozície odohrané a
ohodnotené počas hry
Učenie zovšeobecňovaním
Zlepšenie – skúsenosti zovšeobecniť a ukladať
len zovšeobecnenia
Riešenie – program je schopný vyberať si sám
termy ohodnocovacieho polynómu a meniť im
ich koeficienty. (možných termov je 38, v
polynóme ich je 16)
Slide 6
Algoritmus MiniMax
vygenerujú sa všetky stavy, ktoré
môžu počas hry z aktuálneho stavu
nastať
rozhodne sa, ktorý nasledovný stav
je najlepší
listy vygenerovaného stromu sa
ohodnotia bodovaciou funkciou
postupne sa ohodnotia stavy na
vyšších úrovniach
najlepší nasledovný ťah je ten, ktorý
maximalizuje hodnotu koreňa stromu
vykoná sa ťah, ktorý vedie
k najlepšiemu nasledovnému stavu
Slide 7
Symbolický prístup
Veľkosti prehľadávacích stromov pre rôzne hry
Tic-Tac-Toe
105 uzlov
Dáma
1031 uzlov
Šach
10123 uzlov
Go
10360 uzlov
Nie je možné vygenerovať celé stromy hier
Orezávanie do hĺbky s heuristickou funkciou
a-b orezávanie
Slide 8
Symbolický prístup
Výpočet časovej náročnosti vyriešenia hry šach
Počet možností
1046
Počet možností vďaka α-b orezávaniu
1023
Pozícií preskúmaných za sekundu
109
Vyriešenie šachu
1014 sekúnd 104 tisícročí
Slide 9
Hranie dámy - Chinook
Chinook zaviedol niečo úplne nové na poli počítačovej
dámy – databázu koncoviek
táto dávala programu perfektné znalosti o všetkých
pozíciách na šachovnici s osem a menej figúrkami vo
forme víťazstvo/remíza/prehra
celá osem-figúrková databáza mala približne 6GB
v komprimovanej forme a obsahovala 443 miliárd pozícií
v roku 1996 program Chinook skončil na prvom mieste
amerického šampionátu
poradie najlepších hráčov sveta americkej federácie
dámy bolo nasledovné:
Chinook 2816
Ron King 2632
Asa Long 2631z
Slide 10
Hranie šachu
víťazstvo počítačového systémy Deep Blue v turnaji proti
svetovému šampiónovi Garry Kasparovi v roku 1997
Deep Blue bol masívny paralelný systém navrhnutý na
prehľadávanie stromov hry šach. Pri prehľadávaní do
hĺbky bola rýchlosť približne od 100 do 330 miliónov
ťahov za sekundu.
vyhodnocovacia funkcia bola implementovaná v hardvéri
šachových čipov, čo zabezpečovalo vysoký výkon.
Vyhodnocovala 8000 rôznych „vzorov“, ktorým
priraďovala ohodnotenie
knižnica otvorení obsahovala približne 4000 pozícií.
databáza koncoviek obsahovala všetky možné hry s 5
a menej figúrkami na šachovnici.
Slide 11
Subsymbolický prístup
tvorený novými prístupmi v umelej inteligencií ako
neurónové siete a evolučné algoritmy.
neurónové siete
štrukturálna plasticita, ktorá znamená, že sa napríklad mení počet
skrytých neurónov
parametrická plasticita, ktorá zodpovedá zmene váh spojov a
prahových koeficientov skrytých a výstupných neurónov.
v11
x1
1
y1
v1i
..
.
v1I
..
.
j
xi
w1
yj
wj
wJ
..
.
xI
vJi
vJI
vJ1 ...
yJ
J
1
r
Slide 12
TD-Gammon
Učenie s trestom a odmenou
Vyžadoval len malé množstvo znalostí hry backgammon
a dokázal sa naučiť túto hru extrémne dobre
Po odohraní 300000 hier, kedy TD-Gammon (so 40
skrytými neurónmi) hral sám proti sebe, bol schopný hrať
asi na rovnakej úrovni ako ostatné programy
Vylepšený TD-Gammon, ktorý mal 160 skrytých
neurónov a prehľadával strom hry 3 ťahy dopredu,
dosahoval už majstrovské výsledky
Naučil sa hrať niektoré otvorenia inakšie ako boli
dovtedajšie konvencie medzi najlepšími hráčmi. Po
ďalších analýzach začali aj ľudský hráči hrať tieto
otvorenia.
Slide 13
Evolučné princípy
Stochastická metóda optimalizácie
Základnou myšlienkou je napodobnenie biologických
procesov evolúcie
Genetický algoritmus prebieha nad množinou jedincov, ktorí
tvoria populáciu. Každý jedinec je ohodnotený jeho fitness
Kvázináhodným výberom sa vyberú dvaja rodičovskí jedinci. Výber
zabezpečuje vyššiu pravdepodobnosť vstupu do reprodukcie
jedincom s vyšším fitness.
Reprodukcia prebieha len s určitou pravdepodobnosťou. Ak jedinci
neprechádzajú reprodukciou, vracajú sa nezmenení do populácie.
Reprodukcia prebieha v dvoch krokoch – kríženie a mutácia.
Vrátenie nových potomkov do populácie.
Slide 14
Evolučné hranie dámy
Tento prístup bol založený na evolučne optimalizovaných
neurónových sieťach. Neurónová sieť ohodnocovala hracie
plochy. Toto ohodnotenie bolo potom spracované
algoritmom MiniMax, ktorý bol zodpovedný za výber ťahu
Úprava váh prebiehala evolučne, teda populácia sietí hrala
turnaje hier. Výsledok turnaja siete predstavoval jej fitness.
Po odohraní turnajov sa jedinci s najväčším fitness
reprodukovali. Počiatočná populácia mala váhové vektory
neurónovej siete nastavené na náhodné hodnoty.
Vypočítali 100 generácií sietí, z tejto populácie vybrali
najlepšiu sieť
Neurónová sieť dosiahla po 100 hrách ohodnotenie 1825 čo
je dobrý výsledok, keďže počiatočné ohodnotenie siete bolo
1600. Sieť teda bola schopná poraziť živých hráčov, ktorí
nevedeli, že hrajú so strojom.
Slide 15
Budúcnosť
Stále existujú hry,
ktoré počítač nie je
schopný riešiť lepšie
ako človek
Príklad – GO
Stavový priestor 10360
Počiatočné vetvenie 361
Komplexné stratégie
Rozpoznávanie vzorov
Slide 16
Zhrnutie
v niektorých hrách sa dosiahli vynikajúce výsledky
stále existujú problémy, ktoré nie je počítač
schopný riešiť lepšie ako človek
každý z prístupov, keď je použitý správne, je
schopný hrať hru na majstrovskej úrovni
pri symbolickej umelej inteligencii sa pokúšame
vytvoriť algoritmy, ktoré by priamo používali znalosti,
ktoré máme o danej hre
pri subsymbolickom prístupe si tieto znalosti
vytvára algoritmus akoby sám
stále sa zvyšujúci výkon počítačov a kapacity ich
pamätí zlepšuje výsledky klasických algoritmov
a umožňuje skúšanie nových prístupov
Slide 17
Ďakujem za Vašu pozornosť