Rola eksplanacyjna reprezentacji. Koneksjonizm
Download
Report
Transcript Rola eksplanacyjna reprezentacji. Koneksjonizm
Marcin Miłkowski
WSTĘP DO KOGNITYWISTYKI
ROLA EKSPLANACYJNA
REPREZENTACJI.
KONEKSJONIZM
O czym będzie mowa
Jak reprezentują sieci
neuropodobne? Cztery wesela…
I pogrzeb: argument Fodora i
Pylyshyna
I osinowy kołek: argument Ramseya
Modele koneksjonistyczne: to żyje!
Cztery koncepcje reprezentacji
koneksjonistycznych
Węzły sieci jako pojęcia
Reprezentacje rozproszone
Sieci jako modele rzeczywistości
Dynamiczna interpretacja sieci
(I to nie wszystko...)
Węzły sieci jako pojęcia
(McClelland 1981)
Dwa gangi: Jets i Sharks, opisane
za pomocą sieci neuropodobnej
Sieć poprawnie rozpoznaje cechy
członków gangu
Krytyka:
zupełnie
niewiarygodne
neurologicznie
Węzły sieci jako pojęcia
Niewiarygodność neurologiczna:
To nawet nie jest teoria komórek
babcinych, bo interpretację znaczenia
węzłów – np. określonego wieku
bandyty – po prostu przypisuje sieci
obserwator.
Sieć sama nie jest w stanie odnieść
swoich stanów (nawet jak będzie w
robocie) np. do 20-letniego bandyty z
bandy Sharks.
Reprezentacje rozproszone (sieci
subsymboliczne)
Sieci rozpoznające pojęcia
„subsymbolicznie” – węzły nie
odpowiadają całym pojęciom ani ich
cechom
Sieci jako
detektory
wzorców
Teoria pojęć jako prototypów
Trzy podstawowe teorie pojęć w
psychologii poznawczej
pojęcia jako teorie, czyli warunki
konieczne i wystarczające;
pojęcia jako prototypy;
pojęcia jako egzemplarze.
Teoria pojęć jako prototypów
E. Rosch (1975):
Co jest dobrym przykładem kategorii
„mebel”?
krzesło,
sofa,
stół...
zdecydowanie rzadziej: poduszka,
telefon, lodówka...
Podobieństwo rodzinne wg
Wittgensteina
W Dociekaniach filozoficznych
twierdzi, że nie można podać
koniecznych i wystarczających
warunków podobieństwa rodzinnego.
Teoria pojęć jako prototypów
Sieci z rozproszonymi
reprezentacjami mogą wykrywać
wzorce w mniejszym lub większym
stopniu – co odpowiada
stopniowalnej kategoryzacji
zgodnie z teorią prototypów.
Łagodna degradacja: elastyczność
kategoryzacji.
Teoria pojęć jako egzemplarzy
Pamiętamy swoisty egzemplarz
(przykład kategorii), traktując go
jako swoisty.
To też daje efekty
stopniowalności.
I też łatwo stworzyć odpowiednią
sieć koneksjonistyczną.
Sieci jako modele rzeczywistości
G. O’Brien i J. Opie (2009): sieci
jako całości są analogicznymi
modelami. Między siecią a
dziedziną poznawczą zachodzi
podobieństwo strukturalne
(drugiego rzędu: zachowane są
relacje między obiektami).
Na tym polega ich skuteczność jako
narzędzi obliczeniowych. Muszą
odzwierciedlać strukturę zadania.
Sieci jako modele procesów
J. Elman (1990): sieć
klasyfikująca angielskie wyrazy w
zdaniu – przewidująca kategorię
następnego wyrazu w świetle
kategorii wyrazów poprzednich
Wykonalne, bo j. angielski ma
stosunkowo sztywny szyk
Sieć Elmana (1991)
Ukryte jednostki
zawierają
wewnętrzne
reprezentacje wejść
Dzięki nim sieć
ma właściwe wyjścia
Analiza wyuczonej sieci
Widać grupowanie
węzłów o podobnych
funkcjach
Metoda analizy
klastrowej
(grupowania) służy
do ujawniania
struktury sieci
I pogrzeb...
Argument Fodora i Pylyshyna
(1988):
Produktywność i systematyczność to
cechy pojęć, które muszą być
uwzględnione w modelach poznania.
Nie obecnie istnieje inne wyjaśnienie
produktywności niż przez odwołanie do
kompozycyjności.
Tylko modele symboliczne są
kompozycyjne.
Produktywność
Wypowiedzi językowe, których jest
potencjalnie nieskończenie wiele,
składają się ze skończonej listy
prostszych jednostek. Te jednostki
składowe łączymy w wypowiedzi.
Znając zasady łączenia
(kompozycjonalności) i jednostki
składowe, możemy zrozumieć i
wypowiedzieć potencjalnie
nieskończoną liczbę zdań.
I pogrzeb... (c.d.)
Argument uogólniony:
Koneksjonizm
albo nie zapewnia kompozycyjności pojęć
i jest nieadekwatny,
albo zapewnia kompozycyjność, ale tylko
dlatego, że jest tylko implementacją
(realizacją) modelu symbolicznego.
Bardzo trudny dylemat!
Skąd problemy z
kompozycyjnością?
Relacje w sieci są zwykle
skojarzeniowe (asocjacyjne).
Skojarzenie jest relacją
symetryczną.
Za pomocą relacji symetrycznej nie da
się opisać kolejności wyrazów w
zdaniu, a kolejność jest kluczowa dla
kompozycyjności.
Jeśli 1 jest skojarzone z 2, to 2
jest skojarzone z 1. Relacji > nie
można opisać relacją skojarzenia.
Skąd problemy z
kompozycyjnością?
Krowy są piękne na Mazowszu.
Nie wszystkie warianty są poprawne:
Są Mazowszu piękne na krowy.
Mazowszu krowy na są piękne.
Mazowszu piękne są na krowy.
Mazowszu na krowy są piękne.
Mazowszu są na krowy piękne.
Mazowszu są na piękne krowy.
…
Próby odpowiedzi
Argument z przybliżenia:
Sieci neuropodobne muszą zapewnić
przybliżoną kompozycyjność, przez co
nie są ściśle sprowadzalne do modeli
symbolicznych.
Np. nowoczesne atraktorowe sieci
impulsowe budowane przez Chrisa
Eliasmitha zawierają tzw. „wskaźniki
semantyczne”, które są
skompresowanymi informacjami o innych
stanach sieci.
Próby odpowiedzi
Reprezentacje wysokiego rzędu
efektywnie kodują reprezentacje
niskopoziomowe w modelu SPAUN (2,5
miliona sztucznych neuronów)
Rola szumu w mózgu biologicznym!
I osinowy kołek
Bill Ramsey (2007): większość tzw.
reprezentacji w koneksjonizmie to
tylko korelaty czynności
percepcyjnych lub motorycznych.
Nie trzeba ich nazywać
reprezentacjami, bo nie mają
żadnej treści, o ile nie są
modelami strukturalnymi
(reprezentacjami analogicznymi).
Zarzut Ramseya
Fotokomórka w kranie reaguje na
obecność dłoni, ale ich nie
reprezentuje.
Podobnie jest ze stanami sieci
neuropodobnych, o ile nie mają
struktury podobnej do zadania.
Większość nie ma.
Eliminacjonizm
(antyreprezentacjonizm)
Podsumowanie
W badaniach nad pojęciami nad
modelami symbolicznymi dominują
modele koneksjonistyczne (różne
wersje prototypów i egzemplarze)
Ale istnieją współcześnie modele
odnoszące się też do motoryki i
percepcji, np. ucieleśnione symulacje
Barsalou czy G. Pezzulo.
Podsumowanie
Dylemat Fodora i Pylyshyna okazał
się bardzo istotny.
Koneksjoniści muszą pokazać,
dlaczego ich sieci cechujące się
kompozycyjnością nie są tylko
realizacjami modeli symbolicznych.
Podsumowanie
Sieci koneksjonistyczne co do
zasady mogą reprezentować na różne
sposoby.
Prawdopodobnie reprezentacje
rozproszone są bardziej wiarygodne
neuronalnie.
Sama korelacja z bodźcem czy reakcją
nie wystarczy, aby nazwać coś
„reprezentacją”.
A co właściwie wystarczy?