Predykcyjna teoria umysłu
Download
Report
Transcript Predykcyjna teoria umysłu
Dr hab. Marcin Miłkowski, IFiS PAN
PREDYKCYJNA TEORIA UMYSŁU
Czego można się spodziewać?
Umysł jako maszyna predykcyjna
Hierarchiczne wnioskowania bayesowskie
Problemy koncepcji predykcyjnej
Mózg bayesowski
Karl Friston (ur. 1959):
Hierarchiczne kodowanie
predykcyjne to aproksymacja (?) trudnego
obliczeniowo wnioskowania bayesowskiego.
Mózg minimalizuje tzw. swobodną energię, czyli
zaskoczenie nowymi informacjami.
Ogólna teoria myślenia i działania.
Teoria hierarchicznego
kodowania predykcyjnego
Mózgi przewidują przyczyny aktualnych
wejść zmysłowych i minimalizują błędy takich
przewidywań:
zmieniając przewidywania na temat wejść
zmysłowych lub
zmieniając świat.
Jednolita teoria percepcji i działania (A. Clark
2013)
Przewidywania
probabilistyczne
Wewnętrzne modele generują
przewidywania.
Przewidywania te odbiegają od
rzeczywistości.
Zadaniem umysłu jest minimalizacja tej
rozbieżności przez zmianę
prawdopodobieństw w modelu lub
rzeczywistości.
Umysł = narzędzie minimalizacji błędu
przewidywania
Przykład: model
wyprzedzający ruchu
Martin J. Pickering, Andy Clark, Getting ahead: forward models and their place in
cognitive architecture, „Trends in Cognitive Sciences”, t. 18, nr 9, 2014, s. 451 - 456
Kodowanie predykcyjne
W informatyce stosowane do kompresji
obrazu: koduje się tylko różnice w stosunku
do poprzedniej klatki; co do reszty zakłada
się, że jest taka sama.
Innymi słowy, liczy się tylko różnica wobec
tego, co można przewidzieć.
W dziedzinie percepcji: model przewiduje, co
będzie widać. Różnice w stosunku do
przewidywań służą do zmiany modelu.
Kodowanie predykcyjne
Tradycyjne modele percepcji (np. Marra) są
oddolne (bottom-up), tj. zakładają budowanie
złożonej reprezentacji z bodźców
zmysłowych.
Kodowanie predykcyjne polega raczej na
tworzeniu przewidywania, które obejmuje
m.in. pobudzenia receptorów – i
sprawdzaniu, czy się ono zgadza.
W tym sensie jest to model odgórny (topdown).
Powrót do Kanta?
I. Kant (1724-1804): koncepcja
poznania zmysłowego jako
opartego na pojęciach i
naoczności.
Myśli bez naoczności (zmysłów) byłyby puste,
a naoczności bez pojęć – ślepe.
W wersji neokantowskiej: nie poznajemy
samego świata, tylko naszą ideę świata, którą
tylko modyfikujemy w razie oporu.
Problem z kantyzmem
Kant argumentował, że poznać możemy tylko
zjawiska, a nie rzeczy same w sobie.
Ale podstawowy argument na rzecz jego stanowiska
jest niepoprawny formalnie.
Możemy poznać rzeczy tylko takie, jakie się nam jawią.
Zatem nie możemy poznać ich takimi, jakie są same w
sobie.
Tylko że drugie zdanie nie wynika z pierwszego.
Największym problemem kantyzmu było
powiedzenie, co jest przyczyną pobudzeń
zmysłowych. Bo nie mogły to być rzeczy same w
sobie…
Aktywne wnioskowanie
Kodowanie predykcyjne regulujące działanie:
modele generują przewidywania dotyczące
reakcji priopriocepcyjnej.
Rozbieżności wobec przewidywań eliminuje
się przez realizację działania, nie aktualizację
modelu.
Dlatego przewidywania służą jako instrukcje
motoryczne.
Minimalizacja wolnej energii
W najogólniejszym sformułowaniu teorii
predykcyjnej (u Fristona) zadaniem układu
samoorganizującego jest minimalizacja wolnej
energii.
Wolna energia
w sensie
statystycznoinformacyjnym:
rozbieżność
między informacją
w systemie
a faktami
Minimalizacja wolnej energii
Im lepiej układ dopasowany do otoczenia,
tym mniejszą ma wolną energię.
Dobre modele pozwalają zachować strukturę
i organizację, a więc też pozwalają unikać
dużego wzrostu entropii [też w sensie
informacyjnym].
Ta zasada dotyczy nie tylko mózgu, ale
całego organizmu, łącznie z jego fizycznym
kształtem.
Hierarchiczne wnioskowania
bayesowskie
Aktualizacja prawdopodobieństw uprzednich
(priors) dla wnioskowań bayesowskich na
podstawie świadectw empirycznych to
problem NP-zupełny.
Innymi słowy, wymaga czasu większego niż
wykładniczy, czyli nie jest to algorytm
praktycznie obliczalny.
Dlatego „płaskie” modele bayesowskie
byłyby zupełnie nierealistyczne w stosunku
do mózgu.
Hierarchiczne modele
bayesowskie
NP-zupełność dotyczy złożoności
obliczeniowej w pesymistycznym przypadku.
Co więcej, dla mniejszego zbioru danych
wejściowych problemy NP-zupełne mogą być
praktycznie obliczalne.
Jeśli więc aktualizuje się pojedyncze
prawdopodobieństwo, to nie ma problemu.
I temu ma służyć hierarchia modeli (idea
Karla Fristona).
Hierarchiczne modele
bayesowskie
Model wyższego poziomu generuje
przewidywania dotyczące wyników modelu
niższego poziomu.
Model niższego poziomu przesyła do modelu
wyższego poziomu tylko informacje o
błędzie.
W całej hierarchii przesyłane są tylko takie
informacje o błędzie (czyli tzw. zaskoczeniu).
Umysł probabilistyczny
Modele generatywne mają postać rozkładów
prawdopodobieństw, a więc ich natura jest
statystyczna.
Dotyczy to także układu nerwowego, który
ma wg tej teorii funkcje wnioskowania
statystycznego.
Ale dostępne świadectwa nie dotyczą
mikrostruktury układu nerwowego…
Zastosowania koncepcji
Istnieją modele dotyczące percepcji
wzrokowej, w tym rywalizacji dwuocznej,
złudzeń; urojeń i halucynacji; neuronów
lustrzanych; snów; psychoz; wyboru
działania; histerii…
Większość ma jednak naturę bardzo ogólnych
szkiców wnioskowania statystycznego.
Problemy koncepcji
predykcyjnej
Dwa podstawowe zarzuty wobec koncepcji
Clarka i Fristona:
Problem ciemnego pokoju
Problem ciągłego bólu
Oraz zarzuty mechanicystów:
Bayesizm jest biologicznie niewiarygodny.
Bayesizm jest nieobalalny i nie ma treści
empirycznej.
Problem ciemnego pokoju
Błędy można równie dobrze zminimalizować,
po prostu minimalizując bodźce zmysłowe.
Wystarczy przejść do pustego, ciemnego i
cichego pokoju.
Tam będzie prawie brak bodźców.
Ale tak umysł nie działa!
Problem ciemnego pokoju
Odpowiedź predykcjonistów:
Nasz organizm (fenotyp) ma wrodzone wartości
prawdopodobieństw uprzednich, zgodnie z
którymi brak pobudzeń jest skrajnie mało
prawdopodobny (maksymalnie zaskakujący).
Dlatego organizmy nie starają się eliminować
pobudzeń zmysłowych, bo to jest mało
prawdopodobne.
Ale czy to nie jest ad hoc?
Przecież czasem chcemy spać lub uciec!
Problem ciągłego bólu
Wzmocniony problem ciemnego pokoju: jeśli
postawić szczura na siatce, która razi go
prądem, to czemu zeskakuje?
Przecież po chwili powinien przewidzieć, że
porażenie będzie trwało.
Nie można twierdzić, że chcemy unikać bólu,
bo to wrodzone.
Ostre potrawy bywają smaczne.
Wysiłek sportowy bywa bolesny.
Ogólna postać problemu
Dlaczego organizm ma zmieniać swój stan,
który jest dla niego szkodliwy?
Dlaczego ma poszukiwać interesujące
bodźce?
Innymi słowy, dlaczego raz ma zmieniać
rozkład prawdopodobieństw w modelu, a raz
tylko świat?
Bayesizm jest biologicznie
niewiarygodny.
Nie wszystkie części mózgu są hierarchicznie
zbudowane (kora to nie wszystko!):
Są neurony „milczące”, które prawie nigdy nie
odpalają.
Istnieją neurony oscylujące (modulujące resztę).
Istnieją neuromodulatory.
Istnieje ośrodek limbiczny (i procesy
emocjonalne).
Istnieją też heterarchie: bardziej złożone układy
połączeń.
Kłopot z modelami
predykcyjnymi
Większość modeli predykcyjnych istnieje
tylko w postaci ogólnikowych równań. Nie
można więc łatwo sprawdzić, czy
rzeczywiście odpowiadają danym
eksperymentalnym.
Brak szczegółowych hipotez dotyczących
architektury umysłu. Same ogólniki.
Bayesizm jest nieobalalny.
Bowers i Davis (2012): modele bayesowskie
zawsze dostosują się do danych.
Arbitralnie dobiera się po prostu wartości
prawdopodobieństw. Zawsze jakieś będą pasować.
Brak bezpośredniego świadectwa neurologicznego na
niskim poziomie.
Teorie predykcyjne opierają się na racjonalnej analizie,
a nie na eksperymentalnym badaniu mechanizmów.
Bowers, Jeffrey S i Colin J Davis. 2012. Bayesian just-so stories in
psychology and neuroscience. „Psychological bulletin” 138 (3): 389–414.
doi:10.1037/a0026450.
Podsumowanie
Predykcyjne ujęcie umysłu to propozycja
jednolitej teorii percepcji i działania, na wielu
poziomach organizacji mózgu-umysłu.
Można je postrzegać jako pewien rodzaj
neokantowskiej wizji poznania, ale opartej na
współczesnej fizyce, neurobiologii i
psychologii.
Podsumowanie
Brak jednak bezpośrednich świadectw
neuropsychologicznych, a można mieć
wątpliwości, czy w ogóle tak złożony układ
jak mózg może mieć tak prostą jednolitą
teorię.
Największe wątpliwości nie dotyczą tego, czy
istnieją modele generatywne, tylko czy sama
zasada aktywnego wnioskowania jest
informatywna.
Dalsze lektury
Clark, Andy. 2013. Whatever next?
Predictive brains, situated agents, and the
future of cognitive science. „The
Behavioral and brain sciences” 36 (3):
181–204.
doi:10.1017/S0140525X12000477.
Hohwy, Jakob. 2013. The predictive mind.
New York, Oxford University Press.
Jones, Matt i Bradley C. Love. 2011.
Bayesian Fundamentalism or
Enlightenment? On the explanatory status
and theoretical contributions of Bayesian
models of cognition. „Behavioral and
Brain Sciences” 34 (04): 169–188.
doi:10.1017/S0140525X10003134.