Transcript Wiedza
Rozdział Wiedza
Rodzaje wiedzy
Wiedza deklaratywna i proceduralna
Wiedza jawna i niejawna
Organizacja wiedzy:
Reprezentacja wiedzy za pomocą cech
Organizacja wiedzy semantycznej
Organizacja wiedzy proceduralnej: systemy reguł
Organizacja wiedzy w modelach ACT, ACT'" i ACT-R
Nabywanie wiedzy
Nabywanie wiedzy semantycznej
Nabywanie wiedzy proceduralnej
Nabywanie wiedzy niejawnej
Wiedza ekspercka
Kryteria i właściwości wiedzy eksperckiej
Nabywanie wiedzy eksperckiej
Podsumowanie
Badanie pamięci a badanie wiedzy
• Badanie pamięci - dotyczy przede wszystkim
uniwersalnych mechanizmów zapamiętywania,
przechowywania i od-pamiętywania informacji,
natomiast
• badanie wiedzy - odnosi się do sposobu łączenia
zapisów pamięciowych w większe całości,
zależnie od treści wiedzy, kontekstu jej
nabywania, wiedzy nabytej wcześniej, a także
sądów i przekonań.
Rodzaje wiedzy
wiedza "że" v. wiedza "jak"
• Podział wiedzy na deklaratywną i
proceduralną pochodzi od filozofa Gilberta
Ryle'a (1949). Różnicę między nimi Ryle
przedstawił obrazowo w postaci dychotomii:
wiedza "że" v. wiedza "jak".
Wiedza deklaratywna v. wiedza proceduralna
•
Wiedza "że„ (deklaratywna) odnosi
się do danych (faktów),
- kodowanych w pamięci trwałej.
•
Danymi może być wiedza ogólna (np.
budowa atomu) albo wiedza
epizodyczna (np. kolizja na
skrzyżowaniu) czy autobiograficzna
(np. że przed chwilą moja córka
przyszła się przytulić).
•
•
•
Wiedza ta jest łatwa do werbalizacji,
ma bowiem wyraźny komponent
semantyczny.
Wiedza deklaratywna nabywana jest
względnie szybko, nawet po jednej
prezentacji.
Aktywacja wiedz jest „dowolna”
•
wiedza "jak" (proceduralna) odnosi
się do procedur realizacji czynności o
charakterze umysłowym i ruchowym,
- kodowanych w pamięci trwałej
•
Są to zarówno umiejętności
wykonawcze (np. pływanie), jak i
poznawcze (np. używanie języka).
•
Wiedza proceduralna jest z reguły
trudniejsza do werbalizacji niż wiedza
deklaratywna, co wynika z różnic w
sposobie ich reprezentowania w
pamięci.
Wiedza proceduralna wymaga
wielokrotnego, często długotrwałego
powtarzania czynności.
Aktywacja tej wiedzy jest
automatyczna
•
•
Wiedza deklaratywna v. wiedza proceduralna:
kwestia interakcji
• Niekiedy trudno rozstrzygnąć, czy wiedza wywodzi się wyłącznie z pamięci
deklaratywnej, czy też - nieobecna w niej wcześniej - została wywnioskowana z
danych zapisanych w pamięci proceduralnej dzięki aplikacji reguł (procedur), np.
dedukcji.
• Adam i Ewa mają pępek, Prawda czy fałsz?
• Weryfikacja sądu przez:
• 1/Odniesienie do wiedzy deklaratywnej - Wiadomo, że…
• Wynik: brak jawnych danych.
• 2/ Odniesienie do wiedzy deklaratywnej plus procedury wiedza proceduralnareguły wnioskowania – Wiadomo, jak…
• Adama „to Pan Bóg ulepił z prochu ziemi”, a
• Ewę „”Pan Bóg z żebra, , które wyjął z mężczyzny, zbudował niewiastę”, więc
Adam i Ewa nie urodzili się naturalną drogą, więc
• Adam i Ewa nie posiadają pępka, Fałsz
•
•
•
•
Neisser (1967) sprowadza wiedzę do jednej formy reprezentacji, skoro nie można
odróżnić danych bezpośrednio obserwowanych od uzyskanych drogą
wnioskowania.
Teorie ram (Minsky, 1970) czy skryptów (Schank, Abelsohn, 1977; Schank, 1982,
1986) nie wydzielają wiedzę "że" i wiedzę "jak", ponieważ w ich ujęciu całą wiedzę
można sprowadzić do pewnych procedur operujących na podobnym sposobie
reprezentowania rzeczywistości i podobnej strukturze wewnętrznej.
Squire'a (1986) w swym opisie pamięci pozostał przy pojęciu pamięci
deklaratywnej w orygi·nalnym znaczeniu, natomiast wiedzę proceduralną umieścił
w szerszej kategorii pamięci niedeklaratywnej. Ta zawiera nie tylko procedury, ale
również wszelkie inne formy pamięci, które nie mają postaci deklaratywnej, np.
zmiany prawdopodobieństwa reakcji uzyskane w efekcie warunkowania czy
habituacji do stymulacji.
Większość modeli teoretycznych uznaje zasadność podziału wiedzy na
deklaratywną i proceduralną, albo koncentrując się tylko na jednej z nich, albo
próbując połączyć je w ramach jednej teorii.
Wiedza jawna i niejawna
•
•
•
•
Filozof Michael Polanyi (1966) wiedzę ukrytą lub "milczącą" (tacit knowledge)
rozumiał jako taką, o której nie wiemy, że ją posiadamy. Polanyi akcentował więc
przede wszystkim trudności w werbalizacji wiedzy tego rodzaju, typowe dla osób
dysponujących bogatym osobistym doświadczeniem w jakiejś dziedzinie.
Graf i Schacter (1985) natomiast wyróżnili
pamięć jawną (explicit) i
pamięć niejawną (implicit), zwaną również ukrytą lub utajoną.
Dlatego też obecnie funkcjonują dwa pojęcia o zbliżonym znaczeniu:
•
•
•
wiedza ukryta (tacit) używane jest raczej w odniesieniu do wiedzy nabywanej
długotrwale na drodze praktyki i doświadczenia
wiedza niejawna (implicit) jako efekt mimowolnego uczenia się (implicit arning).
Różnice dotyczą więc raczej kontekstu i tradycji badań w pewnym paradygmacie, a
nie istoty rzeczy. Ze względu na swój charakter i sposób funkcjonowania, wiedza
niejawna wydaje się tworzyć jedną kategorię, wymagającą jednego tylko terminu.
Uczenie się mimowolne
Uczenie się sztucznej gramatyki
•
•
•
•
•
•
•
Ten schemat badania procesów mimowolnego uczenia się pochodzi od Arthura Rebera
(1967, 1968).
Typowe zadanie składa się z dwóch faz.
W pierwszej fazie osoby badane uczą się egzemplarzy ciągów literowych, zgodnych z
systemem reguł "sztucznej gramatyki" (zob. ryc. 4.1). Reguły gramatyki określają, jakie ciągi
będą poprawne (gramatyczne), a jakie błędne (niegramatyczne). Osób badanych nie
informuje się jednak, że ciągi prezentowanych im liter zostały utworzone według jakichś
zasad. Dowiadują się o tym po zakończeniu fazy uczenia się. Pierwsza faza składa się
zazwyczaj z prezentacji od kilku do kilkunastu ciągów liter.
W fazie drugiej badanych prosi się o klasyfikowanie prezentowanych im ciągów jako
gramatycznych bądź niegramatycznych. Pokazuje się zarówno ciągi znane z fazy uczenia się,
jak i zupełnie nowe. Ponadto manipuluje się zgodnością ciągów z regułami gramatyki (część
jest gramatyczna, a część nie).
Wyniki:
Już w pierwszych badaniach Reber (1967) wykazał, że badani wykonują zadanie
klasyfikacyjne z poprawnością istotnie wyższą niż poziom przypadku (zazwyczaj w przedziale
pomiędzy 60 a 70%; por. Balas, Żyła, 2002). Nie potrafią jednak zwerbalizować reguł,
którymi się kierują, podejmując decyzję o tym, czy ciąg jest gramatyczny, czy też
niegramatyczny.
Późniejsze badania z użyciem tego pradygmatu wielokrotnie replikowały powyższe wyniki,
również po zmianie rodzaju i poziomu złożoności sztucznych gramatyk (Brooks, 1978;
Dulaney, Carlson, Dewey, 1984; Pothos, Bailey, 2000).
Uczenie się sztucznej gramatyki
Arthur Reber (1967)
Sztuczna gramatyka zastosowana przez Rebera (1967) w badaniach nad efektem uczenia
mimowolnego. Strzałki ilustrują dozwolone przejścia między poszczególnymi stanami. Pętle
oznaczają możliwość kilkakrotnego powtórzenia danego stanu.
Przykładowe ciągi zgodne z gramatyką: TPPTXXVS, VXVPXXVS, TPTS.
Ciągi niezgodne z gramatyką: TPPTXXPS, VPVPXXVS, TXTS.
Uczenie się mimowolne
Uczenie się sekwencji
•
•
•
•
•
•
•
•
•
Zadanie Nissena, Bullemera (1967) polega na reagowaniu na serii bodźców, które pojawiają
się na ekranie zgodnie z ukrytą regułą określającą następstwa bodźców w serii. Np.:
ekran monitora dzieli się na cztery części, a następnie w jednym z czterech pól pokazuje się
się dowolną figurę. Po chwili figura znika, aby za chwilę pojawić się w innym okienku. Osoba
badana ma jak najszybciej dotknąć pola, na którym pojawiła się figura. Badano szybkość i
poprawność reakcji. Przeciętne badanie wymaga wykonania od 1000 do 2000 reakcji.
Wyniki :
wskazują na systematyczne skracanie czasu reakcji w kolejnych seriach prób. Kiedy ukryta
reguła określająca sekwencję pojawiania się ciągów zostaje zmieniona, czasy reakcji istotnie
się wydłużają.
Ponadto wykonani, wydaje się niezależne od poziomu werbalizacji wiedzy o ukrytej regule.
Willingham, Nissen i Bullemer (1989) podzielili osoby na dwie grupy.
Pierwsza grupa była w stanie opisać nie więcej niż trzy kolejne elementy sekwencji, a druga
grupa potrafiła zwerbalizować wszystkie zasady, według których skonstruowano sekwencję
bodźców. Mimo to, obydwie grupy nie różniły się szybkością i poprawnością reagowania
na bodźce zgodne z regułą,
co wydaje się wskazywać na możliwość wykonywania zadania niezależnie od stopnia
uświadomienia wiedzy o regule.
Uczenie się mimowolne
kontrola systemów w symulacji komputerowej
• Kontrola systemów dynamicznych Berry, Broadbendt (1984) polega na
osiągnięciu i utrzymaniu określonego stanu złożonego systemu poprzez
manipulację zmiennymi.
• Systemem może być np. zakład produkcyjny, którego funkcjonowanie
symuluje program przez określony algorytm. Osoba badana ma
zarządzać cukrownią, używając dostępnych jej narzędzi jak poziom
zatrudnienia i płac, planowanie produkcji itd. Dzięki korzystaniu z
informacji zwrotnej, osoby badane uczą się efektywnej kontroli systemu,
systematycznie poprawiając pozie zadania.
• Wyniki:
Badani nie są jednak w stanie zwerbalizować reguł działania systemu
podobnie jak w zadaniu wymagającym uczenia się sekwencji,
ponadto wyniki wykonania zadania nie koreluje z dostępnością jawnej
wiedzy na temat reguł rządzących systemem.
Wiedza niejawna
wiedza abstrakcyjna ( Reber, 1989)
Zdaniem Rebera (1989), podstawowym sposobem nabywania wiedzy niejawnej jest
mimowolne uczenie się, czyli takie, które nie stanowi odpowiedzi na polecenie ani
nie wynika z samodzielnie powziętej intencji (paradygmaty 4.1 i 4.2).
• Pozwala ono na nabywanie wiedzy niejawnej, która jest abstrakcyjna i
reprezentatywna dla struktury stymulacji w otoczeniu.
•
Uczenie się mimowolne pozwala więc na budowanie, dzięki procesowi
indukcji, głębokiej reprezentacji wiedzy, uwzględniającej abstrakcyjne relacje
między elementami środowiska.
•
Proces ten odbywa się bez udziału świadomych strategii uczenia się i bez
zamiaru nabycia wiedzy, a ponadto jest bezwysiłkowy.
•
Przyswojona w ten sposób wiedza niejawna może być użyta, również bez
zdawania sobie z tego sprawy, w procesie rozwiązywania problemów i
podejmowaniu decyzji w sytuacjach mniej lub bardziej podobnych do sytuacji, w
której nastąpiło uczenie się.
•
Chodzi oczywiście o przypadki, gdy reprezentacja nowej sytuacji "pasuje"
strukturalnie do nabytej wcześniej wiedzy.
Wiedza niejawna jako
wiedza konkretna (Brooks, Vokey,1991
•
W przeciwieństwie do Rebera (1989), inni autorzy uważają, że wiedza niejawna nie
ma charakteru abstrakcyjnego, lecz zawiera konkretne egzemplarze lub przypadki
(Brooks, Vokey, 1991; Vokey, Brooks, 1992) albo konkretne fragmenty informacji
(Perruchet, Pacteau, 1990), zapamiętane w trakcie mimowolnego uczenia się.
•
Użycie tej wiedzy w nowym kontekście odbywa się dzięki stwierdzeniu
podobieństwa obu sytuacji. Proces ten wymaga również abstrakcji, ale nie w
momencie kodowania informacji, tylko jej wydobywania. Interesujące wydaje się
także stanowisko pośrednie, dopuszczające współistnienie różnych mechanizmów
nabywania wiedzy niejawnej (Berry, Dienes, 1993; Meulemans, Van der Lindem,
1997).
•
Okazało się, że modele obliczeniowe mimowolnego uczenia się, zawierające
elementy koncepcji abstrakcyjnych i egzemplarz owych, wykazują najlepsze
dopasowanie do danych empirycznych (por. Cleeremans, 1993). Problem ten jest
jednak nadal przedmiotem ożywionej debaty.
Wiedza jawna i niejawna a świadomość
• Wiedza jawna nie zawsze jest dostępna świadomości
np.: wykonywanie testów egzaminacyjnych
• Wiedza niejawna (o której nie wiemy, że wiemy) ale
jest do uświadomienia, kiedy trzeba, potrafimy ją
uświadomić np. reguły ruchu na skrzyżowaniach
• Wiedza niejawna i nie-uświadamialna np. reguły
gramatyczne języka polskiego.
• Wydaje się, że kryterium świadomości lub jej braku nie
jest najlepszą podstawą definiowania wiedzy
niejawnej (Z. Nęcka) .
Wiedza jawna / niejawna
a
wiedza deklaratywna / proceduralna
• Zwykle wiedza deklaratywna jest traktowana jako jawna a wiedza proceduralna
jako niejawna, ale
• Berry i Dienes (1993) dowodzą, że wiedza niejawna jest "mieszanką" wiedzy
deklaratywnej i proceduralnej, a jej cechą wyróżniającą jest przeniesienie transfer,
którego dokonujemy - również w sposób niejawny - na nowe sytuacje.
• Transfer ten dotyczy abstrakcyjnych reguł czy abstrakcyjnej struktury zadania
(wiedza deklaratywna), ale wymaga zastosowania jakiejś formy wnioskowania
(wiedza proceduralna).
• Jeśli nawet tak jest, transfer ten odbywa się tylko w ramach zadań izomorficznych,
czyli identycznych pod względem struktury formalnej, ale wyrażonych w różnej
postaci.
• Davies (1989) twierdzi wręcz, że wiedza niejawna może być w pewnym sensie
izolowana, tj. nie wchodzi w związki z 'wiedzą już posiadaną albo nabywaną
później. Jest więc ograniczony do konkretnej sytuacji. I nie ma mowy o transferze
takim, jak np. w rozumowaniu przez analogię, który wymaga całkiem jawnej
refleksji
Organizacja wiedzy:
(Uwaga: problem organizacji wiedzy nierozerwalnie wiąże się z organizacją pamięci.
Omówione teorie dotyczą różnych rodzajów wiedzy albo różnych jej aspektów. )
Pierwsza grupa teorii reprezentacji wiedzy za pomocą cech - dotyczy składników
wiedzy semantycznej, a więc najmniej szych jej jednostek, najczęściej pojęć.
Kolejna grupa dotyczy relacji semantycznych między elementami, które wyrażają się
głównie w postaci sądów.
Trzecia grupa teorii dotyczy wiedzy proceduralnej.
Ostatnia jest próbą pogodzenia wszystkich trzech ujęć, łączy bowiem wiedzę
deklaratywną (ściślej: semantyczną) i proceduralną w jednym modelu.
Organizacja wiedzy
•
•
•
•
Reprezentacja wiedzy za pomocą cech
Organizacja wiedzy semantycznej
Organizacja wiedzy proceduralnej: systemy reguł
Organizacja wiedzy w modelach ACT, ACT* i ACT-R
Reprezentacja wiedzy za pomocą cech
Eva Clark (1979), Smith i in. (1974), Tversky (1977)
• Definiowanie pojęć (Eva Clark (1979)
•
Koncepcja Clark dotyczy wiedzy „językowej” – pojęć języka naturalnego.
•
Podstawowym pojęciem tej reprezentacji wiedzy jest pojęcie cechy (feature). Cecha jest symbolicznym i
dyskretnym elementem umysłowej reprezentacji wiedzy o wyraźnie określonych granicach.
Obiekt jest reprezentowana w postaci zestawu cech oraz relacji, które między nimi zachodzą. Cechy są
odrębne ale mogą skorelowane, co przyzwala na istnienie bardziej albo mniej „typowych” obiektów.
Np..
człowiek
zwierzę (+)
człowiek łysy
zwierzę (+)
dwunożny (+)
dwunożny (+)
inteligentny (+)
inteligentny (+)
włosy (+)
włosy ( - )
Pojęcie zawiera cechy pierwotne (primitive) i cechy dodatkowe, te nawarstwiają się na tych pierwszych.
Definiowanie znaczenia, wg Clark wymaga formowanie zbioru cech unikatowych dla danego pojęcia.
Wprowadziła pojęcie cechy semantycznej(semantic feature), to cechy pierwotne użyte do różnicowania
znaczeń pojęć. Tu posiadanie albo nie włosów definiuje pojęcie (łysy).
•
•
•
•
• Porównywanie pojęć Smith i in. (1974)
Smith i współpracownicy (1974) wyróżnili dwa rodzaje cech w reprezentacji
znaczenia:
• rdzenne (core) i
• charakterystyczne.
Cechy rdzenne to takie, które składają się na "tożsamość" obiektu; można
powiedzieć, że są to cechy definicyjne. Natomiast cechy charakterystyczne są
typowe dla obiektu.
Autorzy zaproponowali model dwufazowego porównywania cech.
• Pierwsza, wczesna faza polega na porównaniu zarówno cech rdzennych, jak i
charakterystycznych. Jeśli obiekty są bardzo podobne albo bardzo niepodobne, to
efekt porównania jest szybki i - odpowiednio - pozytywny albo negatywny.
• Jeśli jednak obiekty nie są ani bardzo podobne, ani bardzo różne, porównywanie
przechodzi do drugiej późnej fazy, w której porównywane są wyłącznie cechy
rdzenne.
Jeśli stwierdzone zostanie ich podobieństwo, to następuje reakcja pozytywna, która
jednak wymaga więcej czasu, jest bowiem efektem udziału obu faz.
W przeciwnym razie, czyli jeśli cechy rdzenne okażą się różne dla porównywanych
obiektów, emitowana jest reakcja negatywna, również stosunkowo powolna.
•
•
•
Porównywanie pojęć Tversky (1977)
Autor ten w odmienny sposób wyjaśniał proces porównywania znaczeń słów. Zaproponował mechanizm,
który nie wymaga dodatkowego założenia o różnych typach cech, jak u Smitha i współpracowników.
Mechanizm ten polega na porównaniu zbioru cech definiujących pojęcie zgodnie z poniższą formalizacją:
s (a, b) = f(A B) - f(A - B) - f(B - A) ,
gdzie s(a, b) to podobieństwo (s- similarity ) znaczeń słów a i b;
A i B - zestaw cech reprezentujący a i b;
f(X) - funkcja wagi cechy w zbiorze;
, i - stałe wagi zestawu.
•
•
•
•
Podobieństwo jest tym większe, im więcej para znaczeń posiada cech wspólnych (A B) i im mniej
dystynktywnych (A – B) i (B - A).
Wyniki:
Tversky stwierdził korelację pozytywną oceny stopnia podobieństwa par znaczeń z liczbą cech
wspólnych, zakładanych w modelach reprezentacji za pomocą cech, i korelację negatywną z liczbą cech
różnicujących je.
Model Tversky'ego dobrze tłumaczy pewne psychologiczne prawidłowości relacji podobieństwa, np. brak
symetryczności i przechodniości. Relacja podobieństwa jest niesymetryczna, bo z faktu, że a jest
podobne do b, nie wynika, że b jest podobne do a.
Na przykład, często dostrzegamy podobieństwo dziecka do rodzica, ale rzadziej - podobieństwo rodzica
do dziecka. Co więcej, jeżeli a jest podobne do b i b podobne do c, to nieprawda, że a jest podobne do
c.
Tłumaczy efekt kontekstu, bo ten wpływa na zmianę wag.
Zależność podobieństwa od kontekstu
KRYTYKA MODELI
OPARTYCH O LISTY CECH
Modele reprezentacji za pomocą cech mają jednak pewne
ograniczenia.
Po pierwsze, przyjmują założenie o niezależności cech i
definiowanych przez nie obiektów. Jedyne relacje między
obiektami, przewidywane przez te modele, wynikają z
podobieństwa cech obiektów. Wiadomo, że wiedza ma
pewną strukturę, opartą na relacjach, których nie da się
sprowadzić do podobieństwa.
Po drugie, do dziś nie ma takiego modelu, który w sposób
wiarygodny ustaliłby listę cech składających się na
reprezentacje werbalne.
Organizacja wiedzy semantycznej
•
Wiedza semantyczna jest zorganizowana na kilku poziomach odpowiadających strukturze języka. Wyróżnia się
poziom pojęć, sądów oraz ich układów. Te dane dotyczą głównie poziomu sądów, w których wyrażają się relacje
między pojęciami
•
Collins i Quillian (1969) zaproponowali koncepcję struktury wiedzy semantycznej opartej na dwóch jej
właściwościach: budowie sieciowej i hierarchiczności.
Wiedza zawarta w pamięci semantycznej ma postać sieci, w której węzłom odpowiadają pojęcia, a połączeniom
między nimi - ich wzajemne relacje.
Sieć jest zorganizowana hierarchicznie, co oznacza, że pojęcia bardziej ogólne znajdują się wyżej w hierarchii,
przy czym odległość pojęć w sieci związana jest ściśle z podobieństwem ich znaczenia Pojęcia o wyższym
stopniu podobieństwa są reprezentowane przez węzły znajdujące się blisko w sieci i związane są pewną relacją
(chociaż nie zawsze bezpośrednio, jak np. "zwierzę" i "kanarek"); pojęcia zupełnie różne od siebie będą
reprezentowane przez odległe i niepowiązane ze sobą węzły. Pojedyncze relacje między pojęciami mają
charakter binarny, czyli łączą tylko dwa węzły.
•
•
•
•
•
Zdanie: "łosoś i rekin mają skrzela", odnoszące się do trzech węzłów sieci, można rozbić na dwa prostsze zdania:
"łosoś ma skrzela" i "rekin ma skrzela".
W podstawowej wersji model zakłada dwa rodzaje relacji między pojęciami. Pierwszy to relacja przynależności
do klasy, np. łosoś jest rybą. Tego typu relacje obejmują pojęcia z dwóch różnych poziomów hierarchii sieci semantycznej.
Drugi to relacja predykatywna, czyli pełniąca funkcję orzeczenia, Relacja predykatywna zawiera wiedzę o
właściwościach obiektu, np. "łosoś jest drapieżnikiem" albo "struś chowa głowę w piasek". Tego typu relacje
kodowane są w sieci na tym samym poziomie ogólności, na którym w hierarchii znajduje się dany obiekt.
Fragment sieci semantycznej
Collins i Quillian (1969)
cd.
Collins i Quillian (1969)
• Badania Collinsa i Quilliana (1969) wydawały potwierdzać tego
typu organizację wiedzy Okazało się, że
• Wyniki:
• im większa odległość w sieci pomiędzy danym pojęciem a jakimś
jego predykatem (więcej węzłów na drodze między nimi), tym
dłuższy jest czas dotarcia do tej informacji.
• Na przykład szybciej wydobywamy informację, że <kanarek
śpiewa>, niż tę, że <kanarek ma pióra>. Najdłużej trwa wydobycie
informacji, że <kanarek oddycha>.
• Predykcje te potwierdzono w wielu eksperymentach.
krytyka
• Badania Collinsa i Quilliana (1969) przyniosły wiele danych
potwierdzających model sieci hierarchicznej .
• Jednak okazało się, że czas dostępu do informacji w danym węźle
nie jest liniową funkcją odległości do tego węzła w sieci.
• Rips, Shoben i Smith (1973) wykryli, że stwierdzenie, iż "kot jest
zwierzęciem", jest szybciej weryfikowane, niż to, że "kot jest
ssakiem". Model zakładał, że jest przeciwnie.
• Conrad (1972) wykryła, że stwierdzenie, iż "kanarek jest ptakiem",
jest szybciej weryfikowane, niż to, że "struś jest ptakiem", Model
sieci semantycznej nie przewidywał tego typu różnic , bo
hipotetyczna odległość pojęć "kanarek" i "struś" od pojęcia "ptak"
jest w nim identyczna.
• Doprowadziło to do modyfikacji – modelu Collins i Loftus (1975)
uwzględniającego siłę skojarzeń między węzłami.
Collins i Loftus (1975)
• Collins i Loftus (1975) utrzymali założenie o sieciowej
strukturze wiedzy, lecz osłabili założenie o jej
hierarchicznej organizacji.
• Za podstawowy czynnik decydujący o połączeniach
między elementami wiedzy uznali siłę związku
skojarzeniowego, który je łączy.
• Dlatego bardziej typowe obiekty są szybciej
identyfikowane jako należące do określonej kategorii
(np. <wróbel to ptak> v. <struś to ptak>,
• Również ze względu na większą siłę skojarzeniową
połączenie <kot to zwierzę> może być mocniejsze niż
<kot to ssak>.
cd.
• Collins i Loftus (1975) dokonali uszczegółowienia sposobu reprezentowania
pojedynczych elementów wiedzy, zapożyczając pewne elementy modelu opartego
na cechach.
• Struktura wiedzy nadal ma postać sieci, w której węzłom odpowiadają pojęcia,
podczas gdy ich etykiety werbalne są reprezentowane w postaci odrębnej struktury,
zwanej wewnętrznym leksykonem. Z kolei węzły połączone są z sobą relacjami o
charakterze semantycznym
• Collins i Loftus wzbogacili też listę relacji . Dołączyli, obok relacji przynależności do
kategorii i relacji predykatywnej, relacjię"bycia przedstawicielem kategorii„.
• Jest to połączenie odwrotne względem relacji przynależności do kategorii, <mebel
ma za egzemplarz krzesło> versus . <krzesło jest to mebel>. Siła skojarzeń zmieniać
się może zależnie od kierunku.
• Leksykon zorganizowany jest według fonetycznego i semantycznego podobieństwa
nazw pojęć, które są połączone z jednym lub większą liczbą odpowiadających tym
nazwom węzłów w sieci.
• Im więcej połączeń między węzłami, tym większa siła skojarzeniowa danego
związku.
• Większa liczba połączeń jest możliwa dzięki bogatszej "liście" predykatów. Większa
zgodność tych "list" w obrębie dwóch pojęć sprawia, że więcej jest między nimi
połączeń, a ponadto że sposób ich łączenia może być bardzo różnorodny.
Collins i Loftus (1975)
MEBLE
Stół
krzesło
Na przykład pojęcia "stół" i "krzesło" są silnie powiązane, być może dzięki liście wspólnych
predykatów.
Sieć: rozprzestrzenianie się aktywacji
• Proces przywoływania wiedzy odbywa się dzięki mechanizmowi rozprzeniającej
się aktywacji.
• Wzbudzenie jednego pojęcia powoduje, że aktywacja rozchodzi się w
sieci jednocześnie w wielu kierunkach.
• Kierunki rozprzestrzeniania są wyznaczone przez strukturę połączeń w
sieci:
• Aktywacja słabnie wraz oddalaniem się od pojęcia wyjściowego, ale też
zależy od liczby i siły połączeń między węzłami.
• Wielkość aktywacji podlega ograniczeniom, co oznacza, że siła
wzbudzenia jest odwrotnie proporcjonalna do liczby wzbudzonych
węzłów.
• Kiedy połączenia są słabe, pobudzenie będzie szybko zanikać wraz z
oddalaniem pojęcia wyjściowego.
• Jeśli dane pojęcie ma bogatą strukturę połączeń, mechanizm
rozprzestrzeniającej się aktywacji może wzbudzić wiele innych węzłów (chyba
że niektóre połączenia będą aktywnie hamowane).
Sieć:
Rozprzestrzenianie się aktywacji
kolor
nie jest to ?
owoc
to
jest
jest
nie jest to ?
to
to
Krytyka
Woods (1975)
• Woods (1975) podkreśla, że nie ma empirycznego sposobu na oddzielenie
informacji reprezentowanej w postaci węzłów i w postaci relacji. To poważny zarzut.
(E. Nęcka)
• Nie wiadomo także, jakie są cechy dystynktywne różnego typu relacji między
węzłami w sieci. Nie wiadomo, jaki jest swoisty dla każdej relacji mechanizm
rozprzestrzeniania się aktywacji.
• Nie wiadomo, czy aktywacja rozprzestrzenia się tak samo w przypadku, gdy węzły
łączą się na zasadzie przynależności kategorialnej (stół-mebel), jak i w przypadku,
gdy łączy się ona na zasadzie skojarzenia (stół-krzesło).
• Dobrze wyjaśnia zjawiska oparte o skojarzenia, związane ze specyficzną treścią i
kontekstem nabywanej wiedzy.
• Mechanizm rozprzestrzeniającej się aktywacji nie wyjaśnia udziału innych operacji
poznawczych, jak rozumowanie dedukcyjne.
• Słabo radzi sobie również z wyjaśnieniem , jak korzystamy z wiedzy, np. rozwiązując
złożone problemy.
• Te kwestie rozwiązują teorie ACT Andersona
Organizacja wiedzy proceduralnej:
systemy reguł
• Reprezentacja tego typu pozwala na tworzenie
procedur działania.
• Każda reguła składa się z warunku wyznaczającego
zbiór właściwości, które muszą być spełnione, aby
uruchomić daną czynność, i samej czynności, zbioru
produkcji.
• Reguła: jeżeli (warunek), to (czynność)
np. .:
jeżeli ( światło zielone), to ((zwolnienie hamulca), potem (nacisk na pedał gazu))
Właściwości systemów reguł
• Stosowaniem reguł zarządza struktura kontrolna
• Reguły podlegają indeksacji, aby je odróżnić, aby
przypisać warunki.
• Kiedy możliwe jest zastosowanie kilku reguł, struktura
kontrolna dokonuje wyboru.
• Preferencja jest przypisywana regule bardziej
szczegółowej ( zasada specyficzności reguł)
• Struktura kontrolna rejestruje użycie reguł, aby nie
powtarzać, po zastosowaniu ( zasada niepowtarzania
reguł)
Przykład ( Z. Nęcka)
Jeżeli chcę napisać na komputerze literę "A", to
• :
• Przyjmijmy założenie, że jesteśmy w trakcie pisania jakiegoś tekstu.
• Jeżeli chcę napisać na komputerze literę "A", to:
• -> (1)warunek sprawdzam, czy kursor jest na właściwym miejscu ekranu,
jeżeli "tak", to działanie (2);
• jeżeli "nie", to działanie: uruchamiam regułę "zmiany lokalizacji kursora", a
potem działanie (2);
• -> (2) warunek sprawdzam, czy włączony jest "Caps Lock"
• jeżeli "tak", to działanie (3);
• jeżeli „nie”, to działanie uruchamiam regułę wciśnięcia klawisza "Shift"
(która sama w sobie jest na tyle złożoną czynnością wykonawczą, że może
posiadać osobną regułę), a potem działanie (3);
• -> (3) działanie wciśnięcia klawisza "a", a potem krok (4);
• ---> (4) warunek sprawdzam, czy na ekranie pojawiła się właściwa litera
• jeżeli "tak", to STOP
• jeżeli "nie", to działanie: wciśnięcia klawisza "Backspace" wracam do
punktu (2).
Przykład ( Z. Nęcka)
Jeżeli chcę napisać na komputerze literę "A", to:
inna reprezentacja procedury:
-> (1)warunek sprawdzam, czy kursor jest na właściwym
miejscu ekranu,
jeżeli "tak", to działanie (2);
•
jeżeli "nie", to działanie: uruchamiam regułę "zmiany
lokalizacji kursora", a potem działanie (2);
•
jeżeli „nie”, to działanie uruchamiam regułę wciśnięcia
klawisza "Shift" (która sama w sobie jest na tyle
złożoną czynnością wykonawczą, że może posiadać
osobną regułę), a potem działanie (3);
•
jeżeli "nie", to działanie: wciśnięcia klawisza
"Backspace" wracam do punktu (2).
-> (2) warunek sprawdzam, czy włączony jest "Caps Lock"
jeżeli "tak", to działanie (3);
-> (3) działanie wciśnięcia klawisza "a", a potem krok (4);
---> (4) warunek sprawdzam, czy na ekranie pojawiła się
właściwa litera
jeżeli "tak", to STOP
Organizacja wiedzy w modelach ACT,
ACT* i ACT-R
• ACT
• Anderson przyjął eklektyczny model
reprezentacji informacji: wiedza w ACT może
przyjąć postać
• sądów
• obrazów
• sekwencji zdarzeń
Relacja między pamięcią deklaratwną i proceduralną
Modele Andersona
ACT: wiedza deklaratywna
• O charakterze bieżącego przetwarzania decyduje
• struktura wiedzy deklaratywnej i
• mechanizm aktywacji
• Strukturę wiedza deklaratywnej tworzą to (chunks- kęsy) złożone wskazówki
(pointer) i sieci węzłów reprezentujących dane.
• Połączenia między węzłami posiadają różną siłę skojarzeniową.
• Siła skojarzeniowa zależy od liczby poprzednich przywołań.
• Do aktywacji węzłów dochodzi poprzez bodźce ze środowiska, przywołaniu
pamięciowemu, a także przez rozprzestrzenianie się aktywacji sieci.
• Aktywację ogranicza pojemność pamięci roboczej i czasem: aktywna może być
tylko niewielka liczba węzłów przez krótki czas.
• Aktywacja decyduje o zakresie wiedzy dostępnej bieżącemu przetwarzaniu
ACT: wiedza proceduralna
• Wiedza proceduralna reprezentowana jest w
postaci reguł aplikowanych do wiedzy
deklaratywnej, a także w postaci informacji
zawartych w tzw. buforach wyspecjalizowanych
modułów: wzrokowego, słuchowego i
motorycznego (Anderson, Matessa, Douglass,
1995).
• Istotne jest to, że proces ten przebiega, według
Andersona, jawnych deklaracji do niejawnych
procedur
weryfikacji modelu ACT.
• Skupmy się na tych, które dotyczyły problemu struktury wiedzy.
• Empirycznie potwierdzono podstawowy dla modelu związek
częstości użycia wiedzy z jej późniejszą dostępnością. Częściej
przywoływana informacja jest łatwiej i szybciej dostępna, co
zgadza się z hipotezą zróżnicowanej siły połączeń w sieci
semantycznej (por. Anderson, 1976).
• ACT wyjaśnia również zjawisko interferencji, kiedy to jedna z
konkurencyjnych informacji pozostaje niedostępna.
W warunku presji czasu dobyte zostają tylko najsilniej wzbudzone
pojęcia, dzięki silnym asocjacjom istniejącym w sieci (np. stół krzesło). Inne natomiast ", które mogą być bardziej adekwatne do
zadania, nie uzyskają odpowiedniego poziomu wzbudzenia.
Pozostaną więc niedostępne.
Weryfikacja modelu ACT Andersona
Lewis i Anderson (1976)
Lewis i Anderson (1976) potwierdzili podstawowe predykcje modelu ACT.
W swoich badaniach użyli specyficznych zadań leksykalnych.
•
• W pierwszej fazie eksperymentu osobom badanym prezentowano serię
zdań, przy czym większość z nich, związana z jednym obiektem ( Napoleon
Bonaparte), miała wzbudzać szerszy wachlarz odpowiedniego węzła sieci. W
tej fazie eksperymentu inne obiekty były wzbudzane słabiej (George
Washington) albo wcale (Fidel Castro), przy czym prezentowane zdania były
fałszywe.
• W fazie drugiej - testowej - prezentowano zdania prawdziwe albo fałszywe.
Zadanie osób badanych polegało na weryfikacji prawdziwości zdań.
• Wyniki:
Okazało się, że czas weryfikacji zdań związanych z danym obiektem był
dłuższy w przypadku postaci, którym przypisano więcej zdań w fazie
pierwszej.
Fałszywe zdania pochodzące z tej fazy wywołały silniejszą interferencję,
powodując wydłużenie czasu dostępu do utrwalonej wiedzy semantycznej z
zakresu historii.
Zadanie leksykalne użyte w badaniach
Lewis i Andersona (1976).
Opis w tekście. Wartość podana w nawiasie obok zdań użytych w drugiej fazie eksperymentu oznacza
liczbę zdań, które dotyczyły danej osoby w pierwszej fazie.
•
Przykłady zdań fałszywych użytych w pierwszej fazie eksperymentu:
•
•
•
•
•
George Washington napisał Przygody Tomka Sawyera.
Napoleon Bonapatre pochodził z Indii.
Napoleon Bonaparte był piosenkarzem.
Napoleon Bonaparte był senatorem liberałów.
Napoleon Bonaparte posiadał ranczo.
•
Przykłady zdań użytych w drugiej fazie eksperymentu:
•
•
•
•
Zdania prawdziwe
Fidel Castro jest Kubańczykiem. (0)
George Washington przeprawił się przez rzekę Delaware. (1)
Napoleon Bonaparte był cesarzem. (4)
•
•
•
•
•
•
•
Zdania fałszywe (stare)
George Washington napisał Przygody Tomka Sawyera. (1)
Napoleon Bonaparte pochodził z Indii. (4)
Zdania fałszywe nowe
Fidel Castro był politykiem z Teksasu. (0)
George Washington jest pływakiem. (1)
Napoleon Bonaparte był komikiem. (4)
Weryfikacja modelu ACT Andersona
Reder i Ross (1983)
• Problemem weryfikacji zajęli się również Reder i Ross (1983).
• Plan eksperymentalny ich badań był podobny jak u Lewisa i Andersona, z
tym że w fazie uczenia się badani otrzymywali zdania o nieznanych im
postaciach. Faza testowa mogła przyjąć dwie formy.
• Pierwsza polegała na rozpoznaniu, czy dane zdanie było już wcześniej
prezentowane. Czas reakcji wzrastał wraz z liczbą zdań o danej osobie,
prezentowanych w fazie uczenia się. ( Zreplikowano więc rezultaty uzyskane
przez Lewisa i Andersona.)
• Druga forma testu polegała na ocenie, jakie jest - w świetle posiadanej
wiedzy pochodzącej z wnioskowania ze zdań eksponowanych w fazie
uczenia się - prawdopodobieństwo trafności innych zdań o tej osobie.
• (Innymi słowy, dysponując pewną wiedzą o fikcyjnej osobie, należało
stwierdzić, na ile tezy zawarte w zdaniach prezentowanych w teście wydają
się zasadne.)
• Wyniki:
• W tym warunku uzyskano efekt przeciwny: im więcej zdań zaprezentowano
o danej postaci, tym szybsza była odpowiedź w fazie testowej.
Interpretacja?
Nabywanie wiedzy
Nabywanie wiedzy semantycznej
Nabywanie wiedzy proceduralnej
Nabywanie wiedzy niejawnej
Nabywanie wiedzy semantycznej
Nabywanie wiedzy proceduralnej
Nabywanie wiedzy niejawnej
Wiedza ekspertów
Kryteria i właściwości wiedzy eksperckiej
Nabywanie wiedzy eksperckiej
Kryteria i właściwości wiedzy
ekspertów
Nabywanie wiedzy ekspertów