uczenie się poprzez warunkowanie sprawcze

Download Report

Transcript uczenie się poprzez warunkowanie sprawcze

UCZENIE SIĘ POPRZEZ
WARUNKOWANIE
PROBLEMATYKA



Uczenie się poprzez warunkowanie - analiza teorii
behawiorystycznych (koneksjonistycznych) przyjmujących, że
podstawą uczenia się są różnego typu połączenia między
bodźcami i reakcjami- warunkowanie klasyczne a sprawcze;
praktyczne implikacje teorii warunkowania– warunkowanie
klasyczne w życiu codziennym i w klasie szkolnej; dydaktyka w
koncepcji behawiorystycznej; magia pochwał i zasady stosowania
kar, w kontekście pracy dydaktycznej.
Słowa- klucze: behawioryzm, warunkowanie klasyczne, bodziec
warunkowy, bodziec bezwarunkowy, generalizacja, wygaszanie,
typy warunkowania: o stałych proporcjach, o zmiennych
proporcjach, o stałych odstępach czasowych o zmiennych
odstępach czasowych, metoda kolejnych przybliżeń, zasada
Premacka; warunkowanie sprawcze, wzmocnienie pozytywne,
wzmocnienie negatywne, kara, nagroda, prawo efektu,
Mietzel, G. (2002). Psychologia kształcenia. Gdansk: GWP. s. 147183
PLAN WYKŁADU






 Założenia behawioryzmu
 Uczenie się skojarzeniowe
 Warunkowanie klasyczne
 Warunkowanie sprawcze
 Przykłady warunkowania klasycznego i
instrumentalnego w realnym świecie
 Porównanie warunkowania
klasycznego i instrumentalnego
Założenia behawioryzmu









Zjawiska psychiczne to epifenomeny działania mózgu,
Psychologia musi się ograniczyć do eksperymentów,
Człowiek działa w myśl koncepcji: S – R (bodziec – reakcja);
środowisko jest układem aktywnym, człowiek zaś układem
reaktywnym,
Uczenie się ma charakter uniwersalny,
Badania prowadzone na zwierzętach podstawowe badania
psychologiczne,
Na te same bodźce ludzie różnie reagują,
Ta sama reakcja pojawia się pod wpływem różnych bodźców,
Neobehawioryści sugerują, że pomiędzy S i R coś się znajduje -->
S-O-R,
„Człowiek może być kierowany przez środowisko, ale należy
pamiętać, że środowisko jest prawie całkowicie ukształtowane przez
Uczenie się skojarzeniowe
koneksjonizm (ang. connectionism), model
uczenia się, w którym jednostką, jaka zostaje
wyuczona, jest skojarzenie, nawyk lub związek
między bodźcem i reakcją;
 Warunkowanie klasyczne – uczenie się
przewidywalnych sygnałów
 Warunkowanie sprawcze – uczenie się o
konsekwencjach
Natura warunkowania
klasycznego


Definicja: warunkowanie klasyczne (ang.
classical conditioning), forma uczenia się
polegająca na tym, że zachowanie (reakcja
warunkowa) zaczyna być wywoływane przez
pewien bodziec (bodziec warunkowy), który
uzyskał tę zdolność wskutek powiązania go z
bodźcem istotnym biologicznie (bodźcem
bezwarunkowym).
Odkrycie: badania I.Pawlowa nad trawieniem
psów; warunkowanie pawłowowskie
Cztery komponenty
warunkowania klasycznego

bodziec bezwarunkowy, Sb (ang. unconditional stimulus, UCS), w
warunkowaniu klasycznym bodziec, który wywołuje i wzmacnia reakcję
bezwarunkową.

bodziec warunkowy, Sw (ang. conditional stimulus, CS), w warunkowaniu
klasycznym, bodziec poprzednio obojętny, który zaczyna wywoływać reakcję
warunkową.

reakcja bezwarunkowa, Rb (ang. unconditional response), W warunkowaniu
klasycznym, reakcja wywoływana przez bodziec bezwarunkowy, bez
uprzedniego ćwiczenia czy uczenia się.

reakcja warunkowa, Rw (ang. conditional response), w warunkowaniu
klasycznym reakcja wywoływana przez bodziec poprzednio obojętny; występuje
w wyniku powiązania bodźca obojętnego z bodźcem bezwarunkowym.
Philip Zimbardo, Psychologia i życie
Podstawowe
cechy
warunkowania
klasycznego
Copyright © Wydawnictwo Naukowe PWN SA 2004
Procesy podstawowe


Nabywanie
Wygaszanie i samorzutne odnowienie



Generalizacja bodźca


wygaszanie (ang. extinction), w warunkowaniu - osłabienie związku
warunkowego, gdy nie jest podawany czynnik wzmacniający czyli
bodziec bezwarunkowy.
samorzutne odnowienie (ang. spontaneous recovery), ponowne
pojawienie się wygaszonej reakcji warunkowej po okresie odpoczynku.
(ang. stimulus generalization), automatyczne rozszerzenie reakcji
warunkowej na podobne bodźce, które nigdy nie były zestawiane z
bodźcem bezwarunkowym.
Różnicowanie bodźców

różnicowanie bodźców (ang. stimulus discrimination), proces
warunkowania, kiedy to organizm uczy się reagować inaczej na
bodźce, które w pewnym wymiarze różnią się od bodźca warunkowego
Dlaczego zachodzi
warunkowanie


Styczność w czasie
Zasada kontyngencja
Natura warunkowania
sprawczego


Definicja: rodzaj uczenia się następujący w wyniku aktywnych
(sprawczych) zachowań organizmu (np. człowieka) w interakcji
z otoczeniem
Odkrycie: E.Thorndike badał zachowanie głodnych kotów w
skrzynce problemowej
Dlaczego zachodzi
warunkowanie instrumentalne
ヨ
Prawo efektu
prawo efektu (ang. law of effect), podstawowe prawo
uczenia się, które głosi, że zdolność bodźca do
wywoływania reakcji rośnie, gdy po reakcji następuje
nagroda, a spada, gdy nagroda po niej nie następuje.

ヨ
Mapa poznawcza
mapa poznawcza (ang. cognitive map), reprezentacja
psychiczna przestrzeni fizycznej.

Wzmocnienia w warunkowaniu
instrumentalnym




Wzmocnienia pozytywne i negatywne

negatywny czynnik wzmacniający (ang. negative reinforcer), bodziec, którego
usunięcie lub uniknięcie po jakiejś reakcji zwiększa prawdopodobieństwo tej
reakcji

pozytywny czynnik wzmacniający (ang. positive reinforcer), bodziec, którego
otrzymanie po reakcji zwiększa prawdopodobieństwo jej wystąpienia w
przyszłości
Nagroda i kara

Pierwotnie i wtórne czynniki nagradzające i karzące
Wzmacnianie ciągłe i sporadyczne
Rozkłady wzmocnień-plan, według którego podaje się lub wstrzymuje wzmocnienie.

według stałych proporcji

według zmiennych proporcji

według stałych odstępów czasowych

według zmiennych odstępów czasowych
Zbieżność trójczłonowa między bodźcami
dyskryminacyjnymi, zachowaniem
i konsekwencjami 1
Bodziec
dyskryminacyjny
(SD)
Reakcja
emitowana
(R)
Konsekwencj
e bodźcowe
(S)
Wzmocnienie pozytywne: reakcja w
obecności efektywnego sygnału (SD)
powoduje pożądane konsekwencje.
Częstość tej reakcji wzrasta.
Automat do
sprzedaży
napojów
Wrzucenie
monety do
otworu
Otrzymanie
napoju
Wzmocnienie negatywne (ucieczka):
dzięki reakcji sprawczej „ucieka się” z
nieprzyjemnej sytuacji. Częstość reakcji
ucieczki wzrasta.
Gorąco
Wachlowani
e się
Ucieczka od
gorąca
Copyright © Wydawnictwo Naukowe PWN SA 2004
Zbieżność trójczłonowa 2
Bodziec
dyskryminacyjny
(SD)
Reakcja
emitowana
(R)
Konsekwencj
e bodźcowe
(S)
Wzmocnienie negatywne (unikanie):
bodziec sygnalizuje danemu
organizmowi, że wkrótce nastąpi jakieś
nieprzyjemne zdarzenie. Odpowiednia
reakcja pozwala uniknąć tego zdarzenia.
Częstość reakcji unikania wzrasta.
Dźwięk brzęczyka
przy pasie
bezpieczeństwa w
samochodzie
Zapięcie
pasa
Uniknięcie
przykrego
dźwięku
Wygaszanie: po reakcji sprawczej nie
następuje czynnik wzmacniający.
Częstość tej reakcji maleje.
Żaden lub SΔ
Błaznowa
-nie
Nikt nie
zwraca uwagi
Karanie: po reakcji następuje przykry
bodziec. Reakcja ta zostaje
wyeliminowana lub stłumiona.
Atrakcyjne
pudełko zapałek
Zabawa
zapałkami
Oparzenie się
lub otrzymanie
klapsa
Copyright © Wydawnictwo Naukowe PWN SA 2004
Zasada Premacka

(ang. Premack principle), zasada
wykryta przez Davida Premacka,
zgodnie z którą czynność bardziej
preferowana może służyć do
wzmacniania czynności mniej
preferowanej.
Metoda kolejnych przybliżeń

Metoda w której wzmacnia się
zachowania coraz to bliższe
pożądanemu
KARANIE
Wady kary:






Nieadekwatne lub
stanie pobudzenia,
wymierzane
w
Ukarany reaguje lękiem obawą lub
złością,
Skutek kary jest czasami krótkotrwały,
ściśle uzależniony od obecności
osoby karzącej lub od okoliczności,
Większość złych zachowań trudno
ukrać od razu,
Dostarczają niewiele informacji,
Działanie, które ma być karą może się
okazać wzmocnieniem, ponieważ
oznacza zainteresowanie.
Środki zwiększające efektywność karania:

Umożliwianie
osobie
innych
zachowań, które mogą zastąpić
zachowanie karane,

Uzupełnianie karania wzmacnianiem
pozytywnym,

Dbanie o to, by karany dokładnie
wiedział, za co spotkała go kara,

Stosowanie kary zaraz po
niepożądanym zachowaniu,

Używanie kar wystarczająco silnych,
by mogły powstrzymać niepożądane
zachowania, ale nie silniejszych, niż
jest to niezbędne,

Uniemożliwienie uniknięcia kary, jeśli
niepożądane zachowanie miało
miejsce,

Przedkładanie kar polegających na
pozbawianiu przyjemności nad
zadawanie fizycznego lub
psychicznego bólu.
Przykłady warunkowania klasycznego i
instrumentalnego w realnym świecie

Klasyczne:




Fobie: systematyczna desensytyzacja
Uczenie się miłości i sympatii
uczenie się awersji do smaku (ang. taste-aversion learning),
biologiczne predyspozycje do uczenia się, polegające na tym, że
organizm uczy się w jednej próbie unikać pokarmu, po spożyciu
którego zachorował;
Sprawcze:




Problem kary/problem nagrody- “karzemy dzieci pracą i
nagdarzamy oglądaniem telewizji”
W szkole
W pracy
W domu
Porównanie warunkowania
klasycznego i instrumentalnego
WARUNKOWANIE
KLASYCZNE
WARUNKOWANIE
INSTUMENTALNE
Reakcja
mimowolna, automatyczna
„dobrowolna”, działa na środowisko
Nabywanie
kojarzenie faktów; BW zapowiada BB
kojarzenie reakcji z konsekwencjami
(bodźce wzmacniające lub karzące)
Wygasanie
RW
słabnie,
jeżeli
BW
wielokrotnie
prezentowany
wzmocnienie
jest
bez
reagowanie słabnie po zaprzestaniu
wzmacniania
Procesy poznawcze
rozwijają się oczekiwania, że po BW
pojawi się BB
rozwijają się oczekiwania, że reakcja
będzie wzmacniana lub karana;
wstępuje również uczenie utajone bez
wzmocnienia
Predyspozycje
biologiczne
naturalne predyspozycje warunkują,
jakie bodźce i reakcje mogą być łatwo
ze sobą skojarzone
organizm najłatwiej uczy się zachowań
podobnych
do
naturalnych;
zachowania nienaturalne instynktownie
upodabniają się do naturalnych.
Kluczowe znaczenie
styczność
w
czasie
bodźca
warunkowego i bezwarunkowego
styczność w
konsekwencji
czasie
reakcji
i
jej