Transcript Forsterkning, betingede forsterker, straff.pdf
Forsterkning, betingede forsterker, straff MALKA212 V-2011 Erik Arntzen HiAk 9.03.2011
EA 1 1 Treterms kontingensen For å kunne formulere interaksjonen mellom en organisme og dens omgivelser må det ifølge Skinners spesifiseres 1)
Den foranledning en respons opptrer under
- S D 2)
Selve responsen
- R 3)
De forsterkende konsekvenser
- S R Forholdet mellom disse kalles:
Forsterkningsbetingelsene eller forsterkningskontingensene.
S D : R - S R
9.03.2011
EA 2 2
Fra Pierce og Cheney (2008) 9.03.2011
EA Different operant chambers 3 3 9.03.2011
EA 4 4
Et operant kammer for duer.
9.03.2011
EA Cumulative Recorder 5 5 9.03.2011
EA 6 6
From Ferster (1953) 9.03.2011
EA Kymograph 7 7 9.03.2011
EA 8 8
From Lattal (2004) 9.03.2011
EA From Lattal (2004) 9 9 9.03.2011
EA 10 10
From Asano and Lattal (2008) 9.03.2011
EA From Asano and Lattal (2008) 11 11 9.03.2011
EA 12 12
From Catania (2007) 9.03.2011
EA Cumulative Record skjematisk 13 13 9.03.2011
EA 14 14
Effektivitet ved en forsterker eller forsterkning • Rate • Kvalitet • Magnitude • Delay • Det er den tidsperioden mellom responsen som har produsert forsterkeren og til forsterkeren faktisk blir presentert.
9.03.2011
EA 15 15 9.03.2011
Immediacy of Reinforcment • Direct effects or reinforcement is based on temporal relation between behavior and consequence (Michael, 2004.) • The less delay, the more effective the reinforcement.
• Behavior closest to reinforcement is strengthened.
EA 16 16
9.03.2011
Delayed consequences • Do not reinforce behavior directly • Affect behavior through instructional control and rule following • Rule: verbal description of a behavioral contingency • Rule governed behavior: If behavior occurs because of a rule rather than direct effect of reinforcement.
EA 17 17 Etablering av responser og delay • Thorndike (1911) fant blant annet at det var en negativ relasjon mellom responservervelse og delay av konsekvensene.
9.03.2011
EA 18 18
Varianter ved bruk av delays • Delays med en distinkt eller bestemt stimulus • Brukt ofte lys av • Variasjoner i farge på lys • Spaker som trekkes tilbake • Delays med ikke-tilbakestilte intervaller eller med tilbakestilling av intervallene.
• Delays med fast eller variabel varighet 9.03.2011
EA 19 19 Den vanligste måten studere effektene av delay på.
• Avhengig av kontekst så kan delay of reinforcement øke eller redusere atferd, eller ikke ha noen effekt sammenlignet med umiddelbar forsterkning.
• Det mest vanlig er at man iverksetter en prosedyre med delayed reinforcement etter en periode med umiddelbar forsterkning.
• Dette fører typisk til at responsraten reduseres noe.
9.03.2011
EA 20 20
Differensiering av operante responser med delayed reinforcement • Skinner (1938) var den første som differensierte operante responser med delayed reinforcement. Han gjorde blant annet et eksperiment med rotter og viste at det var mulig å etablere spaktrykk med et delay opp til 8 sekunder. Delayet var ikke signalisert.
9.03.2011
EA 21 21 9.03.2011
Shaping med delay • Prosedyren var ikke-tilbakestillende usignalisert delay • Sammenligning av umiddelbar forsterkning, 1 s delay og 10 s delay • Resultatene viste at det var ingen nevneverdige forskjeller mellom umiddelbare og 1 s delay.
• Ved 10 s delay var det ikke mulig. Duene fortsatte å vise masse forskjellig type atferd i intervallet EA 22 22
Innføring av et delay etter steady state responding • Ferster (1953) antok at effektene av signaliserte delays ville bli mindre påvirket dersom det ble benyttet en titreringsprosedyre.
• Resultatene viste at responderingen ble opprettholdt på et VI 60 s skjema med 120 s delay • Ferster og Hammer (1956) viste i en studie med bavianer at intervallet kunne strekkes gradvis opp til 24 timer.
9.03.2011
EA 23 23 Anvendelse av delay etter at atferden er oppretthold på umiddelbar forsterkning • Korte intervaller på rundt 0.5 sekunder i usignaliserte og i tilbakesettende delays ofte fører til at responderingen relativt til hva som er funnet ved umiddelbar forsterkning. • Når det er sagt så er det viktig å presisere at den mest typiske effekten ved delayed reinforcement brukt etter umiddelbar forsterkning er at man får en reduksjon i responsraten relativt til hva som er observert ved umiddelbar forsterkning.
9.03.2011
EA 24 24
Ulike termer A - B - C
S K2
{
S K
{
SD : R - SR
SE (Setting hendelser) EO/MO (Etablerende eller motivasjonelle operasjoner) 9.03.2011
EA 25 25 Fire grunnleggende forhold mellom stimuli som etterfølger atferd og effekt på atferd: 10.03.2010
Stimulus som følger etter atferden Presentasjon Økning Reduksjon Positiv forsterkning ”Type 1 punishment” Fjerning Negativ forsterkning ”Type II punishment” EA 26 26
Fra Cooper et al. (2007) 10.03.2010
EA 27 27 9.03.2011
Viktige forhold ved den atferdsanalytiske opplæringsmodellen • Etablering av ny atferd • Endre stimuluskontrollen for atferden • Generalisering av atferd over tid (opprettholdelse), situasjoner og atferdskategorier EA 28 28
Vanskeligheter med å lage gode nok ”fagmiljøer” for å behandle alvorlige atferdsproblemer Difficult or controversial programming for very difficult behavior problems should be limited to those settings in which the necessary expertise and environmental support are available (Foxx, 1982).
9.03.2011
EA 29 29
Viktige hovedmål
• • • Økt grad av selvstendighet Bredest mulig atferdsrepertoar Etablering av alternative atferdstopografier for å redusere problematferd 9.03.2011
EA 30 30
9.03.2011
Tre viktige forhold for å skille ut hva som er problematferd:
!
Atferden ekskluderer klienten i å delta i sosiale situasjoner.
!
Atferden er uforenelig med opplæring av nye viktige ferdigheter. !
Atferden er skadelig for klienten og/eller andre.
EA 31 31 9.03.2011
Klassifikasjon av atferd
Overskuddsatferd
. Kategorien referer til atferd som er for høyfrekvent eller for intens i forhold til normene som gjelder for situasjonene den forekommer i.
Underskuddsatferd
forekommer i.
. Denne kategorien omfatter for lavfrekvent og for lite intens atferd i forhold til de situasjonene den
Mangelatferd
. Atferd som klienten ikke har i sitt atferdsrepertoar, men som det er ønskelig at han skal lære.
Atferd under feil stimuluskontroll
forekommer under.
. Denne kategorien omfatter atferd som er lite funksjonell i forhold til de situasjoner den EA 32 32
Eksemplifisering av typer av problematferd
"
Selvskadende atferd
"
Selvstimulerende atferd
"
Tvangsmessig atferd
" " " " "
Utagerende atferd Mangel på oppmerksomhet Mangel på språklig atferd Mangel på korrekt toalettatferd Manglende typer av selvstendighetsatferd
9.03.2011
EA 33 33 9.03.2011
Ulike former for problematferd: !
Selvskadende atferd !
Aggressiv og ødeleggende atferd !
Stereotyp atferd !
Selvstimulerende atferd !
Tvangsmessig atferd !
Passivitet !
I tillegg en del som kan kategoriseres som mangelatferd (grising med avføring, enurese etc.) EA 34 34
Definisjon av selvskading (SIB)
• • • Initiert av personen selv Repeterende Har som resultat at responsene påfører individet skade.
9.03.2011
Selvskadende atferd regnes som enhver atferd initiert av individet selv, som direkte resulterer i fysisk skade på det individet. Fysisk skade antas å innbefatte "gul og blå", istykkerriving, blødninger (indre eller ytre), brudd- og brist av bein, og annen vevødeleggelse (Murphy & Wilson, 1985).
EA 35 35 9.03.2011
Definisjon av låsing
Vanlige topografier ved låsing (”self-restraint”) er innvikling av lemmer i klær, møbler eller deler av kroppen; disse responsene er vanligvis inkompatible med individets selvskading og blir sett på som at de forhindrer de selvskadende responsene.
1992) (Smith, Iwata, Vollmer, & Pace,
EA 36 36
Ulike topografier ved selvskading
9.03.2011
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
hodedunking slag mot hodet biting på kroppsdeler trykking mot øye hårnapping riving og kloring slag mot andre kroppsdeler negleutdraging skjære seg sparke seg gniing av to kroppsdeler mot hverandre hoppe på stive bein pica ruminasjon provoserte brekninger hyperventilering provoserte kramper EA 37 37 9.03.2011
Paradigmeskifte innen anvendt atferdsanalyse • Prinsippet om minst restriktive alternativ • “Least Restrictive Alternative” (LRA) • Fra å være en diskusjon om aversive vs. ikke-aversive behandling til å være en diskusjon om funksjonell vs. ikke-funksjonell behandling • LRA-modellen forfekter at behandlingen skal være basert på funksjon og ikke topografi.
• Kunnskapen om atferdens funksjon har gitt mer nøyaktige behandlingsopplegg, samt at en del nye prosedyrer er framkommet.
EA 38 38
Minst restriktive prosedyre • Prinsippet om bruk av den minst restriktive prosedyre har vært et anerkjent prinsipp innen atferdsanalyse over lang tid.
• Det innebærer at andre mindre restriktive prosedyrer skal prøves ut først og dersom disse viser seg å være ineffektive, så kan man diskutere bruken av straffeprosedyrer.
9.03.2011
9.03.2011
EA 39 39 Et mulig tiltakshierarki Funksjonsbasert Ikke-funksjonelle forsterkningsbaserte prosedyrer Prosedyrer som innebærer bruk av restriktivitet EA 40 40
Rangering fra liten til stor grad av restriktive prosedyrer: 9.03.2011
1) 2) 3) 4) 5) 6) 7) 8) 9) 10) 11) Etablering av ferdigheter Di ff erensielle forsterkningsprosedyrer og NCR Ekstinksjon Reprimander Positiv praksis «Time-out» - ikke-ekskluderende «Time-out» - ekskluderende «Response Cost» Restitusjonsprosedyrer Presentasjon av aversive stimuli kontingent på atferd - ikke-smertefulle stimuli Presentasjon av aversive stimuli kontingent på atferd - smertefulle stimuli EA 41 41 1) 2) 3) 4) 5) I henhold til bruk av aversive virkemidler er det vanlig å dele slike prosedyrene inn i fem kategorier: aversive lyder aversiv smak aversive lukter fjerning eller fordreining av visuelle stimuli uvanlig aversiv fysisk berøring 9.03.2011
EA 42 42
Kontinuerlig atferdstrøm • Private og offentlige hendelser • Hendelsene kan da både være atferd og stimuli • Skille er bestemt av tilgang til disse hendelsene.
• Kan være en del av en atferdskjede ”Private and public events have the same kind of physical dimensions.” (Skinner, 1963, p. 953) ”The skin is not at all that important as boundary” (Skinner, 1969).
9.03.2011
EA 43 43 9.03.2011
Fra Cooper et al. (2007) • Generelt kan en si at atferd er aktiviteten hos levende organismer.
• Atferd brukes for å referere til en større klasse av responser som deler visse typer topografiske dimensjoner eller funksjoner.
• Respons referer til en spesifikk tilfelle av en atferd.
• Responstopografi referer til en fysisk form av atferd.
• En responsklasse er en gruppe responser som varierer i topografi, men som produserer den samme effekten på miljøet.
• Et repertoar refererer til alle typer av atferd som en person kan framvise eller til et sett av typer av atferd som er relevant i en type setting eller oppgave.
EA 44 44
En respons En
respons
er en bit av atferdsstrømmen som er avgrenset ved at forekomst av liknende atferdsbiter er funksjonelt relatert til bestemte stimuli.
9.03.2010
EA En stimulus En
stimulus
er hendelse som er avgrenset ved at liknende hendelser er funksjonelt relatert til bestemte typer responser.
45 45 9.03.2010
EA 46 46
Viktige begreper ved forsterkning Begrep Restriksjoner Forsterker (substantiv) Forsterkende (adjektiv) Forsterkning (substantiv) Å forsterke (verb) 10.03.2010
En stimulus EA En egenskap ved en stimulus En prosedyre eller en prosess En prosedyre eller en prosess 47 47 Forsterkere virker på atferd og de er definert ut fra økning av responsraten og ikke om man liker dem eller ikke “Reinforcers do not work because they make the organism “feel good” or because the organism “likes” them” (Catania, 1992, p.81) 9.03.2011
EA 48 48
En positiv forsterker En
positiv forsterker
er en hvilken som helst stimulus som blir presentert (tilført) umiddelbart på en respons, og som øker sannsynligheten for liknende type av responser i framtiden. 9.03.2010
EA 49 49
Eksempel med bruk av positiv forsterkning
9.03.2011
EA 50 50
Nok et eksempel på det samme 9.03.2011
EA En negativ forsterker En
negativ forsterker
er en hvilken som helst stimulus som blir terminert (fjernet) umiddelbart på en respons, og som øker sannsynligheten for liknende type av responser i framtiden. 51 51 9.03.2010
EA 52 52
En litt annen definisjon, men ikke akkurat helt korrekt
!
Fra en eksamensoppgave på profesjonsstudiet i psykologi: ”Negativ forsterkning er akkurat det samme, bortsett fra at man øker styrken av responsen ved å unngå forsterkning”.
9.03.2011
EA 1.
2.
3.
Forsterkning er navnet på relasjonen mellom responser og miljøet. Denne relasjonen inkluderer minst tre komponenter: Responsen må ha konsekvenser.
Økt sannsynlighet for at liknende responser forekommer i framtida.
Økningen må forekomme fordi responsene har disse konsekvensene og ikke for noen annen grunn.
53 53 9.03.2011
EA 54 54
Kontigens vs. Uavhengighet Kontingens Uavhengighet 10.03.2010
EA Typer av forsterkere: • Ubetingede forsterkere (noen ganger også betegnet som primær forsterkere) er hendelser eller stimuli som har en åpenbar biologisk betydning for organismen, for eksempel mat og vann.
• Betingede forsterkere er hendelser eller stimuli som gjentatt ganger blir paret med stimuli som allerede er effektive forsterkere, for eksempel ros, smil.
• Dersom betingede forsterkere er paret med en rekke andre forsterkere i en rekke situasjoner blir disse generaliserte betingede forsterkere, for eksempel penger, tegnøkonomibrikker 9.03.2011
EA 56 56 A B A B 55 55
9.03.2011
EA 57 57 9.03.2011
EA 58 58
9.03.2011
EA 59 59 9.03.2011
Betinget forsterkning • S-S forklaring på betinget forsterkning • Klassisk betinging • Diskriminativ stimulus forklaring på betinget forsterkning • Operant betinging • Stimulusen må være diskriminativ for å bli en betinget forsterker.
EA 60 60
9.03.2011
Generaliserte betinget forsterkning • En generalisert betinget forsterker er enhver hendelse eller stimulus som er korrelert med eller utbyttbar med mange kilder til ubetinget forsterkning.
• Generalisert betinget forsterkning er ikke avhengig av deprivasjon eller metning av en spesiell forsterker.
• Generalisert sosial forsterkning.
• Tegnøkonomibrikker og penger som generaliserte betingede forsterkere.
EA Fra Pierce og Cheney (2008) 61 61
Betingede forsterkere og kjeding
• Tradisjonelt: S D R Trykkerespons !
klikkelyd for vannmekanisme !
vann S R • Molekylært nivå: S D R1 Synet av spaken !
trykkerespons !
klikkelyd fra vannmekanismen S R S R /S D R2 S R Klikkelyd fra vannmekanisme !
går til vannluka !
vann 9.03.2011
EA 62 62
Baklengs kjeding 9.03.2011
EA 63 63 Skinner (1953): A conditioned reinforcer is generalized when it is paired with
more than one unconditioned reinforcer
. The generalized reinforcer is useful because the momentary condition of the organism is not likely to be important. The operant strength generated by a single reinforcement is observed only under an appropriate
condition of deprivation
– when we reinforce with food, we gain control over the hungry man. But if a conditioned reinforcer has been paired with reinforcers appropriate to many conditions, at least one appropriate state of deprivation is more likely to prevail upon a later occasion. A response is therefore more likely to occur.
When we reinforce with money, for example, our subsequent control is relatively independent of momentary deprivations.
(p. 77) 9.03.2011
EA 64 64
To motsatte prosesser 9.03.2011
EA 65 65 Ekstinksjon Ekstinksjon som prosedyre er at den forsterker som tidligere etterfulgte/ opprettholdt en bestemt type respons blir holdt tilbake eller ikke gjør det lenger. Ekstinksjon som prosess refererer til at hyppigheten av denne type respons først øker noe for deretter å avta som et resultat av ekstinksjonsprosedyren.
9.03.2010
EA 66 66
9.03.2011
Ekstinksjon vs. ”glemsel” • I løpet av ekstinksjonen så avtar atferden over tid • Glemsel er kun et resultat av tiden har gått.
• Skinner (1938) • Markowitz et al. (1975) Gå fram EA 67 67 Extinction vs. forgetting 9.03.2011
EA Gå tilbake 68 68
Effektene av ekstinksjon 9.03.2011
EA Responding during extinction 69 69 9.03.2011
EA 70 70
Extinction 9.03.2011
Satiation EA 71 71 9.03.2011
EA 72 72
Reinforcement and extinction 9.03.2011
EA Fra Catania (2007) 73 73 9.03.2011
EA 74 74
Extinction from Catania (2007) 9.03.2011
EA Spontaneous Recovery 75 75 9.03.2011
EA 76 76
Spontaneous recovery Catania (2007) 9.03.2011
EA Mechner notation system 77 77 9.03.2011
EA 78 78
Mechner notation system 9.03.2011
EA Probabilities from Catania (2007) 79 79 9.03.2011
EA 80 80
Klassebegrepet En
operant
er en klasse av responser som er under kontroll av de samme diskriminative stimuli og forsterkende hendelser 9.03.2011
EA Classes of behavior 81 81 9.03.2011
EA 82 82
Descriptive vs. Functional operant
9.03.2011
EA 83 83 Definisjon av shaping
Forming
(shaping) av en bestemt respons
-
topografi best
å
r av at kriteriet for hvilke responsformer som leder til forsterkning endres gradvis i en bestemt retning.
9.03.2010
EA 84 84
Eksempel 9.03.2011
EA 85 85 9.03.2011
EA 86 86
Shaping
A means of reinforcing the behavior as it becomes closer to the desired outcome.
Reinforce successive approximations of the behavior
9.03.2011
EA 87 87 9.03.2011
Fading vs. Shaping • Fading is used to bring an already learned behavior under the control of a different stimulus. Shaping is used to teach a new behavior • The behavior itself does not change when fading is used; only the antecedent stimulus varies. In shaping the behavior itself is changed • In fading, the teacher manipulates antecedents. In shaping, consequences are manipulated EA 88 88
9.03.2011
EA 89 89 9.03.2011
Sample Task Analysis 1.
2.
3.
4.
5.
6.
7.
8.
9.
Locate the phone Find the phone number Choose correct change Pick up the receiver with left hand Put receiver to ear and listen to dial tone Insert first coin Insert second coin Dial seven-digit number Wait for ring a minimum of 5 times 10. If someone answers, initiate conversation 11. If busy, hang up phone and collect money EA 90 90
Response Chaining • Used to link a series of functionally related responses, each associated with a particular stimulus condition 9.03.2011
EA 91 91 Example of a response chain 9.03.2011
“Go to first stop sign” CUE “Turn right” First response “ See yellow house on left” Reinforcer + cue EA “Go two stop lights” Second Response 92 92
9.03.2011
EA 93 93 Shaping
A means of reinforcing the behavior as it becomes closer to the desired outcome.
Reinforce successive approximations of the behavior
9.03.2011
Forward Chaining • Procedure where all the steps are performed in sequence, but only the first task step is instructed and reinforced.
EA 94 94
“Boy, have I got this guy trained: every time I press the lever, he gives me a piece of cheese” 9.03.2011
EA 95 95
Operant betinging
# # # Responser blir ”emitted” En stimulus kontrollerer responsen i den forstand at sannsynligheten for responsen endres når en spesiell stimulus, som hvis nærvær tidligere har ledet til forsterkning, er tilstede.
Kontingens • • Vi sier at det er en kontingent (avhengig av) forhold mellom spaktrykk og mat.
Dersom det er et kontingent forhold mellom to hendelser A og B, så betyr det at B bare forekommer og bare dersom A forekommer. På den måten er B avhengig av A eller sagt på en annen måte at A predikerer B, ettersom når A forekommer, så forekommer B. Dersom A ikke forekommer, så vil B ikke forekomme. Mat (B) er kontingent i forhold spaktrykk (A) eller sagt på en annen måte er mat (B) en konsekvens av spaktrykk (A).
9.03.2010
EA 96 96
Fortsetter # $ $ $ $ Forandringer i atferd som et resultat av en respons blir utsatt forsterkning: raten av responsen øker relativt til baseline nivå. raten av responsen øker relativt til raten av andre responser som forekommer i situasjonen. mønsteret eller sekvensen forandrer seg til en sløyfe som hele tiden gjentar seg.
formen eller topografien av responsen blir mer stereotyp og krever et minimum av anstrengelse forandring i responsvariabilitet og blir influert av individets biologiske forberedthet til å utføre de responsene som konsekvensene er arrangert for .
9.03.2010
EA 97 97 Fortsetter •Arbitræritet " i den forstand at ingen er spesielt interessert i spaktrykk som sådan.
" at responser kan bli modifisert ved sine konsekvenser.
" " spaktrykk eller trykking på en tast er valgt ettersom de er lette å observere og registrere.
kan lett utføres med ulik frekvens og med forskjellig mønster.
9.03.2010
EA 98 98
From Tolman 9.03.2011
EA A fourteen-unit T-maze 99 99 9.03.2011
EA 100 100
From Tolman and Honzik (1930) 9.03.2011
EA 101 101 9.03.2011
Cognitive Map • The animal develops a picture of the environment in his mind by moving about in this environment.
• Once “the lay of the land” is developed the animal can reach its goal from any direction, individual responses, even individual routes to goal do not matter.
EA 102 102
9.03.2011
Expectations • During the development of the cognitive map the animal develops expectations on where to find the goal.
• Tentative expectations early on in cognitive map development are called hypotheses. An expectation that is consistently confirmed is called means-end readiness.
EA 103 103 9.03.2011
EA 104 104
9.03.2011
EA 105 105 9.03.2011
EA Catania (2007) 106 106
9.03.2011
EA 107 107 9.03.2011
From Statton (1897) • When I moved my head or body so that my sight swept over the scene, the movement was not felt to be solely in the observer, as in normal vision, but was referred both to the observer and to objects beyond !
I did not feel as if I was visually ranging over a set of motionless objects, but the whole field of things swept and swung before my eyes.” (p. 342) EA 108 108
From Skinner (1953) ”Events which are found to be reinforcing are of two sorts. Some reinforcements consist of we call
positive presenting
stimuli, of adding something – for example, food, water, or sexual contact – to the situation. These reinforcers. Others consist of
removing
something – for example, a loud noise, a very bright light, extreme cold or heat, or electric shock – from the situation. These we call
negative
reinforcers. In both cases the effect of reinforcement is the same – the probability of response is increased. We cannot avoid this distinction by arguing that what is reinforcing in the negative case is the absence of the bright light, loud noise, and so on; for it is absence after presence which is effective, and this only another way of saying that the stimuli is removed. (p. 73) 9.03.2011
EA 109 109 Michael (1975) • Confusion between negative reinforcement and punishment • If stimuli are presented or removed depend on the context. 9.03.2011
EA 110 110
Problems raised with respect to such a distinction • Aversive stimulus vs. negative reinforcer • Difficulties with distinguishing stimulus changes which are presentations from those which are removals or withdrawals. 9.03.2011
EA Iwata (2006) • In many cases stimulus changes involve pre- and postchange conditions in which it is possible to determine if the relevant stimulus is present or absent • Prechange and postchange conditions % facilitates the development of effective contingencies 111 111 9.03.2011
EA 112 112
Fra Hineline • ”The addition of one event is the removal of another, and vice versa: Adding heat is removing cold; adding food is decreasing deprivation; adding a smile removes a frown. However, there is a fundamental asymmetry, for if a stimulus or situation is to be reducible or removable by some response, that response must occur in its presence. In contrast, positively reinforced responses necessarily occur in the absence of the stimuli upon which reinforcement is based.” (pp. 496-497) 9.03.2011
EA 113 113 On the distinction between positive and negative reinforcement 9.03.2011
EA Catania (2007) 114 114
Variability • One possibility is that the strengthening effects of positive and negative reinforcement are in some important way different from one another • The two kinds of reinforcement involve underlying physiological structures or processes.
9.03.2011
EA Stereotypy From Schwartz (1982). Four left and four right presses in any order were required. He found that both pigeons and college students developed a stereotyped pattern of responding. 9.03.2011
EA 115 115 116 116
Variability • Critic raised by Neuringer: • Response requirements in the Schwartz study resulted in response stereotypy. Furthermore, Neuringer and co-workers have done experiments showing the opposite results of Schwartz (1982): • Experiments have shown that pigeons show variability when reinforcement contingencies were arranged for such behavior (Page and Neuringer, 1985).
• Other experiments by Neuringer (2002, 2004) with humans have shown that reinforcement contingencies may generate novel behavior.
9.03.2011
EA 117 117 9.03.2011
• Positiv straff
. 1) Skinner definerer straff som presentasjon av en negativ forsterker kontingent på en respons, 2) Azrin definerer straff som en hvilken som helst stimulus som blir presentert (tilført) kontingent (avhengig av) på en respons, og som minsker den framtidige sannsynligheten for liknende typer responser. EA 118 118
• Negativ straff.
1) Skinner definerer straff som er fjerning av en positiv forsterker kontin-gent på en respons. 2) Azrin definerer straff som en hvilken som helst stimulus som blir terminert (fjernet) kontingent (avhengig av) på en respons, og som minsker den framtidige sannsynligheten for liknende typer responser. 9.03.2011
EA 119 119 To definisjoner av straff 9.03.2011
1. Azrin og Holz (1966) Straff er en prosedyre der a) responser har konsekvenser b) hyppigheten av disse responsene synker c) nedgangen i responshyppigheten skjer forsi responsene har disse konsekvensene, og ikke av andre grunner.
2. Skinner Straff er en prosedyre der responser etterfølges av enten • Fjerning av en positiv forsterker, eller • Presentasjon av en negativ forsterker (aversiv stimulus) Positive og negative forsterkere må på forhånd være identifisert i henholdsvis positive og negative forsterkningsprosedyrer.
EA 120 120
9.03.2011
EA 121 121 Foranledning Si navnet på en kjøttetende dinosaur Fra Cooper et al. 2007 Atferd ”Tyrannosaurus Rex” Konsekvens ”Supert” Framtidig frekvens av atferd i lignende situasjoner Operasjon/prosedyre Positiv forsterkning Fæl lukt under kjøkkenbenken Tar ut søpla Den fæle lukta forsvinner Negativ forsterkning Positiv straff Glatt vei Spørsmål i ”popup” boks på skjermen: ”Vil du varsles dersom du sletter uleste beskjeder?” Kjører i normal hastighet Klikker på ”Nei” Kjører inn i bilen foran Viktig e-post beskjeder blir slettet EA Negativ straff 122 122
9.03.2011
EA Escape and Avoidance 123 123 9.03.2011
EA 124 124
9.03.2011
EA 125 125 Negativ forsterkning
Det er atferd som øker i frekvens når den etterfølges av at en stimulus blir fjernet. På samme måte som positiv forsterkning øker denne frekvensen av atferd og den er benevnt som negative fordi den involverer fjerning
To typer: • Flukt • Responsen framkommer i nærvær av den aversive stimulusen og derav fjerner denne • Atferd fjerner stimulusen fra situasjonen • Unngåelse • Responsen forhindrer den aversive stimulusen • Atferd gjør at hendelsen unngås.
• ”Postponement” og ”deletion” prosedyrer 9.03.2011
EA 126 126
Nondiscriminated avoidance 9.03.2011
EA Avoidance paradox • Murray Sidman (1989) “Successful avoidance meant that something – the shock – did not happen, but how could something that did not happen be a reinforcer?” 127 127 9.03.2011
EA 128 128
Discriminated avoidance 9.03.2011
EA 129 129 9.03.2011
Sidman (1953) • To klokker styrer formidlingen av elektrisk støt • En klokke tiden mellom støtene SS intervall • En klokke tiden mellom respons og støt RS intervall • Støt kan unngås fullstendig ved avoidance responser • Støtene er også av så kort varighet at det ikke er mulig med noe fluktrespons.
EA 130 130
Spaktrykking hos en rotte i en Sidman avoidance prosedyre
9.03.2011
EA 131 131 9.03.2011
Lenker • • • http://www.psychology.uiowa.edu/Faculty/ Wasserman/Glossary/ reinforcement.html#positive%20reinforcer http://www.youtube.com/watch?
v=wfraBsz9gX4 http://psych.athabascau.ca/html/prtut/ reinpair.htm
EA 132 132
9.03.2011
Eksempler 1. Ei rotte blir plassert i et operant kammer og får umiddelbart et mildt elektrisk støt i beina. Rotta trykker på en spak og støtet opphører. Rotta får et nytt støt og trykker spaken igjen, støtet opphører på nytt. Rottas spaktrykkeatferd er styrket ved konsekvensen at støtet opphører. 2. Å kjøre i kø er en negativ betingelse for de fleste av oss. Du kjører hjemmefra en morgen og dermed slipper unna køen. Neste morgen drar du også tidligere hjemmefra og igjen unngår du køen. Atferden din å dra tidlig hjemmefra er forsterket ved at du unngår kø. EA 133 133 Eksempler
Stimulus
Innsektsbitt som klør Øyne som klør For sterkt lys Kaldt luftdrag For mye støy For nye syting Kjedelig undervisning Bekymre seg for en test Hodepine 9.03.2011
Nervøs
Atferd som blir forsterket
Klør på det.
Gnir dem.
Skygger for Lukker vindu Skrur ned høreapperatet Overdøve sytingen med radioen eller gi etter og dem hva de vil Dagdrømme, tegne kruseduller, lukke ute Se på tv eller studere for å lindre dårlig samvittighet Ta en smertelindrende tablett Puste dypt, avslapningsøvelser 134 134