Klikk her for å laste ned heftet

Download Report

Transcript Klikk her for å laste ned heftet

Spillteori
Spillteori er et effektivt verktøy for å analyse av strategisk adferd. Spillteori baserer seg på at
bevisste aktører forstår at de er i en situasjon der de gjensidig påvirker hverandre gjennom
sine handlinger og strategier. Aktørene vet også at alle er klar over denne gjensidige
avhengigheten, og alle vet at alle har den samme informasjonen og tenker på samme måte.
Vi skal kun se på en verden bestående av to aktører og vi antar at begge aktørene handler
rasjonelt og er profittmaksimerende av natur. I et spill får aktørene valg mellom to eller flere
strategier, der hver strategikombinasjon gir et utbytte for aktørene.
Vi skiller mellom statiske spill der valgene skjer samtidig (eller uten at aktørene vet om
hverandre) og dynamiske spill der en aktør velger etter den andre.
Aktørene vil tilpasse seg i Nash-likevekten(e). I en Nash-likevekt ønsker ingen av aktørene å
endre sin egen strategi, gitt motspillernes strategi. Dvs at ingen spiller vil komme bedre ut ved
å gjøre noe annet enn det de gjør (ingen angrer i etterkant). Dersom Nash-likevekten(e) er den
løsningen som totalt sett gir det beste utfallet for begge parter, kalles likevekten
paretooptimal.
En aktør sies a ha en dominant strategi dersom aktøren kommer best ut ved å velge denne
strategien uavhengig av hva den andre aktøren gjør. Vi snakker også om svakt dominerende
og svakt dominerte strategier dersom det kan tenkes tilfeller der strategiene er like gode, men
den dominerende aldri er dårligere. Dersom alle aktørene i spillet har en dominant strategi vil
spillet ha en entydig Nash-likevekt.
© Talsnes ONE - 995850168 | Enhver form for mangfoldiggjørelse av hele eller deler av innholdet av dette
materiale er i henhold til norsk lov om opphavsrett, og er ikke tillatt uten tillatelse fra Talsnes ONE.
Hva skal til for å lage en spillteoretisk modell?
-
En fast mengde spillere (aktører)
-
En fast mengde mulige handlinger for hver spiller, og en fast mengde mulige strategier.
-
En fast bestemt trekkrekkefølge
-
En fastlagt informasjonsstruktur (det skal være kjent hvem som vet hva)
-
Kjente sammenhenger mellom spillernes strategier og de forskjellige utfall. Altså, hvis A
velger strategi α og B velger strategi β, så vet både A og B hvilke konsekvenser dette har.
-
Alle spillerne har preferanser over mulige utfall (f.eks. maksimere nytte eller profitt)
-
Alle spillerne kjenner til punktene 1, …,6 og alle vet at de andre spillerne også kjenner til
punktene 1, …,6.
Når alle punktene over er tilfredsstilt, har vi et spill. Hvordan ulike spill skal analyseres og
presenteres avhenger av klassifiseringen:
-
Antall mulige deltakere
(i)
(ii)
-
Grad av konflikt
(i)
(ii)
-
Nullsumspill: Diamentralt motsatte preferanser (det den ene vinner, taper den andre)
Variabelsumspill: Mer eller mindre sammenfallende preferanser
Grad av mulig samarbeid
(i)
(ii)
-
To deltakere
Flere enn to deltakere
Ikke-kooperative spill: beslutningen om strategivalg må skje uavhengig av hverandre
kooperative spill: samarbeid er mulig
Tidsrekkefølge
(i)
(ii)
Simultane trekk: Samtidige handlinger
Sekvensielle trekk: Handlingene foregår i en bestemt rekkefølge
© Talsnes ONE - 995850168 | Enhver form for mangfoldiggjørelse av hele eller deler av innholdet av dette
materiale er i henhold til norsk lov om opphavsrett, og er ikke tillatt uten tillatelse fra Talsnes ONE.
Fangens dilemma
Fangenes dilemma er kanskje det mest kjente av alle spill. Bakgrunnen for spillet er en tenkt
situasjon med to kriminelle som har samarbeidet om en kriminell handling, der begge blir tatt
inn til separate avhør. Dersom bare en tilstår, vil han slippe fri, mens den som ikke tilstår vil få
lang fengselsstraff. I dette spillet vil det være rasjonelt for begge fangene å tilstå (dominant
strategi for begge parter å tilstå), selv om resultatet ville vært bedre om begge nektet.
Spillets mulige utfall kan presenteres i form av en spillmatrise. Dette kalles ofte for spillet på
normalform. Her blir spillet beskrevet ved å vise strategimulighetene og "payoff-muligheten"
for den enkelte spiller.
Antall år i fengsel hver fange får avhenger av om de tilstår eller ikke. Et mulig tilfelle kan
eksempelvis være som i tabellen under, der tallet til venstre er "profitten" til fange 1, og tallet
til høyre er "profitten" for fange 2. (-10,0) betyr for eksempel at fange 1 får 10 års fengsel,
mens fange 1 får gå fri (0 år i fengsel).
Fange 2
Fange 1
Tilstå (T)
Ikke tilstå (IT)
Tilstå (T)
(-5 , -5)
(0 , -10)
Ikke tilstå (IT)
(-10 , 0)
(-1 , -1)
Vi kan finne Nash-likevekten ved å undersøke hvilken strategi hver av aktørene vil velge
avhengig av motpartens valg:
- For fange 1:
Hvis fange 2 velger T --> velg T (-5 er bedre enn -10)
Hvis fange 2 velger IT --> velg T (0 er vedre enn -1)
- For fange 2:
Hvis fange 1 velger T --> velg T (-5 er bedre enn -10)
Hvis fange 1 velger IT --> velg T (0 er bedre enn -1)
© Talsnes ONE - 995850168 | Enhver form for mangfoldiggjørelse av hele eller deler av innholdet av dette
materiale er i henhold til norsk lov om opphavsrett, og er ikke tillatt uten tillatelse fra Talsnes ONE.
Vi ser at den eneste Nash-likevekten er kombinasjonen (-5 , -5), dvs at begge tilstår. Dette er til
tross for at begge ville kommet bedre ut dersom begge valgte å ikke tilstå (-1 er bedre enn -5).
En slik løsning er derfor ikke pareto-optimal. Vi legger også merke til at det som er best å velge
for fange 1, ikke avhenger av det fange 2 måtte velge. Fange 1 velger å tilstå uansett hva fange
2 velger å gjøre. Det samme gjelder for fange 2. Fange 1 og 2 har derfor begge dominante
strategier. Det at begge aktører har dominante strategier og Nash-likevekten vi får er dårlig for
begge parter, gjør dette til et fangens dilemma spill.
Et spill der begge aktører har dominante strategier (slik som i eksempelet over) vil alltid gi
Nash-likevekt. Nash-likevekt krever likevel ikke dominante strategier hos begge aktører.
Vi kan tenke oss to produsenter som produserer samme vare. Anta at profitten de oppnår
avhenger av om de samarbeider eller fører priskrig. Profitten for en bestemt aktør avhenger
av om den andre velger å samarbeide eller ikke. Tabellen nedenfor viser payoff-mulighetene
til begge aktører. Tallet til venstre er profitten for aktør A, og tallet til høyre er profitten for
aktør B.
Aktør B
Samarbeid
Priskrig
Aktør A
Samarbeid
(40 , 30)
(10 , 50)
Priskrig
(35 , 15)
(15 , 20)
I dette tilfellet eksisterer det ingen dominant strategi for aktør A. Aktør B har imidlertid en
dominant strategi og vil alltid velge priskrig. Dersom A velger samarbeid, vil det beste for B
være å velge priskrig (50 > 30). Dersom A velger priskrig, vil det beste for B være å velge
priskrig igjen (20 > 15). Nash-likevekt oppnås ved at begge aktørene velger priskrig (15, 20). A
vet at priskrig er en dominant strategi for B og vil derfor velge mellom å få 10 (samarbeid) eller
15 (priskrig). B velger derfor også priskrig siden 15 > 10. Nash-likevekt oppnås derfor ved (15,
20).
© Talsnes ONE - 995850168 | Enhver form for mangfoldiggjørelse av hele eller deler av innholdet av dette
materiale er i henhold til norsk lov om opphavsrett, og er ikke tillatt uten tillatelse fra Talsnes ONE.
Gitt et vilkårlig spill, kan det være ingen Nash-likevekt, én entydig Nash-likevekt eller flere
Nash-likevekter. Eksempler:
Ingen Nash-likevekt
én entydig Nash-likevekt
To Nash-likevekter
Nash-likevekten er (α2 , β2)
Nash-likevektene er
(α2 , β1) og (α1 , β2)
Dynamiske spill
Vi har hittil kun sett på ikke-kooperative spill med simultane trekk og én periode. Vi skal nå se
på eksempler på spill med sekvensielle trekk. Når vi snakker om spill som varer over flere
perioder er det mer praktisk å presentere spillet på ekstensiv form, dvs. ved hjelp av et spilltre.
Hensikten er å få synliggjort at eksemplet består av en sekvens av handlinger.
Når vi har sekvensielle trekk (en aktør velger før den andre) kalles Nash-likevekten for
delspillperfekt likevekt (dersom den er en Nash-likevekt i alle delspill). I denne likevekten vil
ingen spiller komme bedre ut, sett fra spillets start, ved å endre sin strategi.
Anta at vi har et spill mellom to aktører, A og B, som hver kan velge mellom to strategier. α1 og
α2 for A, og β1 og β2 for B. På normalform kan spillet presenteres på følgende måte:
© Talsnes ONE - 995850168 | Enhver form for mangfoldiggjørelse av hele eller deler av innholdet av dette
materiale er i henhold til norsk lov om opphavsrett, og er ikke tillatt uten tillatelse fra Talsnes ONE.
I tilfellet der A velger strategi først, får vi følgende spilltre (ekstensiv form):
A
α2
α1
B
β1
(α1,β1)
)
B
β2
β1
(α1,β2) (α2,β1)
β2
(α2,β2)
Tiden går ovenfra og nedover, dvs at vi starter fra toppen. Først velger A mellom α1 og α2 før B
velger mellom β1 og β2.
Vi skal nå se på et spill uten dominante strategier og der det ikke eksisterer noen likevekter
ved simultane trekk, mens en omgjøring til sekvensielle trekk fører til entydig delspillperfekt
likevekt. Eksempel:
Ingen av aktørene har dominante strategier og det eksisterer ingen Nash-likevekt.
Dersom vi har sekvensielle trekk og antar at A trekker først vil spillet se slik ut:
© Talsnes ONE - 995850168 | Enhver form for mangfoldiggjørelse av hele eller deler av innholdet av dette
materiale er i henhold til norsk lov om opphavsrett, og er ikke tillatt uten tillatelse fra Talsnes ONE.
Måten for å løse slike spill (finne alle delspillperfekte likevekter) kalles for baklengs induksjon.
Før spiller A velger sin strategi må han/hun se på utfallene av spillet for så å bevege seg
"bakover". Først av alt er det interessant for A å vite hva B kommer til å velge i de to mulige
situasjonene. Dersom A velger α1, kan B få 5 ved å velge β1 eller 3 ved å velge β2. Vi ser at B får
høyest gevinst ved å velge β1 og vet derfor at B vil velge β1 dersom A velger α1. Vi ser at denne
strategien vil ha verdien 2 for A. Gjør vi det samme med strategi α2 ser vi at B foretrekker
strategi β2 (4 > 2). Dette gir en verdi på 3 for A. Nå er A klar til å velge sin strategi og kan i
realiteten velge mellom en gevinst på 2 (α1) eller 3 (α2). Spiller A velger derfor strategi α2 og
spiller B vil velge β2 --> Delspillperfekt likevekt: (α2 , β2) = (3 , 4)
Det kan vises at dersom B hadde fått lov til å velge først, ville likevekten blitt endret til
(α1 , β2) = (5 , 3)
© Talsnes ONE - 995850168 | Enhver form for mangfoldiggjørelse av hele eller deler av innholdet av dette
materiale er i henhold til norsk lov om opphavsrett, og er ikke tillatt uten tillatelse fra Talsnes ONE.