Transcript Teoria gier

TEORIA GIER
Gra




to dowolna sytuacja konfliktowa,
gracz natomiast to dowolny jej uczestnik
każda strona wybiera pewną strategię postępowania,
po czym zależnie od strategii własnej oraz innych
uczestników każdy gracz otrzymuje wypłatę w
jednostkach użyteczności (pieniądze, wzrost szansy na
przekazanie własnych genów czy też cokolwiek innego,
z czystą satysfakcją włącznie)
wynikowi gry zwykle przyporządkowuje się pewną
wartość liczbową.
15/04/13

istota tej gry nie polega na próbie
odgadnięcia intencji gracza, lecz na
skrywaniu własnych zamiarów.

Podstawowym założeniem teorii gier jest
racjonalne działanie wszystkich podmiotów
decyzyjnych (graczy).
15/04/13
Aby dana sytuacja mogła być nazwana grą, musi spełniać
następujące warunki:





istnieje skończona liczba uczestników,
każdy uczestnik posiada skończoną liczbę
sposobów działania (strategii),
uczestnik, który chce posłużyć się teorią gier,
musi znać wszystkie dostępne pozostałym
graczom strategie, lecz nie może wiedzieć, która z
nich będzie obrana,
wygrana każdego uczestnika zależy zarówno od
działania pozostałych graczy, jak i od jego
własnego działania,
wszystkie możliwe wyniki są mierzalne.
15/04/13
Teoria gier

to dział matematyki zajmujący się badaniem
optymalnego zachowania w przypadku
konfliktu interesów
15/04/13
15/04/13
Badania w zakresie teorii gier i jej zastosowań
wielokrotnie zostały uznane przez Komitet Nagrody
Nobla

1978 Herbert Simon
– za wkład w rozwój ewolucyjnej teorii gier, w
szczególności za koncepcję ograniczonej
racjonalności.
– Komitet nagrody określił te rezultaty jako
przełomowe badania nad procesem
podejmowania decyzji wewnątrz organizacji
gospodarczych oraz teorię ich podejmowania.
15/04/13

1994 John Nash, Reinhard Selten i John
Harsanyi
– za rozwój teorii gier i jej zastosowania w
ekonomii.

1996 William Vickrey i James Mirrlees
– za stworzenie modeli przetargów i badanie
konfliktów z niesymetryczną informacją
uczestników.
15/04/13

2005 Thomas C. Schelling i Robert J. Aumann
– za zastosowanie teorii gier w naukach społecznych i
mikroekonomii (dot. zachowania jednostek i
rozwiązywania konfliktów) . Ich teoria pozwoliła
zastosować teorię gier – lub teorię decyzji interaktywnej –
do poszukiwania odpowiedzi na pytanie, dlaczego
niektóre grupy, organizacje i kraje odnoszą sukcesy we
współpracy, natomiast inne popadają w konflikty.
– Thomas Schelling stosował teorię gier do analizy
negocjacji międzynarodowych w okresie "zimnej wojny".
Analizował takie zagadnienia, jak: polityka wzajemnych
ustępstw, gróźb, zastraszania.
– Aumann użył teorii gier by zanalizować Talmud. Między
innymi rozwiązał starą tajemnicę "podziału spadku
zmarłego męża pomiędzy jego trzy żony". Rozwiązaniem
było podanie zmniejszenia wartości spadku (porównanego
do jego pierwotnej wartości).
15/04/13

2007 Leonid Hurwicz, Eric S. Maskin, Roger B.
Myerson
– za prace nad teorią wdrażającą systemy matematyczne
w procesy gospodarcze, która przy zastosowaniu
równań matematycznych i algorytmów pozwala ocenić
prawidłowość funkcjonowania rynków.
– Teoria ta pomogła określić ekonomistom skuteczne
mechanizmy rynkowe, schematy regulacji i procedury
wyborów i dziś odgrywa główną rolę w wielu
dziedzinach ekonomii oraz w naukach politycznych.
15/04/13
Zalety teorii gier:

pozwala ustrukturyzować proces decyzyjny i wyznaczyć
racjonalne rozwiązanie.

możliwość wyznaczenia dobrego rozwiązania zależy
jednak od tego, jak dobrą informacją dysponuje dany
podmiot.

bada jakie strategie powinni wybrać gracze żeby osiągnąć
najlepsze wyniki.
15/04/13
Gry ze względu na wartość dzielą się na:

gry o sumie stałej (zysk jednego gracza
jest równoważny stracie drugiego) i na
gry o sumie zmiennej

gry sprawiedliwe (gdy wartość
oczekiwana wypłaty każdego z graczy
jest taka sama) oraz gry niesprawiedliwe
15/04/13
Gra w kasynie

uznając za wypłatę sumę pieniężną, jest
grą o sumie zerowej (wygrana gracza to
strata kasyna, i na odwrót; nie
rozpatrujemy tu zadowolenia z samego
faktu gry), jednakże nie jest ona grą
sprawiedliwą (z przyczyn oczywistych
prawdopodobieństwa wygranej są dla
gracza niekorzystne, a wartość
oczekiwana wygranej pieniężnej ujemna).
15/04/13
Gry
W zależności od liczby tych przeciwników i
ich interesów rozróżniamy różne rodzaje
gier, na przykład:
 gry dwuosobowe,
 gry wieloosobowe,
 gry koalicyjne.
15/04/13
Macierz wypłat

jest tablicą, która przedstawia kwoty otrzymane
przez gracza wymienionego po lewej stronie tej
tablicy po wszystkich możliwych partiach gry.
Wypłat dokonuje gracz wymieniony u góry tablicy
macierz ta składa się z tylu kolumn, ile jest
wszystkich możliwych sposobów działania gracza
zamieszczonego u góry tablicy, i z tylu wierszy,
ile jest wszystkich możliwych sposobów działania
gracza zamieszczonego po lewej stronie tablicy).
15/04/13
Przykład normalnej formy macierzy wypłat dla gry
dwuosobowej i dwóch możliwych strategii
Gracz 2 wybiera lewą
kolumnę
Gracz 2 wybiera prawą
kolumnę
Gracz 1 wybiera górny
wiersz
4, 3
-1, -1
Gracz 1 wybiera dolny
wiersz
0, 0
3, 4
15/04/13
Historycznym przykładem gry
niekooperacyjnej jest dylemat więźnia.
Problem decyzji aresztowanego A
Działania
A
Działania B
Nie przyznawać się
wsypać kompana
Nie przyznawać się
1 rok
10 lat
Wsypać kompana
0 lat
5 lat
Problem decyzji aresztowanego B
Działania B
Działania A
Nie przyznawać się
wsypać kompana
Nie przyznawać się
1 rok
10 lat
Wsypać kompana
0 lat
5 lat
Gra dwuosobowa aresztowanych
Działania A
Nie przyznawać się
Wsypać kompana
15/04/13
Działania B
Nie przyznawać się
wsypać kompana
1 rok
1 rok
10 lat
0 lat
0 lat
10 lat
5 lat
5 lat
Gra dwuosobowa o sumie zero

Grami dwuosobowymi o sumie zero są
takie sytuacje, gdy w grze biorą udział tylko
dwie strony, a przegrane jednej ze stron
są wygranymi drugiej.
15/04/13
Macierz wypłat
s1 s 2 ... s n
 a11

aij    ....
am1
15/04/13
a12 ... a1n  d1

.... ... .... ....

am 2 ... amn d m
Przykład
Dwie konkurencyjne firmy Alfa i Beta są dealerami dobrze
znanej marki odbiorników telewizyjnych. Roczne zyski
tych dwóch firm wynoszą odpowiednio 4 i 8 mln zł.
 Alfa chce rozszerzyć swoją działalność i otworzyć zakład
montażu odbiorników zakładając, że przyniesie to jej
roczny zysk równy 10 mln zł. Oczekuje przy tym, że firma
Beta będzie kontynuować swoją działalność bez
podejmowania montażu odbiorników u siebie. Jednakże
szef firmy Beta usłyszał o planach firmy Alfa i obliczył, że
jeśli plany firmy Alfa będą urzeczywistnione, to zyski
firmy Beta spadną do 2 mln zł.
 Natomiast jeśli Beta uruchomi zakład montażu, a Alfa nie
zrobi tego, to zysk firmy Beta wzrośnie do 11 mln zł, a
zysk firmy Alfa spadnie do 1 mln zł.
 Gdyby obydwie firmy uruchomiły zakłady montażu, to
wtedy obie zarobiłyby po 6 mln zł na rok.
 Jaką strategię powinna wybrać firma Alfa, a jaką Beta, aby
zyski ich były możliwie jak największe?
15/04/13

Macierz
Strategie firmy Beta
Strategie
firmy Alfa
15/04/13
Kontynuowanie
sprzedaży
Uruchomienie
zakładu
montażu
odbiorników
telewizyjnych
Kontynuowani
e sprzedaży
0
-3
Uruchomienie
zakładu
montażu
odbiorników
telewizyjnych
6
2
Gra jest rozwiązana, gdy wyznaczymy:



wartość gry,
strategię, którą ma zastosować gracz
umieszczony w macierzy wypłat po lewej
stronie, aby zapewnić sobie średnią wygraną
na partię co najmniej równą wartości gry,
strategię, którą ma zastosować gracz
umieszczony w górnej części macierzy
wypłat, aby średnia przegrana na partię nie
była większa niż wartość gry.
15/04/13
Strategie firmy Beta
Strategie firmy
Alfa
15/04/13
Kontynuowanie
sprzedaży
Uruchomienie
zakładu
montażu
odbiorników
telewizyjnych
Najmniejsze
wartości w
wierszach
Min aij
Kontynuowanie
sprzedaży
0
-3
-3
Uruchomienie
zakładu montażu
odbiorników
telewizyjnych
6
2
2
Max (Min aij)
Największe
wartości w
kolumnach
Max aij
6
2
Min (Max aij)
dr inż. Iwona Staniec
strategia zdominowana

występuje, kiedy gracz posiada strategię dającą
mu wyższą wypłatę bez względu na to, jak zagra
konkurent.
15/04/13
Strategia dominująca


to najlepsza możliwa reakcja na dowolną
strategię zastosowaną przez konkurenta.
Jej logika nieuchronnie prowadzi do
pogorszenia wyniku, gdy gra ma charakter
niekooperacyjny.
15/04/13
Punkt siodłowy




gra posiada punkt siodłowy, jeżeli każdy z graczy
podczas całej gry stosuje tylko jeden sposób
działania.
Punktem siodłowym jest punkt w macierzy wypłat
znajdujący się na przecięciu tych dwóch
sposobów działania, natomiast wypłata w tym
punkcie stanowi wartość gry
V = VA =Max (Min aij) = VB=Min (Max aij)
Wartość gry jest średnią kwotą przypadającą na
partię, którą wygrałby w długim okresie jeden z
graczy, gdyby obaj stosowali swe najlepsze strategie.
15/04/13
KRYTERIA WYBORU DECYZJI W
WARUNKACH NIEPEWNOŚCI

Kryteria nieprobabilistyczne

Kryteria probabilistyczne
15/04/13
dr inż. Iwona Staniec
Kryteria nieprobabilistyczne
MaxiMin
Pesymista (asekurant) określa dla
każdej swojej decyzji najgorszy możliwy
p
w
wynik (minimalna wypłatę) i ,
a następnie wybiera taką decyzję dk ,
dla której określona minimalna
(gwarantowana) wypłata jest
największa.
dk :w  max{w },
p
k
15/04/13
p
i
wip  min
{aij }
j
dr inż. Iwona Staniec
Kryteria nieprobabilistyczne MaxiMax
Optymista (ryzykant) określa dla każdej
swojej decyzji najwyższy możliwy wynik
o
(maksymalną wypłatę) wi , a następnie
wybiera taka decyzję dk , dla której tak
określona maksymalna (ale nie
gwarantowana) wypłata jest największa.
d k :w  max {w },
o
k
15/04/13
i
o
i
wio  max {aij }
j
dr inż. Iwona Staniec
Kryteria nieprobabilistyczne kryterium
Hurwicza
Reguła
Hurwicza
przyporządkowuje
di indeks h(di ) , który
każdej decyzji
jest ważoną przeciętną minimalnej
i maksymalnej wypłaty wynikającej
z decyzji. Wybierana jest strategia,
której odpowiada maksymalna wartość h()
Oznaczmy przez  - skłonność do bycia
pesymistą przy wyborze strategii i [0,1]
15/04/13
dr inż. Iwona Staniec
Kryteria nieprobabilistyczne kryterium
Hurwicza
Dla każdej decyzji di wyznaczamy
hipotetyczną wygraną h(di ) postaci:
h(di )  wip  (1   )wio
Należy wybrać taką decyzję, dla której
hipotetyczna wygrana h(di ) jest największa
d k :h(d k )  max {h(di )}
i
15/04/13
dr inż. Iwona Staniec
Macierz"żalu"
Macierz wypłat aij  transformujemy do
postaci macierzy "żalu" .rij 
W tym celu: określamy maksymalną wypłatę
{aij }
dla każdego "stanu natury" a j  max
i
w dalszym postępowaniu obliczamy wartości
elementów rij według wzoru: rij  a j  aij
Elementy macierzy "żalu" wyrażają stratę
z powodu podjęcia decyzji nieoptymalnej
z punktu widzenia zaistniałego stanu natury.
15/04/13
dr inż. Iwona Staniec
Kryteria nieprobabilistyczne Minimax
"żalu"
Do macierzy "żalu" stosujemy postępowanie
według reguły MinMax, tzn. wskazujemy
decyzję, dla której największa strata ("żal")
z powodu źle podjętej decyzji będzie
możliwie najmniejsza, czyli
d k :rk  min {ri },
i
15/04/13
rj  max {rij }
j
dr inż. Iwona Staniec
Kryteria probabilistyczne
Maksymalna oczekiwana wygrana
P( s j )
Wybieramy taką decyzję, dla której wartość
oczekiwanej wygranej (zysku) będzie
największa, tj.
d k :E  max{E }
a
k
15/04/13
i
a
i
Eia   P(s j )aij
j
dr inż. Iwona Staniec
Kryteria probabilistyczne Minimalny
oczekiwany "żal" (strata)

Wybieramy taką decyzję, dla której wartość
oczekiwanej straty ("żalu") będzie
najmniejsza, tj.
r
r
Eir   P(s j )rij
d k :Ek  min {Ei }
i
j
15/04/13
dr inż. Iwona Staniec
W zarządzaniu działalnością gospodarczą wynik decyzji jest zwykle
rozpatrywany z punktu widzenia rentowności danego przedsięwzięcia,
a poszczególne stany natury są wyrażane w postaci efektów
finansowych wynikających z różnych wyników podjętej decyzji. W
takiej sytuacji wartość oczekiwana ma wymiar finansowy i stąd
nazywamy ją oczekiwanym efektem finansowym.
Parametr ten często oznacza się angielskim skrótem EMV (Expected
Monetary Value) i oblicza się dla każdej strategii według równania:
n
EMV  V j Pj
j 1
gdzie:
- efekt finansowy j-tego stanu natury (wartości dodatnie dla zysku,
wartości ujemne dla strat),
P
- prawdopodobieństwo uzyskania j-tego efektu finansowego.
Vj
j
15/04/13
dr inż. Iwona Staniec
Przykład
Przedsiębiorstwo ma możliwość uruchomienia produkcji i sprzedaży produktu
luksusowego lub produktu popularnego. Dla każdej opcji decyzyjnej określono
- na podstawie prognoz i analiz danych statystycznych - prawdopodobieństwa
uzyskania sprzedaży dobrej, średniej i miernej oraz efekty finansowe tych
wyników.
Dla produktu luksusowego prawdopodobieństwo wystąpienia dobrej sprzedaży (z
której dochody wyniosą 120000 zł) wynosi 0,4, sprzedaży średniej (o
dochodzie 65 000 zł) - 0,3 oraz sprzedaży miernej (dochód 12 000 zł) - 0,3.
Analogicznie dla produktu popularnego - prawdopodobieństwo dobrej sprzedaży
wynosi 0,5 (dochód 105 000 zł), sprzedaży średniej - 0,4 (dochód 55 000 zł) i
sprzedaży miernej - 0,1 (dochód tylko 20000 zł).
Oceń, która z opcji decyzyjnych dotycząca wyboru nowej produkcji jest bardziej
opłacalna dla przedsiębiorstwa.
15/04/13
dr inż. Iwona Staniec
Rozwiązanie
Obliczamy wartość oczekiwaną dochodu dla produktu luksusowego (PL):
EMV(PL) = 0,4*120000 + 0,3*65000 + 0,3*12000 = 71100 zł.
Tak więc wartość oczekiwana dla PL wynosi 71 100 zł.
Podobnie liczymy dla produktu popularnego (PP):
EMV(PP) = 0,5*105000 + 0,4*55000 + 0,1*10000 = 75500 zł.
Z porównania wartości EMV(PL) i EMV(PP) wynika, że korzystniejszą
opcją decyzyjną jest wprowadzenie na rynek produktu popularnego.
15/04/13
dr inż. Iwona Staniec
15/04/13
dr inż. Iwona Staniec


STRATEGIA CZYSTA gracz wybiera
jedna konkretną strategię
STRATEGIA MIESZANA gracz wybiera z
określonym prawdopodobieństwem jedną z
kilku strategii
15/04/13
Gra 3 o sumie nie zerowej
F
I
R 1
M
A
15/04/13
F I R MA 2
oszustwo uczciwość
oszustwo
2
2
3,5 1,5
uczciwość
1,5
3,5
3
3
4
3.5
UO
3
UU
firma 2
2.5
2
OO
1.5
OU
1
0.5
0
0
15/04/13
0.5
1
1.5
2
firma 1
2.5
3
3.5
4
Pretooptymalny


Wynik gry jest nieooptymalny w sensie
Pareto jeżeli gra ma inny możliwy wynik
dający oby graczom co najwyżej nie gorsze
wygrane
Kryterium Pareto jest podstawową zasada
racjonalności grupowej (wchodzi w konflikt
z zasadą racjonalności indywidualnej)
15/04/13