Wykład 4 - Wydział Zarządzania

Download Report

Transcript Wykład 4 - Wydział Zarządzania

D. Ciołek
BADANIA OPERACYJNE – wykład 4
BADANIA OPERACYJNE
Wykład 4: Podstawy teorii gier.
dr Dorota Ciołek
Katedra Ekonometrii
Wydział Zarządzania UG
http://wzr.pl/dc
D. Ciołek
BADANIA OPERACYJNE – wykład 4
Podstawowe pojęcia
Z „grą” mamy do czynienia wtedy, gdy musimy podjąć pewną decyzję
nie znając wszystkich czynników, przy czym wynik zależy nie tylko
od naszej decyzji, ale od decyzji innych osób lub też od
zachowania się czynników niekontrolowanych.
Sytuacja do której można zastosować teorię gier strategicznych:

skończona liczba uczestników, zarówno zainteresowanych jak i
niezainteresowanych,

każdy uczestnik dysponuje skończoną liczbą sposobów działania,

każdy z uczestników zna wszystkie możliwe sposoby działania
innych uczestników, nie wie jednak, które z nich zostaną wybrane,

każdej kombinacji sposobów działania wszystkich uczestników
odpowiada określona korzyść,

korzyść (wygrana) uczestnika zależy zarówno od jego działania jak
i od działań wszystkich pozostałych,

wszystkie możliwe wyniki podjętych decyzji dają się wyliczyć.
Sytuację spełniającą powyższe warunki można nazwać grą.
D. Ciołek
BADANIA OPERACYJNE – wykład 4
Podstawowe pojęcia

Graczem nazywamy każdą zainteresowaną stronę.

Gry o sumie zero to takie gry, w których algebraiczna
suma wygranych vi jest równa zeru:
n
 vi  0
i 1

Gry dwuosobowe o sumie zero to takie gry, w których udział
biorą tylko dwie strony, a suma wygranych obu graczy
równa się zeru.

Partia to jednokrotny wybór sposobu działania przez
wszystkich graczy.

Strategia to reguła podejmowania decyzji, określająca
sposób działania gracza.
D. Ciołek
BADANIA OPERACYJNE – wykład 4
Podstawowe pojęcia

Strategia mieszana polega na zastosowaniu wszystkich
lub niektórych sposobów działania w pewnej ustalonej
proporcji.

Jeśli gracz postanawia zastosować tylko jeden sposób
działania, mówimy, że stosuje on strategią czystą.

Wartość gry to przeciętna kwota, którą gracz mógłby
wygrać w ciągu wielu powtarzanych partii, jeżeli wszyscy
gracze stosują optymalne strategie.

Macierz wypłat (korzyści) to tabela określająca wygrane
gracza G1 przy wszystkich możliwych sposobach działania
obydwu graczy. Wartość liczbowa aij określona wyborem
graczy, reprezentuje kwotę, którą gracz G2 powinien
przekazać swojemu przeciwnikowi - graczowi G1.
D. Ciołek
BADANIA OPERACYJNE – wykład 4
Definicje
Rozwiązanie gry wymaga określenia:

wartości gry (v),

strategii gracza G1 zapewniającej, że przeciętna wygrana w
grze jest co najmniej równa wartości gry,

strategii gracza G2 zapewniającej, że przeciętna przegrana
w grze jest co najwyżej równa wartości gry.
Definicja 1
Mówimy, że określona jest gra macierzowa, jeżeli dana jest
macierz wypłat A = [aij] o wymiarze m × n, gdzie aij –
dowolne liczby rzeczywiste, aij oznacza wypłatę gracza G2
na rzecz gracza G1 przy wyborze odpowiednich sposobów
działania, tzn. gracz G1 wybiera wiersz „i”, a gracz G2 –
kolumnę „j” w macierzy wypłat.
D. Ciołek
BADANIA OPERACYJNE – wykład 4
Definicje
Definicja 2
Przez strategię mieszaną gracza G1 rozumiemy wektor
wierszowy x = [x1, x2, ・ ・ ・ , xm] nieujemnych liczb xi
takich, że:
xi  0,
m
 xi  1,
i  1,2,...,m
i 1
Definicja 3
Przez strategię mieszaną gracza G2 rozumiemy wektor
kolumnowy u, o elementach uj takich, że:
u j  0,
n
 u j  1,
j 1
j  1,2,...,n
D. Ciołek
BADANIA OPERACYJNE – wykład 4
Definicje
Definicja 4
Strategia mieszana, której k-ty element jest równy jeden, a
pozostałe są równe zeru, jest k-tą strategią czystą gracza.
Definicja 5
Jeżeli rozwiązanie gry wymaga, aby każdy z graczy stosował
tylko jeden ze sposobów działania, to grę taką nazywamy grą
z punktem siodłowym.
Definicja 6
Punkt siodłowy to taki punkt w macierzy wypłat, dla którego:

v
max
a
min
ij max min aij
j
j
i
i
gdzie minj maxi aij = v2 to górna wartość, a maxi minj aij = v1
dolna wartość gry.
D. Ciołek
BADANIA OPERACYJNE – wykład 4
Definicje
Twierdzenie von Neumanna I:
Jeżeli w macierzy wypłat gry istnieje punkt siodłowy to czyste
strategie minimaksowe są optymalne.
Jeżeli w macierzy wypłat gry nie istnieje punkt siodłowy, to
zachodzi:
v1 < v < v2 .
Definicja 7
Funkcję wypłaty gracza G1 definiujemy jako:
m
n
F x u  x  A  u    xi  aij  u j
i 1 j 1
Funkcja wypłaty określa oczekiwaną wartość wygranej gracza
G1 w jednej partii przy wielokrotnym podejmowaniu decyzji
w sposób losowy.
D. Ciołek
BADANIA OPERACYJNE – wykład 4
Definicje
Twierdzenie von Neumanna II
Niech x, u oznaczają mieszane strategie optymalne.
Można wykazać, że dla mieszanych strategii optymalnych
zachodzi:
F xu   F xu   F xu
 
Ponieważ F xu  v , to oznacza, że funkcja wypłaty gracza
G1 dla mieszanych strategii optymalnych jest równa
wartości gry.
D. Ciołek
BADANIA OPERACYJNE – wykład 4
Definicje
Definicja 8 reguła dominacji
Jeżeli wszystkie elementy pewnej kolumny w macierzy wypłat
są większe lub równe odpowiednim elementom innej
kolumny, to pierwszą z nich nazywamy kolumną
zdominowaną.
Jeżeli wszystkie elementy pewnego wiersza są mniejsze lub
równe odpowiednim elementom innego wiersza, to pierwszy
z nich nazywamy wierszem zdominowanym.
Zdominowane wiersze lub kolumny usuwamy z macierzy
wypłat, co oznacza, że dane sposoby działania będą
stosowane z prawdopodobieństwem zero.
D. Ciołek
BADANIA OPERACYJNE – wykład 4
Przykład 1
Dwóch graczy rozgrywa następującą grę. Każdy gracz wybiera
niezależnie od drugiego gracza, jeden z trzech kolorów:
biały (B), czarny (C) lub zielony (Z). Po niezależnym
dokonaniu wyboru koloru przez obu graczy porównuje się
wybrane kolory. Jeżeli obaj gracze wybrali biały, nikt nie
wygrywa, jeżeli gracz G1 wybrał biały, a gracz G2 czarny,
gracz G1 przegrywa 1 punkt.
Wszystkie możliwe wyniki zawarte są w tablicy.
B
C
Z
B
0
-1
6
C
2
4
5
Z
1
-2
8
Maksimum
Minimum
D. Ciołek
BADANIA OPERACYJNE – wykład 4
Przykład 2
Należy rozwiązać grę dwuosobową o sumie zero, gdzie
symbolami A i B oznaczono obu graczy, a wektory X i Y
oznaczają odpowiednio strategie gracz A i B.
Wszystkie możliwe wyniki zawarte są w tablicy.
Y1
Y2
Y3
X1
2
4
6
X2
3
1
4
X3
2
3
3
Maksimum
Minimum
D. Ciołek
BADANIA OPERACYJNE – wykład 4
Algorytm rozwiązywania gry
Algorytm postępowania:

czy w macierzy wypłat występuje punkt siodłowy, jeżeli tak
– to czyste strategie minimaksowe są optymalne.

czy występują wiersze lub kolumny zdominowane, jeżeli tak
to usuwamy je z macierzy wypłat.

sprawdzić, w jakim przedziale znajduje się wartość gry,
zapewnić jej nieujemność, poprzez przekształcenie macierzy
A na macierz:
A′ = A + |v1|
D. Ciołek
BADANIA OPERACYJNE – wykład 4
Zastosowanie programowania liniowego
Każdą grę dwuosobową o sumie zero, można przedstawić w
postaci dwóch modeli programowania liniowego:
Dla gracza G1:
Dla gracza G2:
znaleźć taki nieujemny
znaleźć taki nieujemny
wektor x, który:
wektor u, który:
W x u  v  max
W x u  v  min
n
m
p.w.
 aij xi  v
p.w.
j 1
i 1
m
 xi  1
i 1
Oba modele są wobec siebie dualne.
 a ij u j  v
n
u j 1
j 1
D. Ciołek
BADANIA OPERACYJNE – wykład 4
Przykład 3
Każdy z graczy wybiera liczbę ze zbioru {1, 2, 3}. Gracz, który
wybrał mniejszą liczbę wygrywa 2 punkty z wyjątkiem
przypadku, gdy jego liczba jest dokładnie mniejsza o jeden,
wtedy przegrywa 4 punkty. Jeżeli liczby są równe nikt nie
wygrywa. Wszystkie możliwe wyniki zawarte są w tablicy.
„1” „2” „3”
„1”
0
-4
2
„2”
4
0
-4
„3”
-2
4
0
Maksimum
Minimum
D. Ciołek
BADANIA OPERACYJNE – wykład 4
Czym jest gra?
Teoria gier:
– teoria podejmowania decyzji w warunkach interaktywnych
(gry strategicznej)
- matematyczna teoria sytuacji konfliktowych
 Stworzona przez J. von Neumanna.
 Podstawowym założeniem teorii gier jest racjonalne działanie
wszystkich podmiotów decyzyjnych (graczy).
Wyniki i wypłaty.
Działania wszystkich graczy określają wynik walki
konkurencyjnej (zwany wartością gry).
Każdemu możliwemu wynikowi odpowiada określona wypłata,
która jest miarą stopnia osiągnięcia celu każdego z rywali;
najczęściej wyrażona pieniężnie, gdy mowa o przedsiębiorstwie,
a w wartościach użyteczności, gdy dotyczy konsumenta.
D. Ciołek
BADANIA OPERACYJNE – wykład 4
Sformułowanie gry
Punktem wyjścia w każdej analizie konkurencji jest:
- opis graczy, stosowanych przez nich strategii, rozumianych
jako plan działań, uwzględniający wszystkie ewentualności, w
jakich gracz może się znaleźć, oraz uzyskanych przez każdego
z nich wypłat.


Walka konkurencyjna może mieć charakter jednorazowego
posunięcia lub wielu działań rozłożonych w czasie
(konkurencja sekwencyjna i powtarzalna).

Możemy mieć do czynienia z grą niekooperacyjną lub
kooperacyjną.
D. Ciołek
BADANIA OPERACYJNE – wykład 4
Gra niekooperacyjna – dylemat więźnia
Złapano dwóch przestępców. Każdemu z nich niezależnie prokurator
oświadcza, że ma przeciwko niemu wystarczająco wiele dowodów by
zamknąć go na rok do więzienia. Jeśli jednak zezna on (tylko on),
obciążając drugiego więźnia, to wina zostanie mu darowana, drugi
przestępca otrzyma zaś wyrok 10 lat. Jeśli przyznają się obaj do winy,
to obaj otrzymają po 5 lat więzienia.
Więzień II
Nie przyznawać się
Więzień I
Nie przyznawać
się
Wsypać kompana
1 rok
1 rok
0 lat
10 lat
Wsypać kompana
10 lat
0 lat
5 lat
5 lat
- Paradoks występuje w ekonomii, gdy partnerzy skazani są na
nieoptymalny wynik.
- Ze względu na brak bodźców, żaden nie zamierza jednostronnie
zmienić swojego zachowania, chyba że w drodze podjęcia
skoordynowanej współpracy, opartej na zaufaniu.
D. Ciołek
BADANIA OPERACYJNE – wykład 4
Dylemat więźnia w ekonomii
Dwa przedsiębiorstwa stworzyły kartel, dający zyski na poziomie 6
mln zł, dzielone po połowie, to uwzględniono by to w polu a (3, 3).
Rywale zdają sobie sprawę, że jeśli zwiększą sprzedaż, a
konkurent pozostanie wierny umowie, to ich zyski wzrosną do 3,5
mln zł, lecz uczciwym spadną do 1,5 mln zł. Jeśli obaj będą
oszukiwać, to zrealizują zyski na poziomie 2 mln zł.
Firma II
Firma I
Oszustwo
Uczciwość



Oszustwo
(2; 2)
(3,5; 1,5)
Uczciwość
(1,5, 3,5)
(3, 3)
Zysk kartelu jest maksymalny, gdy oba przedsiębiorstwa
postępują zgodnie z umową kartelową,
a najniższy, gdy oba oszukują partnera.
Równowaga ukształtuje się w najgorszym, pod względem wyniku,
polu, ponieważ partnerzy dostrzegają możliwość zwiększenia
swojego zysku przez nielojalność wobec siebie.
D. Ciołek
BADANIA OPERACYJNE – wykład 4
Decyzje zapewniające równowagę (1)
Powinny
być stosowane, gdy konkurenci podejmują decyzje
niezależnie od siebie (brak zmowy). Wówczas są
odzwierciedleniem „optymalnej” reakcji obu graczy, czyli
pozwalają one zmaksymalizować wielkość wypłaty każdego z
nich w warunkach, określonych przez wybór decyzji, dokonany
przez przeciwnika (równowaga Nasha).
Inaczej, równowaga Nasha oznacza taką parę decyzji, że
żaden z graczy nie ma motywacji do jednostronnego odejścia
od przyjętej decyzji, biorąc pod uwagę strategię zastosowaną
przez drugiego.
Najlepszym wynikiem, jakiego może oczekiwać gracz
uczestniczący w grze o sumie zerowej przeciwko jednakowo
nastawionemu rywalowi, jest osiągnięcie stanu równowagi.
D. Ciołek
BADANIA OPERACYJNE – wykład 4
Decyzje zapewniające równowagę (2)
Gdyby
któryś z graczy odstąpił od realizacji strategii
prowadzącej do równowagi, ograniczyłby wielkość własnych
wypłat i pozwoliłby na zwiększenie wypłat rywala.
Ponieważ równowaga Nasha może się ukształtować w
położeniu nieoptymalnym dla podmiotów rynkowych,
ekonomiści zwracają uwagę na strukturę rynku i konkurencję
między podmiotami, w której najkorzystniejsze rozwiązanie
łączy się z wyczerpaniem potencjału rynku w poszukiwaniu
okazji do poprawy alokacji, jeżeli nie da się współpracować.
Równowaga Nasha jest uogólnieniem zarówno równowagi
Cournota, jak i Bertranda, które zachodzą, gdyż każde
przedsiębiorstwo maksymalizuje zyski przy oczekiwanym
zachowaniu drugiego przedsiębiorstwa.
Równowaga występuje, gdy oczekiwania uczestników rynku
potwierdza rzeczywistość.
D. Ciołek
BADANIA OPERACYJNE – wykład 4
Koncepcja równowagi Nasha
Prostym przykładem gry, w której przynajmniej dwaj gracze
dokonują jednego, jednoczesnego ruchu, dotyczącego
podjęcia jednej decyzji, jest konkurencja między Hondą i
Toyotą w Ameryce Północnej pod koniec lat 90. związana z
budową nowych zakładów produkcyjnych
Toyota
Honda
Budować nową
wytwórnię
Nie budować
Nie budować
Budować nową
wytwórnię
(16 mln $; 16 mln $) (20 mln $; 15 mln $)
(15 mln $, 20 mln $) (18 mln $, 18 mln $)
Z opisanego przykładu wynika, że jeśli gracze oczekują
racjonalnego zachowania się przeciwnika, to obaj
„optymalizując” wybór, osiągają równowagę Nasha.
D. Ciołek
BADANIA OPERACYJNE – wykład 4
Więcej niż jedna równowaga
Gra w tchórza, w której dwóch nastolatków najeżdża na siebie
samochodami po jednopasmowej drodze. Pierwszy, który zjedzie z
drogi zostaje tchórzem, drugi – bohaterem. Jeżeli obaj zjadą z
drogi, to obaj zostają tchórzami. Jeżeli żaden nie zjedzie – obaj
lądują w szpitalu.
Olek
Sasza
Zjechać
Nie zjechać
Zjechać
(1; 1)
(1; 2)
Nie zjechać
(2, 1)
(0, 0)
- Nie występują strategie dominujące, lecz dwie równowagi Nasha.
- Ekonomistów zawsze intrygowało poszukiwanie przykładów
zachowań, które odpowiadałyby postawom brawurowych graczy.
Wydaje się, że najbardziej zbliżona jest sytuacja monopolu
naturalnego, w którym wysokie koszty wejścia i malejące koszty
przeciętne nie pozwalają realizować rentowności
umożliwiającej funkcjonowanie na rynku dwóch firm.
D. Ciołek
BADANIA OPERACYJNE – wykład 4
Monopol naturalny (1)
Telewizja
kablowa jest branżą wymagającą wysokich nakładów
kapitału (kosztów stałych) i relatywnie niskich kosztów krańcowych
wraz z podłączeniem następnego subskrybenta do odbioru programów.
Zatem próg rentowności wymaga znacznej liczby odbiorców
(gospodarstw domowych).
Ponieważ rynek telewizji satelitarnej w Wielkiej Brytanii na przełomie
lat 90. XX. wieku wydawał się potencjalnie ogromny, więc dwie firmy
postanowiły go podbić.
Specyfikę sytuacji kształtowała odmienna, niekompatybilna
technologia obu konkurentów zniechęcająca odbiorców do opłacenia
200 funtów opłaty wstępnej z ryzykiem braku możliwości
wykorzystania sprzętu, gdyby zaszła konieczność przestawienia się na
odbiór proponowany przez inną firmę.
Ponadto, firma Sky Television planowała wziąć w leasing już
krążącego w przestrzeni satelitę, a British Satellite Broadcasting (BSB)
zamierzała umieścić w przestrzeni własnego satelitę, co znacznie
podnosiło jej koszty.
D. Ciołek
BADANIA OPERACYJNE – wykład 4
Monopol naturalny (2)
W tabeli zamieszczono szacunek wartości zaktualizowanej wartości
netto NPV za lata 1989 – 1999 uwzględniającej koszty satelitów,
oprogramowania, reklamy, sprzedaży i kosztów administracyjnych w
warunkach dwóch strategii każdej z firm (wejścia na rynek i pozostania
poza nim).
BSB
SKY
Wejść
Nie wchodzić
Układ
Wejść
(-118
-747)
(0
137)
Nie wjechać
(673
0)
(0
0)
efektów (wypłat) wskazuje, że występuje podwójna równowaga
Nasha.
Teoria gier nie podpowiada, która równowaga jest lepsza. To zależy
od uwzględnienia dodatkowych informacji (szczegółów).
W opisywanym przypadku nie ma miejsca na rynku dla dwóch
przedsiębiorstw. Ze względu na opóźnienie techniczne w wystrzeleniu
satelity i wysoki poziom dziennych strat z tego tytułu doprowadziły do
przejęcia BSB przez Sky.
W rezultacie od 1993 roku brytyjski rynek telewizji kablowej jest
znacząco rentownym monopolem.
D. Ciołek
BADANIA OPERACYJNE – wykład 4
Gry z naturą – podejmowanie decyzji w
warunkach ryzyka


Ryzyko oznacza możliwość osiągnięcia wartości końcowej
kapitału (inwestycji, instrumentu finansowego) różniącej się
od wartości oczekiwanej.
Działanie w warunkach ryzyka, dotyczy podejmowania
decyzji odnośnie do zdarzeń, które mogą wystąpić z
określonym prawdopodobieństwem.
Dwaj gracze: decydent i natura.
Natura - nie jest zainteresowana wynikiem gry
Reguły decyzyjne:
kryterium Walda (reguła maxmin),
kryterium Laplace'a - Bayesa,
kryterium Hurwicza,
kryterium Savage'a,
D. Ciołek
BADANIA OPERACYJNE – wykład 4
Gry z naturą
Niech A = [aij ] oznacza macierz wypłat (korzyści).
1. Kryterium Walda
Podejmujemy taką decyzję, przy której minimalna wygrana (ze
względu na stan natury) przyjmie wartość największą, tzn.
szukamy takiego i0, dla którego:
ai0  max min
i
j
aij
2. Kryterium Laplace'a - Bayesa
Zakładamy, że wszystkie stany natury są jednakowo
prawdopodobne, możliwe jest wyliczenie wartości
oczekiwanej wygranej. Najlepsza decyzja, to ta dla której
oczekiwany rezultat jest największy. Szukamy takiego i0,
dla którego:
1 n

Ei0  max   aij 
i
 n j 1 
D. Ciołek
BADANIA OPERACYJNE – wykład 4
Gry z naturą
3. Kryterium Hurwicza
Wprowadzamy współczynnik optymizmu - skłonności do ryzyka
  0,1 , wybieramy tę decyzję i0, dla której:


H i0 ( )  max
i


max
a
ij 1 min
j
j

aij

W zależności od wartości współczynnika optymizmu,
otrzymujemy:
 0
 1
- reguła pesymistyczna (Walda),
- reguła optymistyczna
D. Ciołek
BADANIA OPERACYJNE – wykład 4
Gry z naturą
4. Kryterium Savage'a
Definiujemy macierz żalu lub strat relatywnych.
Strata relatywna - różnica pomiędzy maksymalną wygraną
przy danym stanie natury, a wygraną wynikającą z podjętej
decyzji.
Macierz strat relatywnych
gdzie:
 
Aˆ  aˆij
 aij
aˆij  max
a
ij
i
j 1,2,..., n
Wybieramy tę strategię i0, która spełnia postulat minimalizacji
strat relatywnych (minimalny maksymalny żal).
ˆ ij
aˆ i  min
max
a
i
i
0
D. Ciołek
BADANIA OPERACYJNE – wykład 4
Przykład 4
Istnieje możliwość zbudowania czterech typów zakładu
usługowego. Koszt eksploatacji zależy od różnych
czynników, takich jak: rozwój sytuacji gospodarczej w
regionie, stan rynku pracy, przyszłe ceny surowców, oraz
efektywny popyt na dany rodzaj usług. Dla każdego z
projektowanych zakładów oszacowano koszty eksploatacji w
trzech wariantach: najmniej korzystnym (S1),
umiarkowanym (S2), sprzyjającym (S3). Tablica prezentuje
oszacowane poziomy kosztów eksploatacji zakładów.
„S1” „S2” „S3”
„Z1”
40
35
25
„Z2”
50
30
25
„Z3”
65
20
20
„Z4”
70
20
14