Transcript Temat09

SCHEMAT ARBITRAŻOWY
NASHA I ROZWIĄZANIA
KOOPERACYJNE
M.STAŃCZYK
M. JÓZEFIAK
A. MISZTAL
W naszych dotychczasowych rozważaniach na temat gier o
sumie niezerowej przyjmowaliśmy, że gracze nie próbują
kooperować. Przyjmiemy teraz inne podejście. Nasi gracze
uzgadniają między sobą jaki wynik w danej grze byłby
uzasadniony (sprawiedliwy), oraz są gotowi zaakceptować
uzgodniony wynik. Mogą również ustalić, że racjonalny i
sprawiedliwy wynik będzie wskazany przez bezstronnego
arbitra i jego decyzji się podporządkują. Jakimi regułami w
takiej sytuacji powinni się kierować gracze lub arbiter? Czy
można określić racjonalny, sprawiedliwy wynik?
Rozpatrzmy następującą grę:
Jaki wynik byłby sprawiedliwy? Pierwszy pomysł, to wziąć
wynik charakteryzujący się największą sumą wypłat, po czym
podzielić tę sumę równo pomiędzy oboje graczy. W tej sytuacji
Wiersz gra A, zaś Kolumna B i wypłacenie każdemu z graczy
po 7,5. Tak wyznaczony wynik nazywamy rozwiązaniem
egalitarnym. Jednak to rozwiązanie ma dwie istotne wady, na
przykładzie których dobrze widać trudności, jakie trzeba
pokonać, rozwiązując nasz problem.
Pierwsza wątpliwość bierze się stąd, że wypłaty w grze
określone są w jednostkach użyteczności. Wartość sumy
użyteczności nie może być interpretowana racjonalnie, zatem
niemożliwe jest obliczanie i wybieranie największej „łącznej
użyteczności” wyników gry. Użyteczności różnych graczy nie
mogą być porównywane ani transferowane pomiędzy nimi,
wiec nie możemy ich sumy podzielić pomiędzy graczy.
Po drugie rozwiązanie egalitarne ignoruje asymetrię
strategicznej pozycji obu graczy. Pozycja strategiczna Pani
Kolumny jest bardzo mocna: strategia A dominuje B, więc
naturalnym wynikiem gry jest B Wiersza –A Kolumny, co daje
kolumnie najlepszy możliwy wynik.
Naszym zadaniem jest znalezienie takiej procedury arbitrażu,
która nie zostawiłaby miejsca na nieuzasadnione manipulacje
użytecznościami graczy, brałby pod uwagę zróżnicowanie ich
pozycji strategicznych oraz odwoływała się do pojęcia
sprawiedliwości. Jako pierwsi zajęli się tym problemem
Neumann i Morgenstern, którzy ustalili, że dopuszczalne
rozwiązania gry o sumie niezerowej muszą spełniać warunki:
• Optymalne w sensie Pareto: nie może być żadnego wyniku
lepszego dla obu graczy, lub lepszy dla jednego, a nie
gorszy dla drugiego.
• Wypłaty graczy nie powinny być niższe niż ich poziomy
bezpieczeństwa. Gracza nie można zmusić do
zaakceptowania rozwiązania, w którym jego wypłata jest
niższa niż ta, którą może on sobie zagwarantować, grając
niekooperacyjnie.
Zbiór wyników spełniających oba powyższe kryteria nazywamy
zbiorem negocjacyjnym.
10
W tej grze poziom bezpieczeństwa Wiersza wynosi , a
3
Kolumny 6. Na wieloboku wypłat zbiorowi wyników
paretooptymalnych odpowiada odcinek łączący punkty (4,8) i
(10,5), a zbiorem negocjacyjnym jest odcinek łączący (4,8) i
(8,6). W ten sposób ustalamy jedynie pewien przedział
dopuszczalnych wyników. Czy znajdziemy w nim jeden
najbardziej sprawiedliwy wynik? Rozwiązanie tego problemu,
znany jako schemat arbitrażowy Nasha, zaproponował John
Nash. Załóżmy, że możliwe wyniki gry tworzą zbiór na
płaszczyźnie kartezjańskiej, gdzie współrzędne są określone
przez użyteczności graczy. Pan Wiersz i Pani Kolumna, w
drodze negocjacji chcą przyjąć jeden wynik z tego zbioru.
Jeżeli negocjacje zakończą się fiaskiem wynikiem gry będzie
pewien z góry ustalony wynik , zwany status quo.
Ogólna metoda rozwiązania tego problemu, nazwana
schematem arbitrażowym, musi każdemu wypukłemu
wielobokowi z określonym, należącym do niego status quo
(SQ), przypisać jako rozwiązanie jeden punkt. Nash zaczął od
podania czterech aksjomatów, które w jego opinii, muszą być
spełnione przez każdy akceptowalny schemat arbitrażowy.
• AKSJOMAT 1. RACJONALNOŚĆ. Rozwiązanie powinno
należeć do zbioru negocjacyjnego.
• AKSJOMAT 2. NIEZALEŻNOŚĆ OD PRZEKSZTAŁCEŃ
LINIOWYCH. Jeżeli użyteczności wiersza lub kolumny
zostaną przekształcone przez rosnącą funkcję liniową,
również odpowiednia współrzędna rozwiązania powinna być
przekształcona przez tą funkcję.
• AKCJOMAT 3. SYMETRIA. Jeżeli wielobok możliwych
wyników jest symetryczny względem prostej o równaniu
y=x+a, przechodzącej przez punkt SQ, punkt rozwiązania
powinien leżeć na tej linii.
• AKSJOMAT 4. NIEZALEŻNOŚĆ OD ALTERNATYW
NIEZWIĄZANYCH. Załóżmy, że dla wieloboku wyników P,
rozwiązaniem przy punkcie SQ jest punkt N. Załóżmy, że
dla wieloboku Q, zawierającego się całkowicie w P, należą
punkty SQ i N. W takim razie rozwiązanie N powinno być
również rozwiązaniem dla wieloboku Q, jeśli jako punkt
status quo utrzymany zostanie SQ.
Pierwsze trzy aksjomaty są dość oczywiste. Aksjomat 3 odwołuje
się do idei sprawiedliwości jako symetrii czy też niedyskryminacji,
w szczególnym przypadku całkowicie symetrycznej sytuacji
graczy.
Bardziej skomplikowany jest aksjomat 4.
Argumentacja Nasha za jego przyjęciem była następująca:
Załóżmy, że w sytuacji, gdy P jest zbiorem możliwych wyników, a
SQ status quo, Wiersz i Kolumna zgodzili się na N jako na
najsprawiedliwszy możliwy wynik. Dalej, wyobraźmy sobie, że
pewne wyniki należące do P okazały się jednak nieosiągalne – w
ten sposób zbiór możliwych wyników został ograniczony do Q.
W takim razie, skoro N zostało ocenione jako rozwiązanie
sprawiedliwsze od wszystkich innych wyników należących do P, to
jest ono także sprawiedliwsze od wszystkich innych wyników
należących do Q.
Jakie są konsekwencje przyjęcia aksjomatu 4?
Rozpatrzmy przedstawiony przykład:
Niech N będzie rozwiązaniem problemu arbitrażowego (EAC, SQ).
Zgodnie z aksjomatem 4 powinien być zatem także rozwiązaniem
problemu arbitrażowego (EAB, SQ). Jeśli jednak wybraliśmy punkt N
jako rozwiązanie (AEC, SQ), ponieważ stanowi on rozsądny kompromis
pomiędzy optymalnym dla Kolumny wynikiem A i optymalnym dla
Wiersza wynikiem C, to czy nie powinniśmy, w sytuacji gdy wynik C nie
jest osiągalny, a z dostępnych wyników najlepszym dla Wiersza jest B,
wskazać jako rozwiązania raczej punkt M?
Według Nasha, jeżeli N było sprawiedliwsze od M, gdy możliwy był
wynik C, to nie stanie się mniej sprawiedliwe tylko dlatego, że
wynik C przestał być osiągalny. Sprawiedliwość jakiegoś
rozwiązania nie może zależeć od tego, czy jakiś mało
prawdopodobny wynik uzna się za wystarczająco prawdopodobny,
by brać go pod uwagę, czy też nie.
Twierdzenie
Istnieje dokładnie jeden schemat arbitrażowy spełniający aksjomaty 1-4:
Jeżeli SQ=(x0,y0), to rozwiązaniem arbitrażowym jest należący do
wieloboku wyników punkt N o takich współrzędnych (x,y), x≥x0, y≥y0,
który maksymalizuje wartość iloczynu (x-x0)(y-y0).
Twierdzenie wyklucza istnienie innych, spełniających aksjomaty Nasha
schematów arbitrażowych. Zakłada ono maksymalizację iloczynu
przyrostu użyteczności graczy względem status quo. Wygląda to
tajemniczo, ale zauważmy, że zgadza się z aksjomatem 2. Jeśli,
powiedzmy, przemnożymy wszystkie wartości x przez jakąś dodatnią
stałą, także iloczyn (x-x0)(y-y0) będzie trzeba przemnożyć przez tę
stałą, a więc wynik, który maksymalizował wartość tego iloczynu
przedtem, maksymalizuje ją i teraz
Przykład 1
Wyobraźmy sobie, że Pan Wiersz i Pani Kolumna muszą
wybrać jeden z następujących wyników (liczby oznaczają
odpowiednio użyteczności Wiersza i Kolumny):
A=(0,0), B=(2,0), C=(4,2), D=(1,5),
bądź teorię złożoną z wyników A, B, C, D
z dowolnymi prawdopodobieństwami.
Jeśli nie uda im się uzgodnić wyniku, zostanie nim SQ=(2,1).
Rozwiązanie
Rozwiązanie Nasha musi należeć do zbioru negocjacyjnego – odcinka
łączącego punkty (2,4) i (4,2) – i spośród wszystkich punktów
należących do tego odcinka charakteryzować się
największą wartością iloczynu (x-2)(y-1).
Ponieważ równanie zbioru negocjacyjnego ma postać y=6-x, 2≤x≤4,
wyrażenie, które należy maksymalizować to (x-2)(6-x-1)=-x2+7x-10.
Ogólnie dla wyrażenia w postaci –ax2+bx+c, (a≥0) można wykazać, że
wartość maksymalną osiąga ono, gdy x=b/(2a).
W naszym przykładzie iloczyn osiąga swoje maksimum, gdy
Wartości te są osiągane dla loterii
.
Powyższy problem ma pewną specyficzna cechę:
Zbiór wyników paretooptymalnych jest odcinkiem leżącym na
prostej o nachyleniu -1. W takim przypadku można stosować
nieskomplikowaną geometryczną metodę znajdowania
rozwiązania Nasha: leży ono na przecięciu zbioru
paretooptymalnego z prostą w nachyleniu +1, przechodzącą
przez punkt SQ.
Przykład 2
Załóżmy, że możliwe wyniki to A=(1,8), B=(6,7), C=(8,6),
D=(9,5), E=(10,3), F=(11,-1), G=(-1,-1), przy status quo
SQ=(2,1). Jakie będzie rozwiązanie Nasha?
Zbiór negocjacyjny jest łamaną składającą się z kilku
odcinków. Aby zorientować się gdzie może leżeć rozwiązanie
arbitrażowe, policzymy wartość (x-2)(y-1) dla
poszczególnych wierzchołków zbioru negocjacyjnego:
Ponieważ wartość iloczynu jest największa dla C,
rozwiązanie leży albo na odcinku BC, albo na odcinku CD.
Prosta zawierająca odcinek BC ma równanie y= 10 - ½ x, tak
więc musimy maksymalizować wyrażenie
(x-2)(10-½ x-1)= -½ x² + 10x -18
Wartość maksymalna jest osiągana, gdy x=10 – punkt ten leży
już poza odcinkiem BC, za punktem C, tak więc wartość
maksymalna w ramach odcinka BC osiągana jest w
punkcie C. Podobnie można obliczyć że na odcinku CD
wyrażenie (x-2)(y-1) maksymalizowane jest również w
punkcie C. Tak więc C jest rozwiązaniem Nasha.
Mając do dyspozycji sformułowane przez Nasha rozwiązanie
ogólnego problemu arbitrażu, możemy zastosować je do
wyznaczenia sprawiedliwego arbitrażowego rozwiązania gry
o sumie niezerowej. Jako wielobok wypłat dla problemu
arbitrażowego posłuży nam wielobok wypłat analizowanej
gry. Musimy jeszcze znaleźć punkt status quo- wynik gry w
sytuacji, gdy arbitraż nie powiedzie się. Jedną z możliwość
jest uznanie, że po prostu nie wiemy co się wtedy stanie i
przyjęcie jedynie, że każdy z graczy uzyska wypłatę
odpowiadającą co najmniej jego poziomowi bezpieczeństwaw takim przypadku przyjmujemy jako status quo punkt o
współrzędnych równych poziomowi bezpieczeństwa Wiersza
i Kolumny.
Dla gry 16.1 byłby to punkt SQ=(3⅓, 6). Rozwiązaniem
arbitrażowym Nasha jest w tym przypadku
Oznacza to że rekomendujemy graczom zagranie z
prawdopodobieństwem 13/18 BA i AB z
prawdopodobieństwem 5/18, bądź też, jeśli gra jest
wielokrotnie powtarzana, ranie w 13 na 18 rozgrywek BA, a
w pozostałych pięciu AB.
Zaletą przyjęcia status quo w poziomach bezpieczeństwa jest
to , że są one łatwe do wyznaczania, poza tym jednak takie
postępowanie może budzić pewne wątpliwości. Sam Nash,
gdy rozważał ten problem, zaproponował inny sposób
wyznaczania status quo. Jego rozumowanie opierało się na
założeniu, że jeżeli negocjacje nie powiodą się, gracze mogą
starać się wpłynąć na wynik, stosując strategię gróźb: „jeśli
negocjacje załamią się, przyjmę strategię, która będzie dla
ciebie niekorzystna”.
Zgodnie z takim rozumowaniem, właściwym punktem status
quo będzie punkt wyznaczony przez strategię gróźb.
Wiedząc o tym, gracze będą formułowali swoje groźby w taki
sposób, by uzyskać najkorzystniejszy status quo,
uwzględniając fakt, że przeciwnik postępuje tak samo.
Inaczej mówiąc wybór strategii gróźb sam w sobie jest grą.
Jest to przy tym gra o sumie zerowej, której rozwiązanie
określa optymalne strategie gróźb obu graczy. Zgodnie z
propozycją Nasha, punktem status quo dla arbitrażu
powinien być punkt wyznaczony przez optymalne strategie
gróźb.
W bardziej skomplikowanych przypadkach wyznaczanie
optymalnych strategii gróźb może być dosyć trudne
rachunkowo. Zachodzi jednak jeden przypadek, kiedy
rachunki są bardzo proste: wtedy, gdy zbiór negocjacyjny jest
odcinkiem prostej o nachyleniu -1. w takim przypadku
rozwiązanie arbitrażowe Nasha leży na przechodzącej przez
punkt status quo linii o nachylenie +1. Oznacza to ,że różnica
pomiędzy wypłatą Wiersza a wypłatą Kolumny w punkcie
status quo będzie taka sama, jak w punkcie będącym
rozwiązaniem arbitrażowym. Pan Wiersza chciałby żeby ta
różnica była jak największa, a Kolumna- by było ona jak
najmniejsza. Tak więc optymalne strategie gróźb Wiersza i
Kolumny można wyznaczyć, analizując grę różnic – grę o
sumie zerowej, w której wypłatami są różnice wypłat w
oryginalnej grze o sumie niezerowej.
Dla przykładu przeanalizujemy następującą grę:
Zbiorem negocjacyjnym jest odcinek łączący punkty (4,16) i
(10,10), leżący na prostej o nachyleniu -1. Gra różnic ma
punkt siodłowy dla pary
Strategii AA , a więc strategie A są optymalnymi strategiami
gróźb dla obojga graczy. Oczywiście, w przypadku innych
gier optymalne strategie gróźb mogą być strategiami
mieszanymi.
Jeśli zbiór negocjacyjny jakiegoś wieloboku wypłat jest
pojedynczym odcinkiem o dowolnym ( z definicji jednak
zawsze ujemnym) nachyleniu, to zawsze można go
przekształcić w odcinek o nachyleniu -1, mnożąc
użyteczności jednego z graczy przez odpowiednią stałą, po
czym stosować opisaną wyżej metodę wyznaczania
optymalnych strategii gróźb.
Zasadniczym wnioskiem płynącym z powyższych rozważań
jest to, że jeżeli chcemy użyć schematu arbitrażowego
Nasha do rozwiązania ogólnego problemu arbitrażu, to jego
wynik dla gier o sumie niezerowej zależy od tego, w jaki
sposób, naszym zdaniem, należy uwzględnić przewagę
strategiczną jednego z graczy.
Koniec
Dziękujemy za uwagę