Transcript cz.2

GRY Z NATURĄ
• Natura jest przeciwnikiem który nie
zamierza wygrać.
• PRZYKŁAD
• Rolnik ma pole z glebą klasy III i zastanawia
się nad rodzajem zboża które ma posiać.
• Posiada informacje dotyczące plonów w
zależności od różnych warunków
atmosferycznych.
MACIERZ WYPŁAT (MACIERZ ZYSKÓW)
STAN
NATURY
I
II
III
IV
RODZAJ
ZBOŻA
ŻYTO
24,5
18,0
18,0
16,0
PSZENICA
18,0
32,0
24,0
21,0
JĘCZMIEŃ
15,0
19,0
26,0
19,0
KRYTERIUM WALDA
(reguła max min)
ai 0  max min aij 
i
j
DECYDENT PESYMISTA
• Wybieramy minimalną wartość w każdym
z wierszy (przy warunkach najbardziej
niekorzystnych)
• Z ww. wartości wybieramy wartość
największą
MACIERZ WYPŁAT (MACIERZ ZYSKÓW)
STAN
NATURY
I
II
III
IV
RODZAJ
ZBOŻA
ŻYTO
24,5
18,0
18,0
16,0
PSZENICA
18,0
32,0
24,0
21,0
JĘCZMIEŃ
15,0
19,0
26,0
19,0
REGUŁA MIN MAX
ai 0  min max aij 
i
j
DECYDENT OPTYMISTA
• Wybieramy maksymalną wartość w każdej
kolumnie (przy warunkach najbardziej
korzystnych)
• Z ww. wartości wybieramy wartość
najmniejszą
MACIERZ WYPŁAT (MACIERZ ZYSKÓW)
STAN
NATURY
I
II
III
IV
RODZAJ
ZBOŻA
ŻYTO
24,5
18,0
18,0
16,0
PSZENICA
18,0
32,0
24,0
21,0
21,0
JĘCZMIEŃ
15,0
19,0
26,0
19,0
REGUŁA LAPLACE’A (BAYESA)
• Zakłada, że wszystkie przyszłe stany
natury są jednakowo prawdopodobne
• Możliwe jest wyznaczenie wartości
oczekiwanych rezultatów każdej decyzji.
• Najlepszą decyzją jest ta, dla której
wartość oczekiwana jest największa
E0  max Ei 
i
• p=0,25
• E(żyto)=(24,5*0,25+18,0*0,25+18,0*0,25+16,0*0,25)=
19,12
• E(pszenica)=(18,0+32,0+24,0+21,0):4=23,75
• E(jęczmień)=(15,0+19,0+26,0+19,0):4=19,75
•
Kryterium to jest stosowane przy decyzjach
wielokrotnie powtarzalnych.
KRYTERIUM HURWICZA
• Strategia kompromisowa, uwzględniająca
skrajne stanowiska (optymistyczne i
pesymistyczne)
• Wprowadza współczynnik ostrożności,
określający w jakim stopniu decydent jest
• # pesymistą
• # a w jakim optymistą
1


ai  min aij 
j
Ai  max aij 
j
di  ai  (1   ) Ai
d ( zyto )  0,8  16,0  0,2  24,5  17,7
d ( pszenica )  0,8  18,0  0,2  32,0  20,8
d ( jeczmien )  0,8  15,0  0,2  26,0  17,2
KRYTERIUM SAVAGE’A
• Minimalizuje oczekiwane straty wynikłe z
podjęcia gorszej niż najlepsza możliwa dla
danego stanu natury (z punktu widzenia
rolnika).
• Wybieramy strategię, dla której strata
relatywna jest najmniejsza.
ETAPY WYZNACZANIA DECYZJI
• Tworzymy „macierz żalu”
R  rij 
rij  max cij   cij
i
• Dla każdego stanu natury (kolumny)
poszukujemy elementu maksymalnego, a
następnie liczymy różnice między wartościami
wyróżnionymi a danymi.
Macierz
STAN
NATURY
I
II
III
IV
RODZAJ
ZBOŻA
ŻYTO
24,5
18,0
18,0
16,0
PSZENICA
18,0
32,0
24,0
21,0
JĘCZMIEŃ
15,0
19,0
26,0
19,0
STAN
NATURY
I
II
III
IV
32,018,0=
14,0
32,032,0=
0
32,019,0=
13,0
26,018,0=
8,0
26,024,0=
2,0
26,026,0=
0
21,016,0=
5,0
21,021,0=
0
21,019,0=
2,0
STRATEGIE
ŻYTO
PSZENICA
JĘCZMIEŃ
24,524,5=
0
24,518,0=
6,5
24,515,0=
9,5
• Dla każdej strategii wyznaczamy maksymalną
stratę i z tak otrzymanych wartości wybieramy
najmniejszą
R0  min max rij 
i
j
• Wg kryterium Savage’a rolnik powinien wybrać
pod uprawę zboże o najmniejszej stracie 6,5 pszenicę
Algorytm iteracyjny Browna
Przykład
Przedsiębiorstwo produkcyjne A może uruchomić
produkcję pewnego produktu w wysokości 100, 200
lub 300 tys. szt.
Konkurencyjne przedsiębiorstwo B może postąpić w
ten sam sposób.
Należy podjąć decyzję o wielkości produkcji będąc
menedżerem przedsiębiorstwa A.
Menedżer A ma do dyspozycji trzy strategie:
produkować 100, 200 lub 300 tys. szt.
Podobnie menedżer B ma trzy strategie: produkować
100, 200 lub 300 tys. szt.
W
B1
B2
B3
A1
20
-150
-250
A2
150
-80
-100
A3
250
100
40
Tablica zawiera zyski w mld. zł. przedsiębiorstwa A (a straty
B) przy produkcji wyrobów w zależności od decyzji
przedsiębiorstwa B.
Sprawdzamy, czy gra ma rozwiązanie w zbiorze strategii
czystych.
Wyznaczamy:
• minimalną wartość w każdym wierszu (przyjmujemy, że
gracz B wybierze najbardziej niekorzystną dla A strategię),
• maksymalną wartość w każdej kolumnie (gracz B zakłada,
że gracz A wybierze najgorszą dla B sytuację).
Def.
Jeżeli
maksymalna
z
minimalnych
wygranych jest równa minimalnej z
maksymalnych przegranych, to wtedy
istnieje rozwiązanie gry w zbiorze
strategii
czystych
(strategia
maksyminowa, punkt siodłowy).
Minimalne wartości dla gracza A:
min A1=-250 min A2=-100 min A3= 40
Maksymalna wygrana gracza A:
max A= { -250 -100 40 }=40
Maksymalne wartości dla gracza B:
max B1=250 max B2=100 max B3=40
Minimalna wygrana gracza B:
min B={ 250 100 40}=40
Sprawdzamy czy istnieje punkt siodłowy:
max {min A}=40 min {max B}=40 →
max {min A}= min {max B}
Menedżer A powinien podjąć decyzję o
produkcji 300 tys. szt. bez względu na
decyzję przedsiębiorstwa B, osiągnie zysk
co najmniej 40 mld.
Przedsiębiorstwo B powinno podjąć decyzję
o produkcji 300 tys. szt. bez względu na
decyzję menedżera A, straci nie więcej niż
40 mld.
W
A1
B1
10
B2
230
B3
50
A2
A3
150
80
250
200
140
220
W tej grze nie ma punktu równowagi (brak
rozwiązania w zbiorze strategii czystych.
max { min A}=140 ≠ min { max B}=150
Rozwiązania należy szukać w zbiorze strategii
mieszanych.
Sprawdzamy, czy nie występują strategie
zdominowane:
- Strategia A1 daje w każdym przypadku
gorsze wygrane niż A2, czyli gracz A nie
powinien stosować strategii A1 bo jest ona
zdominowana przez A2,
- Strategia B1 jest zdominowana przez B2,
czyli gracz B nie powinien stosować
strategii B1.
W
B2
B3
A2
250
140
A3
200
220
p- prawdopodobieństwo stosowania strategii A2,
q- B2
Wygrana gracza A, gdy B będzie stosował strategię B2:
v= 250p+200(1-p)
gdy gracz B będzie stosował strategię B3:
v= 140p+220(1-p)
250p+200(1-p)= 140p+220(1-p)
p≈? v≈?
Gracz B: w= 250q+140(1-q) w=200q+220(1-q)
250q+140(1-q)=200q+220(1-q)
q≈? w≈?
Menedżer A powinien zdecydować o
produkcji 200 tys. szt. z częstością 0,93 i 300
tys. szt. z częstością 0,07. Przeciętny zysk z
produkcji wyniesie 145,3 mld
Menedżer B powinien zarządzić
produkcję 100 tys. szt. z częstością 0,53 i 300
tys. szt. z częstością 0,47. Jego strata
wyniesie wtedy 145,3 mld.
v
220
200
180
160
p=0.93
140
v=145.3
120
100
80
0.2
0.4
0.6
0.8
w
220
200
180
160
140
120
q=0.53
100
w=145.3
80
0.2
0.4
0.6
0.8
1.0
1.2
1.4
q
1.0
1.2
1.4
p
Algorytm Brown'a:
1. dla gier o dużych rozmiarach prezentowane
do tej pory metody są mało efektywne;
algorytm Brown'a ma zastosowanie w grach o
dużych wymiarach,
2. metoda iteracyjna;
3. dla dużej liczby iteracji zapewnia zbieżność
rozwiązań;
4. metoda wrażliwa na liczbę iteracji - aby
uzyskać dokładne wyniki należy wykonać dużą
liczbę iteracji »100
Postać algorytmu Brown'a:
Krok 1. Gracz A wybiera arbitralnie strategię.
Krok2. Gracz B sumuje elementy strategii
dotychczas stosowanych przez A i wybiera najlepszą
strategię ze swojego punktu widzenia.
Krok 3. Gracz A sumuje elementy strategii
dotychczas stosowanych przez B i wybiera najlepszą
strategię ze swojego punktu widzenia.
Krok 4. Taki jak Krok 2
Krok 5. Sprawdź, czy wykonano zamierzoną liczbę
iteracji, jeśli nie, to idź do kroku 3 w innym przypadku
STOP.