Transcript Wykład 4
Metody Analizy Decyzji Wykład 4 Dyskusja spójności i atrakcyjności reguł wyboru 1) Reguła maximin – jej minusem jest pesymizm A1 A2 s1 0 0.1 s2 1000 0.1 2) Reguła Hurwicza: a) Jak wybrać α? b) Krytka – przykład 1 s1 A1 0 A2 1 0.5A1+0.5A2 0.5 s2 1 0 0.5 s3 0 0 0 A1 A2 s1 0 x s2 1 x A1 jest optymalne, A2 także, ale kombinacja losowa dwóch już nie 2) Reguła Hurwicza b) Krytyka – przykład 2 s1 A1 0 A2 1 s2 1 0 s3 1 0 … … … s100 1 0 • Obie akcje optymalne • A1 wygląda dużo lepiej • Zupełna ignorancja: powyższa sytuacja jest strategicznie równoważna tej: s1' A1 0 A2 1 s2' 1 0 3) Reguła minimax regret (Savage) a) Zaproponowana jako ulepszenie Maximin b) Krytyka 1: Czy różnice w użyteczności mierzą dobrze żal? c) Krytyka 2: Mała korzyść w jednym stanie przewyższa dużą w drugim stanie Tabele wypłat: Tabele żalu: A1 A2 s1 s2 0 1000 0.1 0.1 A1 A2 s1 s2 0.1 0 0 999.9 A1 A2 s1 s2 0.01 1000 0.1 999.9 A1 A2 s1 0.09 0 s2 0 0.1 3) Reguła minimax regret (Savage) a) Zaproponowana jako ulepszenie Maximin b) Krytyka 1: Czy różnice w użyteczności mierzą dobrze żal? c) Krytyka 2: Mała korzyść w jednym stanie przewyższa dużą w drugim stanie Tabele wypłat: Tabele żalu: A1 A2 s1 s2 0 1000 0.1 0.1 A1 A2 s1 s2 0.1 0 0 999.9 A1 A2 s1 s2 0.01 1000 0.1 999.9 A1 A2 s1 0.09 0 s2 0 0.1 3) Minimax regret (Savage) • Trzy rodzaje transportu ratunkowego: – Jednostki powietrzne • Krótkiego zasięgu • Długiego zasięgu – Ciężarówki • Baza: Walia • Trzy obszary zagrożenia trzęsieniem ziemi: – Walia – Półwysep Iberysjki – Azerbejdżan 3) Reguła minimax regret (Savage) d) Krytyka 3: Obecność niechcianej akcji może mieć wpływ na optymalny wybór Tabela wypłat: Tabela żalu: Tabela wypłat: Tabela żalu: Półwysep Iberyjski Azerbejdżan Walia Helikopter 100 40 30 Samolot 70 80 20 Ciężarówki 0 0 110 Helikopter Samolot Ciężarówki Półwysep Iberyjski 0 30 100 Azerbejdżan 40 0 80 Walia 80 90 0 Helikopter Samolot Półwysep Iberyjski 100 70 Azerbejdżan 40 80 Walia 30 20 Helikopter Samolot Półwysep Iberyjski 0 30 Azerbejdżan 40 0 Walia 0 10 Max regret 80 90 100 Max regret 40 30 3) Reguła minimax regret (Savage) d) Krytyka 3: Obecność niechcianej akcji może mieć wpływ na optymalny wybór Tabela wypłat: Tabela żalu: Tabela wypłat: Tabela żalu: Półwysep Iberyjski Azerbejdżan Walia Helikopter 100 40 30 Samolot 70 80 20 Ciężarówki 0 0 110 Helikopter Samolot Ciężarówki Półwysep Iberyjski 0 30 100 Azerbejdżan 40 0 80 Walia 80 90 0 Helikopter Samolot Półwysep Iberyjski 100 70 Azerbejdżan 40 80 Walia 30 20 Helikopter Samolot Półwysep Iberyjski 0 30 Azerbejdżan 40 0 Walia 0 10 Max regret 80 90 100 Max regret 40 30 Rozwiązanie problemu: Zamiast porównywać wszystkie razem, porównuj je parami Helikopter Samolot Półwysep Iberyjski 100 70 Azerbejdżan 40 80 Walia 30 20 Helikopter Samolot Półwysep Iberyjski 0 30 Azerbejdżan 40 0 Walia 0 10 Helikopter Ciężarówki Półwysep Iberyjski 100 0 Azerbejdżan 40 0 Walia 30 110 Helikopter Ciężarówki Półwysep Iberyjski 0 100 Azerbejdżan 0 40 Walia 80 0 Samolot Ciężarówki Półwysep Iberyjski 70 0 Azerbejdżan 80 0 Walia 20 110 Samolot Ciężarówki Półwysep Iberyjski 0 70 Azerbejdżan 0 80 Walia 90 0 Max regret 40 30 Samolot lepszy niż helikopter Max regret 80 100 Helikopter lepszy niż ciężarówki Max regret 90 80 Ciężarówki lepsze niż samolot 4) Reguła Laplace’a (zasada niedostatecznego powodu) Helikopter Samolot Półwysep Iberyjski 100 70 Azerbejdżan 40 80 Laplace 0.5*100+0.5*40=70 0.5*70+0.5*80=75 Helikopter Samolot Hiszpania 100 70 Portugalia 100 70 Azerbejdżan 40 80 Laplace 80 73.33 Stany/zdarzenia powinno się starannie dobierać 5) Decydent nie może się zdecydować, które kryterium wybrać: Maximin, Hurwicz (α=0.75) oraz Laplace – Decyduje się wybrać tą akcję, która wygrywa głosowanie parami A1 A2 A3 s1 2 5 0 s2 12 5 10 s3 -3 -1 -2 Maximin Hurwicz Laplace -3 3 0.75*(-3)+0.25*12=0.75 2 3.667 1 -1 1 0.75*(-1)+0.25*5=0.5 3 3.000 2 -2 2 0.75*(-2)+0.25*10=1 1 2.667 3 Znowu nietranzytywne 4) Reguła Laplace’a (zasada niedostatecznego powodu) Helikopter Samolot Półwysep Iberyjski 100 70 Azerbejdżan 40 80 Laplace 0.5*100+0.5*40=70 0.5*70+0.5*80=75 Helikopter Samolot Hiszpania 100 70 Portugalia 100 70 Azerbejdżan 40 80 Laplace 80 73.33 Stany/zdarzenia powinno się starannie dobierać 5) Decydent nie może się zdecydować, które kryterium wybrać: Maximin, Hurwicz (α=0.75) oraz Laplace – Decyduje się wybrać tą akcję, która wygrywa głosowanie parami A1 A2 A3 s1 2 5 0 s2 12 5 10 s3 -3 -1 -2 Maximin Hurwicz Laplace -3 0.75*(-3)+0.25*12=0.75 3.667 -1 0.75*(-1)+0.25*5=0.5 3.000 -2 0.75*(-2)+0.25*10=1 2.667 Znowu nietranzytywne Przykład do samodzielnego rozwiązania • Potrzeba/cel: – przyjemnie spędzić czas przy minimalnym wysiłku podróży i kosztach • Warianty: – wyjazd na narty w Dolomity samolotem – wyjazd na narty w Dolomity samochodem – wyjazd na narty do kraju • Niepewność: – czasem słońce, czasem śnieg Strukturyzacja problemu • Konsekwencje: – – – – – za granicę samolotem (+ śnieg/słońce) drogie super ferie za granicę samochodem + śnieg fatalna podróż, super narty za granicę samochodem + słońce super podróż, super ferie na narty do kraju + śnieg umiarkowana przyjemność na narty do kraju + słońce herbatka z prądem + karty • Oceny konsekwencji: – – – – +20 za ferie uciążliwość podróży (-8 za jazdę po śliskim za granicą) jakość stoków (-5 za stoki w Polsce, -3 jeśli nie da się jeździć) cena (-4 za zagranicę, dodatkowo -3 za samolot) a) Wersja wyjściowa Znajdź optymalne akcje wg poniższych reguł Słońce Śnieg Dolomity samochodem 16 8 Dolomity samolotem 13 13 W kraju samochodem 12 15 Słowacja samochodem 10 18 maximin maximax Laplace Savage Reguły – zestawienie • Niech wi,j oznacza wypłatę przy i-tym wariancie i j-tym stanie świata • Niech I oznacza zbiór wariantów, J – zbiór stanów Reguła Wzór Decyzja Maximin arg max(min wi , j ) Dolomity samolotem Maximax arg max(max wi , j ) Dolomity samochodem r. Savage’a jJ iI Polska samochodem arg max( wi , j ) r. Laplace’a r. Hurwicza jJ iI iI jJ arg max((1 ) min wi , j max wi , j ) Zależy od arg min(max(max wl , j wi , j )) Dolomity samolotem jJ iI iI jJ jJ lI b) Wpływ innego podziału stanów Znajdź optymalne akcje wg poznanych kryteriów. Czy decyzje są te same w obu przypadkach? Słońce w kraju i za granicą Słońce w kraju, śnieg za granicą Śnieg w kraju, słońce za granicą Śnieg w kraju i za granicą Za granicę samochodem 16 8 16 8 Za granicę samolotem 13 13 13 13 W kraju samochodem 12 12 15 15 Załóżmy, że albo chmury śniegowe znajdą się albo nad Polską, albo nad zagranicą – znajdź optymalne decyzje dla poznanych reguł Słońce w kraju, śnieg za granicą Śnieg w kraju, słońce za granicą Za granicę samochodem 8 16 Za granicę samolotem 13 13 W kraju samochodem 12 15 c) Wpływ dodatkowej akcji Znajdź optymalne akcje i porównaj z optymalnymi z punktu a). Gdzie występuje niespójność? Słońce Śnieg Dolomity samochodem 16 8 Dolomity samolotem 13 13 W kraju samochodem 12 15 Słowacja samochodem 10 18 maximin maximax Laplace Savage Heurystyki wykorzystywane w wyborze z wieloma kryteriami • Rekompensująca – Np. bezawaryjność oraz szybki procesor komputera może rekompensować wysoką cenę – Wymaga więcej wysiłku poznawczego • Nierekompensująca Reguły bez wspomagania - szybkie i oszczędne heurystyki [fast and frugal heuristics] Jak ludzie podejmują decyzje z wieloma kryteriami? Heurystyki nierekompensujące: 1. Heurystyka rozpoznawalności [the recognition heuristic] – – – 2. Np. Kierownik decyduje, który z dwóch konkurujących produktów wybrać Skuteczność zależy od związku poziomu jakości i rozpoznawaności marki Może nagradzać ignorancję Strategia minimalistyczna [the minimalist strategy] – Wybierz na podstawie pierwszego lepszego atrybutu – Na przykład: z dwóch aparatów wybierz ten, który ma opcję wyzwalacza reagującego na uśmiech 3. Wybierz tak, jak ostatnio [take the last] – Wybierz na podstawie atrybutu, który umożliwił ci decyzję przy ostatnim wyborze 1. Strategia leksykograficzna [the lexicographic strategy] – Jak w leksykonie lub w słowniku – Ranking atrybutów – Np. wybór samochodu: cena, rozmiar, prędkość maksymalna 2. Strategia pół-leksykograficzna [the semi-lexicographic strategy] – – – Jeśli wynik na danym atrybucie jest podobny, to stwierdzamy remis i przechodzimy do następnego Np. Jeśli cena różni się mniej niż 50 groszy, wybierz produkt o wyższej jakości, jeśli nie, wybierz tańszy Marka Cena Jakość A B C 3.00 3.60 3.40 Niska Wysoka Średnia A>B, B>C, ale A<C: nietranzytywna/nieprzechodnia 6. Eliminacja poprzez aspekty [elimination by aspects (EBA)] – Np. http://homebroker.pl/ 7. Sekwencyjne podejmowanie decyzji: zadowalanie się [sequential decision making: satisficing] – Zadowalanie się – poziom aspiracji – Przykłady: • Sekwencyjne otrzymywanie ofert pracy • Sprzedaż lub kupno domu • Kupno używanego samochodu 8. Wybór poprzez uzasadnienie [reason-based choice] – Dwa różne pytania: • Który kandydat powinien zostać WYBRANY? • Który kandydat powinien zostać ODRZUCONY? Poziom Komunikacji w piśmie Obecności w pracy Umiejętności komputerowych Zdolności interpersonalnych Umiejętności operacji na liczbach Umiejętności w rozmowie telefonicznej Kandydat A Kandydat B średni nadzwyczajny satysfakcjonujący bardzo dobry średni nadzwyczajny średni słabo dogaduje się z ludźmi średni słaby średni słaby – Wybór może nie być niezależny od sformułowania [framing] 8. Wybór poprzez uzasadnienie [reason-based choice] – Wybór może nie spełniać Niezależności Nieistotnych Alternatyw [Independence of Irrelevant Alternatives] Czynniki wpływające na to, jak ludzie dokonują wyboru • • • • • Czas na podjęcie decyzji Wysiłek, którego wymaga dana strategia Wiedza decydenta o otoczeniu decyzyjnym Istotność podjęcia dobrej decyzji Czy decydent musi usprawiedliwić swój wybór wobec innych • Chęć by minimalizować konflikt