Равновесие в смешанных стратегиях

Download Report

Transcript Равновесие в смешанных стратегиях

Равновесие по Нэшу
в смешанных стратегиях
Применение теории игр
в политике и экономике
© Рей А.И., 2004-2006
Равновесие по Нэшу в смешанных
стратегиях
• У игр в нормальной форме может и не быть
равновесия по Нэшу в чистых стратегиях:
Игра «Недоросль»
Митрофанушка
Родители
УЧИТЬСЯ
НЕ УЧИТЬСЯ
ПОМОГАТЬ
(3;2)
(-1;3)
НЕ ПОМОГАТЬ
(-1;1)
(0;0)
Решение проблемы
• На практике (игра «Недоросль»)
– изменить правила игры, улучшить контроль и
мотивацию (платежи).
• В теории
– ввести понятие смешанной стратегии.
Смешанная стратегия
df Вероятностное распределение на
пространстве действий игрока
NB для каждого информационного множества
Число действий:
• конечно (счетно)дискретное
распределение
(Камень – ¼; Ножницы – ¼; Бумага – ½)
• несчетно  непрерывное распределение
Теорема Нэша (1950)
Ref J.F.Nash. Equilibrium Points in N-Person Games.
Proceedings of the National Academy of Sciences
of the USA, vol.36, pp.48–49. 1950.
У каждой конечной игры
существует равновесие в
смешанных стратегиях
Расчет равновесия в смешанных
стратегиях
• Алгебраический метод
– оптимизация
– уравнения безразличия
• Графический метод
Алгебраический метод
 - вероятность, с которой родители будут помогать материально.
 - вероятность, с которой Митрофан выбирает учебу.
 Р  |   - средний ожидаемый выигрыш родителей недоросля.
 Р  |      3   11      1     1  0 1    
 Р  |    3        
 Р  |    5    
При какой  выигрыш родителей будет максимален?
max  Р  |   :

 Р
 0; 5 -1=0

 =0,2=20%
Алгебраический метод
 М   |   - средний ожидаемый выигрыш Митрофана.
 М   |      2   3 1      1    1  0 1    
 М   |    2  3  3    
 М   |    2  3  
max  М   |   :

 М
 0; -2 +1=0

 =0,5=50%
Игра 2 лиц в НФ: исходы
Б
А
Б1 : β
Б2 : (1-β)
A1 : α
αβ
α (1-β)
A2 : (1-α)
(1- α)β
(1-α)(1- β)
Алгебраический метод
• Уравнения безразличия:
– удалить те стратегии каждого игрока, которые
доминируются другими стратегиями
– в равновесии в смешанных стратегиях игроку
(скажем, А) безразлично, какую чистую стратегию
играть, если игрок Б придерживается оптимальной
смешанной стратегии
– приравнять друг другу ожидаемые платежи от
чистых стратегий игрока А
– найти из системы вероятность чистой стратегии
игрока Б
– повторить то же самое по аналогии для игрока Б
Алгебраический метод
 МУ   - средний ожидаемый выигрыш Митрофана, если он решил
учиться, учиться и еще раз учиться.
 МУ    2  1(1   )    1
 МН   - средний ожидаемый выигрыш Митрофана, если он решил
не учиться.
 МН    3  0(1   )  3
 МН     МУ  
  1/ 2  50%
Смысл смешанной стратегии в
однократной игре
• «Неужели нужно в самом деле бросать
монету?»
– Теория влияет на поведение
– Ненаблюдаемые психологические факторы как
источник случайности
• Равновероятные действия
• Слишком много равновесий
– Проблема выбора не решена
– Симметричные равновесия — интуитивно
понятные и относительно устойчивые
Криптография
• Противник не дремлет
• ENIGMA (~1920–1945, «дружественные»
США державы — до 1960-х гг.)
– предсказуемость и шаблонность текстов
– зашифровка одного текста двумя ключами
– M-209, Typex, «красный», «пурпурный»
• Venona (1941–1945)
– одноразовый блокнот использовался несколько
раз
• РАНДОМИЗИРУЙТЕ!
Корпус морской пехоты США
• «…мы должны действовать по осям, которые
предполагают несколько вариантов
поведения, держа противника в неведении
относительно того, какой вариант мы
выберем.»
FMFM 1 (Warfighting), United States Marine Corps, 1989.
Задания на дом
• Решить «камень–ножницы–бумага» двумя
алгебраическими способами
• Найти равновесие в смешанных стратегиях
(см.след.слайд)
Задания на дом
Б
А
Б1
Б2
Б3
А1
0;4
2;2
0;4
А2
2;12
0;8
4;2
А3
10;0
0;4
2;2