Равновесие в смешанных стратегиях
Download
Report
Transcript Равновесие в смешанных стратегиях
Равновесие по Нэшу
в смешанных стратегиях
Применение теории игр
в политике и экономике
© Рей А.И., 2004-2006
Равновесие по Нэшу в смешанных
стратегиях
• У игр в нормальной форме может и не быть
равновесия по Нэшу в чистых стратегиях:
Игра «Недоросль»
Митрофанушка
Родители
УЧИТЬСЯ
НЕ УЧИТЬСЯ
ПОМОГАТЬ
(3;2)
(-1;3)
НЕ ПОМОГАТЬ
(-1;1)
(0;0)
Решение проблемы
• На практике (игра «Недоросль»)
– изменить правила игры, улучшить контроль и
мотивацию (платежи).
• В теории
– ввести понятие смешанной стратегии.
Смешанная стратегия
df Вероятностное распределение на
пространстве действий игрока
NB для каждого информационного множества
Число действий:
• конечно (счетно)дискретное
распределение
(Камень – ¼; Ножницы – ¼; Бумага – ½)
• несчетно непрерывное распределение
Теорема Нэша (1950)
Ref J.F.Nash. Equilibrium Points in N-Person Games.
Proceedings of the National Academy of Sciences
of the USA, vol.36, pp.48–49. 1950.
У каждой конечной игры
существует равновесие в
смешанных стратегиях
Расчет равновесия в смешанных
стратегиях
• Алгебраический метод
– оптимизация
– уравнения безразличия
• Графический метод
Алгебраический метод
- вероятность, с которой родители будут помогать материально.
- вероятность, с которой Митрофан выбирает учебу.
Р | - средний ожидаемый выигрыш родителей недоросля.
Р | 3 11 1 1 0 1
Р | 3
Р | 5
При какой выигрыш родителей будет максимален?
max Р | :
Р
0; 5 -1=0
=0,2=20%
Алгебраический метод
М | - средний ожидаемый выигрыш Митрофана.
М | 2 3 1 1 1 0 1
М | 2 3 3
М | 2 3
max М | :
М
0; -2 +1=0
=0,5=50%
Игра 2 лиц в НФ: исходы
Б
А
Б1 : β
Б2 : (1-β)
A1 : α
αβ
α (1-β)
A2 : (1-α)
(1- α)β
(1-α)(1- β)
Алгебраический метод
• Уравнения безразличия:
– удалить те стратегии каждого игрока, которые
доминируются другими стратегиями
– в равновесии в смешанных стратегиях игроку
(скажем, А) безразлично, какую чистую стратегию
играть, если игрок Б придерживается оптимальной
смешанной стратегии
– приравнять друг другу ожидаемые платежи от
чистых стратегий игрока А
– найти из системы вероятность чистой стратегии
игрока Б
– повторить то же самое по аналогии для игрока Б
Алгебраический метод
МУ - средний ожидаемый выигрыш Митрофана, если он решил
учиться, учиться и еще раз учиться.
МУ 2 1(1 ) 1
МН - средний ожидаемый выигрыш Митрофана, если он решил
не учиться.
МН 3 0(1 ) 3
МН МУ
1/ 2 50%
Смысл смешанной стратегии в
однократной игре
• «Неужели нужно в самом деле бросать
монету?»
– Теория влияет на поведение
– Ненаблюдаемые психологические факторы как
источник случайности
• Равновероятные действия
• Слишком много равновесий
– Проблема выбора не решена
– Симметричные равновесия — интуитивно
понятные и относительно устойчивые
Криптография
• Противник не дремлет
• ENIGMA (~1920–1945, «дружественные»
США державы — до 1960-х гг.)
– предсказуемость и шаблонность текстов
– зашифровка одного текста двумя ключами
– M-209, Typex, «красный», «пурпурный»
• Venona (1941–1945)
– одноразовый блокнот использовался несколько
раз
• РАНДОМИЗИРУЙТЕ!
Корпус морской пехоты США
• «…мы должны действовать по осям, которые
предполагают несколько вариантов
поведения, держа противника в неведении
относительно того, какой вариант мы
выберем.»
FMFM 1 (Warfighting), United States Marine Corps, 1989.
Задания на дом
• Решить «камень–ножницы–бумага» двумя
алгебраическими способами
• Найти равновесие в смешанных стратегиях
(см.след.слайд)
Задания на дом
Б
А
Б1
Б2
Б3
А1
0;4
2;2
0;4
А2
2;12
0;8
4;2
А3
10;0
0;4
2;2