Transcript game04
第I部 非協力ゲームの理論 第4章 完全均衡点 2008/07/01(火) ゲーム理論合宿 B4 山田孝太郎 内容 • 部分ゲーム完全均衡点 -部分ゲーム -部分ゲーム完全均衡点 -2段階完全情報ゲーム • シュタッケルベルク均衡点 • 完全均衡点の不完全性 -チェーンストアパラドックス -合理性の限界 1 4.1. 部分ゲーム完全均衡 4.1.1. 部分ゲーム 展開形ゲーム が与えられているとき、ゲームの木Kの分岐点aを底点として、それ以後の 分岐点、枝、頂点からなる木の部分K’を、元の木Kの切断、あるいは、aを 底点とするKの部分木という。 P1 P2 A ・a a Γ 利得 P3 B ・ ・ A (6,1,3) B A (2,6,1) B (5,1,2) A B A (3,0,4) (1,4,1) (2,6,2) B (6,1,5) (0,3,5) Γa v・ ・b A ・ B ・ Γb 2 4.1. 部分ゲーム完全均衡 4.1.1. 部分ゲーム • このようなものは部分ゲームではない。 P1 P2 A ・a a Γ 利得 P3 B A (6,1,3) B A (2,6,1) B (5,1,2) A B A (3,0,4) (1,4,1) (2,6,2) B (6,1,5) (0,3,5) Γa v・ A ・b B Γb ←情報集合が部分木間をまたぐ。 3 4.1. 部分ゲーム完全均衡 4.1.1. 部分ゲーム P1 例1. 完全情報2人ゲーム • プレイヤー1と2はそれぞれSとB の行動をもっている。 • 第2の手番で、プレイヤー2は1 の行動を知った上で、自分の 行動を選択できる。 • 戦略と、純戦略での均衡点と均 衡利得は (S) (B) (S S) (S B) (B S) (B B) 3,6 3,6* 0,0 0,0 5,3 2,2 5,3 2,2 u21 ・a Γ u1 利得 P2 S S (3,6) Γa B (0,0) S (5,3) B (2,2) ・ B u22 ・b Γb 均衡点 (B,SS) (B,BS) (S,SB) 均衡利得 (5,3) (5,3) (2,2) となる。 4 4.1. 部分ゲーム完全均衡 4.1.2. 部分ゲーム完全均衡点 • 例1で求めた、3つの均衡点の意味は? P1 u21 ・a Γ u1 利得 P2 S S (3,6) Γa B (0,0) S (5,3) B (2,2) (S) (B) ・ B u22 ・b Γb (S S) (S B) (B S) (B B) 3,6 3,6* 0,0 0,0 5,3 2,2 5,3 2,2 均衡点 (B,SS) (B,BS) (S,SB) 均衡利得 (5,3) (5,3) (2,2) 5 4.1. 部分ゲーム完全均衡 4.1.2. 部分ゲーム完全均衡点 (1)部分ゲーム完全均衡点(subgame perfect equilibirium) 均衡点(B,SS)の意味 -部分ゲームΓaにおいて、情報集合u21でのプレーヤー2の最適反応戦略は、行 動Sをとることで、 Γbにおける情報集合u22でも同様に、Sが最適反応戦略。 -均衡点(B,SS) において、プレイヤー2の戦略(SS)を、2つの部分ゲームに限定し たとき、ともに均衡点となる。 -このとき、ゲームΓは右のように縮約できる。 -そして、この縮約ゲームにおいて、プレイヤー1の P1 利得 最適反応戦略は(B)で、均衡点も(B)。 (3,6) Γa Γ -逆戻り推論で得られた均衡点。 S o 要するに、 ・ 均衡戦略をΓ, Γa, Γbの3つの部分ゲームに限定したとき、 それぞれの部分ゲームにおける均衡点の組のこと。 B (5,3) Γb 6 4.1. 部分ゲーム完全均衡 4.1.2. 部分ゲーム完全均衡点 (2)不完全均衡点I 均衡点(B,BS)の意味 -もし、間違って1が行動Sをとった場合、 この均衡点によって行動を選択すると、 利得が(0,0)になる。 -つまり、中に不合理な選択を含む均衡点。 -なぜナッシュ均衡点になっているのか? ←プレイヤー1がBをとることになっている ので、 ΓaにおいてBをプレイヤー2が選択 しても関係ない。 P1 u21 ・a Γ 利得 P2 S S (3,6) Γa B (0,0) S (5,3) u1 ・ B u22 ・b Γb B (2,2) (3)部分ゲーム完全均衡点と不完全均衡点 -部分ゲーム完全均衡点とは、ナッシュ均衡点であって、すべての部分ゲームに 限定したときに得られる行動戦略の組が、その部分ゲームの均衡点になっている 点のこと。 -そうでないときは、単に不完全均衡点という。 7 4.1. 部分ゲーム完全均衡 4.1.2. 部分ゲーム完全均衡点 (4)不完全均衡点II(脅しの均衡点) 均衡点(S,SB)の意味 P1 P2 利得 u 21 (3,6) S -プレイヤー2が情報を持たないときには得られ Γa ・a なかった点。 Γ B S (0,0) -部分ゲームΓbにおいて、戦略(B)は均衡点 u1 ではないので、不完全均衡点。 ・ -プレイヤー2の戦略の意味は B u22 (5,3) S 「もし君がSすれば、僕もSして、 Γb ・b もし君がBすれば、僕もBする」ということ。 B (2,2) -この後半部分は「脅し」なので、脅しの戦略 という。 -脅しの戦略は、プレイ前に通告ができて、それを開始後も変更することができな い場合に有効。 例)日本が競争的輸出をするならば、輸入禁止的処置をとることを米が法制化 8 4.1. 部分ゲーム完全均衡 4.1.3. 2段階完全情報ゲーム • • • 例1のゲームは、プレイヤー2はゲームがプレイされる前に、 自分の取る戦略を決定し、実行するという前提。 プレイヤー2が自分の手番の分岐点に来た時に戦略を決定 するという状況なら、脅しの戦略は実行されない。 このように完全記憶ゲームで、ゲームがいくつかの段階に分 かれていて、それぞれの段階で行動を選択・実行するゲーム を、多段階ゲームという。 9 4.1. 部分ゲーム完全均衡 4.1.3. 2段階完全情報ゲーム 例2 2段階完全情報2人ゲーム -2段階ゲームで、プレイヤー2は1の行動を知った上で行動を選択する。 -話し合いはない。 -このゲームには先手(leader)、後手(follower)がある。展開形に段階を明 記して書くことができる。戦略形と均衡点・利得は右下 段階1 段階2 P1 P2 u21 ・a Γ u1 S 終点 利得 S (4,8) Γa B (0,0) S (6,6) B (0,6) ・ B u22 ・b Γb (S) (B) (S S) 4,8 6,6* (S B) 4,8* 0,6 (B S) 0,0 6,6* (B B) 0,0 0,6* 均衡点 (S,SB) (B,SS) (B,BS) (B,BB) 均衡利得 (4,8) (5,3) (6,6) (0,6) 10 4.1. 部分ゲーム完全均衡 4.1.3. 2段階完全情報ゲーム 例2 2段階完全情報2人ゲーム - Γaにおける2の最適反応戦略は(S). - Γbにおける2の最適反応戦略はどちらも2の利得が6になるので、(S)も (B)も最適反応戦略。 段階1 段階2 終点 P1 P2 利得 -縮約すると、右図。 -プレイヤー2が戦略(S)をとる保証がない限り、 u21 S 1は戦略(B)をとることができない。 (4,8) Γa ・a Γ -友情ルールがあれば、1は心おきなく(B)をとる S u1 が、プレイヤー2が(S)をとる恐れがあるときは、 ・ (S)をとらざるを得ない。 (6,6) -したがって、プレイヤー2の局所混在戦略を考える。B u22 S ・b Γb B (0,6) 11 4.1. 部分ゲーム完全均衡 4.1.3. 2段階完全情報ゲーム 例2 2段階完全情報2人ゲーム -縮約ゲームの戦略形は下のようになる。 (S) (B) (S S) 4,8 6,6* (S B) 4,8* 0,6 -均衡点は(B,SS), (S,SB)で、混合戦略を考え、 Γbにおいてプレイヤー 2がSをとる確率をqとすると、均衡点は、 である。これは、プレイヤー1の2の行動についての予測。 12 4.2. シュタッケルベルク均衡点 • シュタッケルベルク複占市場 -2段階完全情報2人ゲーム -クールノー複占市場をもとにした定義は、 • (1)プレイヤーを企業1と2とする。 (2)企業1と2は買い手から見て無差別な財を市場に提供している。 (3)財は無限に分割可能で、供給量は実数で表される。 (4)企業1,2の戦略を財の供給量とし、戦略の集合をそれぞれ とする。ここで、M1,M2は適当な正の数で、戦略は有限の範囲にある。 (5)財の価格をpとし、市場の需要関数を次のようにおく。 (6)2つの企業の費用関数を次のようにおく。 • (7)2つの企業は互いに話し合うことなく、供給量を決定する。 (8)第1段階で企業1がある量x1を供給し、第2段階で、企業2がそれを知ったうえで、ある量 x2を供給して、企業1と2の利得が定まり、ゲームは終了する。すなわち、2段階完全情報2人 ゲームである。 13 4.2. シュタッケルベルク均衡点 • 無限に選択肢があるが、数個の枝で代表させて図にすると、 利 得 x2 x2=0 x2 x2=M2 x2 x2=M2 x2=0 x2=0 x2=M2 P2 x1 x1=0 x1=M1 P1 14 4.2. シュタッケルベルク均衡点 • シュタッケルベルク均衡点 -企業1が戦略x1をとったとき、企業2の最適反応戦略は となる。 - とすると、 となる。 -したがって、財の価格、企業1・2の利得はx1を用いて、 となる。 -企業1は利得を最大化させるように行動するので、 -よってナッシュ均衡点は となる。 15 4.3. 完全均衡点の不完全性 4.3.1.チェーンストアパラドックス 例3.市場参入ゲーム -大手のチェーンストアが、ある町に支店を持っていて、ある商品を独占 的に販売している。そこで、小売店が同じ商品を扱う事業を始めるかどう か? -チェーンストアは、小売店が同じ事業を始めたときに、協調的態度か、 攻撃的態度をとる。別の事業の時はそのまま。 v.s. 16 4.3. 完全均衡点の不完全性 4.3.1.チェーンストアパラドックス 例3.市場参入ゲーム -展開形・戦略形は右図。 -部分ゲーム完全均衡点は (参入する, 協調的行動をとる) で、利得は(2, 2)。 -このほかにも (参入しない, 攻撃的行動をとる) という均衡点もある。 -これは不完全均衡点で「脅しの 戦略」になる。「もし君がその気な ら、僕にも考えがあるんだよ。」 チ ェ ー ン ス ト ア 小 売 店 o a 参入する 利得 (小,チ) 協調的 (2,2) 攻撃的 (0,0) ・ ・ 参入しない (1,5) 協調的 攻撃的 参入する 2, 2 0, 0 参入しない 1, 5 1, 5 17 4.3. 完全均衡点の不完全性 4.3.1.チェーンストアパラドックス 例3.市場参入ゲーム -もしn個の町があって、それぞれでチェーンストアが店を開いているとき、 次々と地元の小売店が、前の町の状況を知った上で、同じ事業に参入し ようとしている。 -それぞれの町は部分ゲームになる。もし、それぞれの町で、脅しの戦略 の通知が不可能ならば、チェーンストアは協調的行動をとらざるを得なく なる。 -したがって、チェーンストアは、最適に行動しようとすると、利得は¥が小 さくなるようにしか行動できない。部分ゲーム完全均衡点の概念は、 チェーンストアにとって、必ずしも、合理的とはいえない。 -現実には、通告の可能性に関わらず、どの町でも脅しの戦略を取って、 新規参入を阻止しようとする。つまり、この均衡点は現実にも合わない。こ れをチェーンストア・パラドックスという。 -前の町の評判が次の町に伝わる。→繰り返しゲームとしての考察。 18 4.3. 完全均衡点の不完全性 4.3.2. 合理性の限界 例4. ギブ・アンド・テイク・ゲーム -それぞれある技術を持つ2つの企業がプレイヤー。それを相手に教える (C)、教えない(D)という二つの行動を持つ。 -各手番で、(C)か(D)を選ぶ。(D)を選んだら、そこで試合終了だよ。教え たら、相手の手番に移る。 -プレイヤー1から始め、手番の数は8とし、第1の手番で終了したときの利 得は(1, 0)で、次の手番からは、教えないと、相手の利得は1減少し、自分 の利得は3増加する。 -展開形ゲームはこのようになる。 C P2 P1 P2 P1 C P2 P1 C C P2 P1 C C C C D D D D D D D D (1,0) (0,3) (3,2) (2,5) (5,4) (4,7) (7,6) (6,9) (9,8) 19 4.3. 完全均衡点の不完全性 4.3.2. 合理性の限界 例4. ギブ・アンド・テイク・ゲーム P P P2 P1 C D (1,0) 2 1 C D (0,3) C D (3,2) P2 P1 C D (2,5) C D (5,4) P2 P1 C D (4,7) C D (7,6) C (9,8) D (6,9) -長い期間にわたって教え続ければ、お互いに利益がある。 -しかし、プレイヤー2は、第8の手番で教えない方が利益が大きい。なの で、1は7番目でやめようとするが、そうすると2も黙ってはいない・・・。それ を繰り返していくと、結局最初から教えない方がよい、となってしまう。 -したがって、このゲームの完全均衡点は、常に(D)をとることである。これ は手番の数に関係ない。 -この結果は現実的なのか?普通は手番が多くなると、ギブ・アンド・テイク の気持ちが働くのでは? 20 4.3. 完全均衡点の不完全性 4.3.2. 合理性の限界 例4. ギブ・アンド・テイク・ゲーム -多くの場合、お互いに信頼し合っており、相手がプレイを継 続すると信じている。 -プレイヤーはそれぞれ、プレイが継続される(と思う)確率の 組(p, q)を持っているとき、プレイは継続されることになる。こ の確率の組は、共通の確信(common belief)と呼ばれる。 -共通の確信は、ゲームの要素として明示されない要因に依 存していると考えられる。 -人々は、長い人生において、このような確信を育てていくこ とに努力しているようである。 21