卒研発表 - 近畿大学理工学部情報学科

Download Report

Transcript 卒研発表 - 近畿大学理工学部情報学科

4人版リバーシYoninの解析
理工学部情報学科
情報論理工学研究室
10-1-037-0040
垰田基成
目次

Yoninとは

二人零和有限確定完全情報ゲーム

既存のリバーシの解析

YoninのAI

実験結果

結論・今後の課題
Yonin[1]とは

リバーシを4人用に拡張したゲーム
盤面を4x4の4つの陣地に分割、それぞれのプレイ
ヤーの陣地にする

リバーシ盤面
Yonin盤面
[1] 藤井ら, 2006
陣地
対面のプレイヤーの陣地
には着手不可

ゲーム終了時には、自分
の陣地の自色の石の数を
数える

二人零和有限確定完全情報ゲーム
零和…プレイヤーの利得の合計が常に零

有限…指し手の組み合わせが数が有限

確定…ランダム性がない

完全情報ゲーム…相手の手も含め過去、現在の情報を全て
知ることができる

理論上は完全解析可能

既存のリバーシの解析
既知の結果
リバーシ
6x6リバーシ
[2] J.Feinstein, 1993
二人零和有限確定完全情報ゲームに
対する手法

先読みと局面の評価値
数手先の局面を先読みし、局面の評価値を使って打つ手を
決定する


定石データベース・対戦データベース
定石や過去の対戦を元に局面ごとに有効な手があればそれ
を打つ

評価マップによる局面の評価
•各マスに値を付与、その合計値を評価値とする
•自駒なら正、相手駒なら負
•角マスに高評価、角に隣接するマスに低評価
評価マップの例
YoninのAI
•YoninのAIを作成
•評価値マップを使用
•陣地ごとに補正を加える
そのまま
-50 を加える
-50 を加える
-50 を加える
評価マップの補正の例
AIの戦略
AIの戦略
実験結果
試行回数:100回

Selfの結果が良い

Right以外のAIは平均順位が高い
実験結果
試行回数:100回

順番による大きな影響なし
まとめと考察

YoninのAIを作成
陣地ごとに評価値マップに補正をかける

補正により異なる性格のAIにできる

1位を多く取ることを目指すAI
平均順位を高くすることを目指すAI

結論・今後の課題
陣地を利用することで評価値マップに多様性が生ま
れる


勝敗が単なる勝ち負けでなく順位である

バリエーションに富んだAIを作成可能
結論・今後の課題

より強いAI作成のために
より深く先読み

評価値マップの改善

局面ごとの着手可能数、石ごとの連携の評価

参考文献
藤井昌典, 北隼人, 村田朋紀, 橋本隼一, 飯田弘之:4人版リバーシ
Yonin, 情報処理学会研究報告(2006),
http://ci.nii.ac.jp/naid/110004683810

Joel Feinstein, Amenor Wins World 6x6 Championships!, Forty
billion noted under the tree (July 1993), pp.6-8, British Othello
Federation's news, http://www.britishothello.org.uk/fbnall.pdf
