Transcript Document

協働群における行動戦略最適化
IKKI@倉B研
2003.10.10
目的
複数エージェントによる共同作業の時間短縮

レスキューロボットなど
©
読
売
新
聞
目的
複数エージェントによる共同作業の時間短縮

レスキューロボットなど
マルチエージェント巡回セールスマン問題

目標の位置、各エージェントの位置は既知
最適な戦術は状況によって異なる
相手の行動に応じて最適な戦術を選ぶ
戦術と戦略
状況
行動ルール行列
t
f
戦術
b
行動ルール
戦術と戦略
状況
t
f
戦術
b
行動ルール行列
戦略
目標選択ベクトル

行動ルール
自機の戦略最適化
競合確率を最小化

他機と同じ目標はなるべく避ける
他機の目標選択ベクトル(推定)
競合確率
エージェント数
自機の目標選択ベクトル
他機の戦略推定
相手の行動を k 回観測

目標選択の誤差が最小となる戦略
目標選択ベクトル(推定)
目標選択ベクトル(観測結果)
シミュレーション
戦略固定

計画のみ
戦略切替

計画/貪欲/近傍
今後の課題
行動の評価
推定誤差の評価
人間の行動推定

必要な基底戦略は?
人間との協働実験


全方向移動ロボット
飛行船による観測システム