PPT - LOG OPT HOME | slideum.com

PPT - LOG OPT HOME

Transcript PPT - LOG OPT HOME

最短路プロジェクト
共同研究報告
2008年 2月
久保幹雄東京海洋大
宇野毅明国立情報学研究所
藤澤克樹中央大学
宮本裕一郎上智大学
プロジェクト概要
L1
L2
RAM
HD,Flash
ﾒﾓﾘ階層によ
る高速化
前処理による
クエリ高速化
対話型のための
モデルの拡張
Hi!
本年度の成果
メモリ階層の考慮
による高速化
• 実装＋実験
前処理による高速
化：
• 階層メッシュ疎化法：特許，実装，数値実験，論文投稿
• 2次元ビットベクトル法：アルゴリズムを改良，実装
• 経由点通過法：実装，改善，実装，予備実験
様々なモデルの拡
張に対する検討
•
•
•
•
時刻依存
確率的
動的
高速道路の時間帯別料金の考慮
前処理とクエリの分離（１）
２０００万点の
ネットワーク
最短路
ダイクストラ法１回
（数十秒）
旧来の方式
注：我が国のナビの最短路は最適でないヒューリスティクス
前処理とクエリの分離（２）
前処理（preprocessing）
２０００万点の
ネットワーク
補助データ
ダイクストラ法たくさん
（数時間；並列で数分）
クエリ（query）
補助データ
最短路
２０００万点の
ネットワーク
高速探索
（数ミリ秒）
前処理による高速化（１）
• ２次元ビットベクトル法
–
–
–
–
最初に開発したアルゴリズム
メモリアクセス小
前処理が遅い
アルゴリズムの改良＋実装（報告書に添付）
• 階層メッシュ疎化法
–
–
–
–
汎用の高速化法（他の解法と融合可）
（国際）特許申請
実装（報告書に添付）
実験＋論文投稿
前処理による高速化（２）
• 経由点通過法（transit node routing）
–
–
–
–
Bast-Funke-Sanders-Schultesが開発
最速のクエリ時間
Scientific American SciAM 50 awards受賞
（EUのグループなので）特許申請しない方針
=>自由に使える！
– 実装（報告書に添付）
– アルゴリズムの改善
• 未発表論文のバグの修正
• 「前処理の前処理」による高速化
• 並列による高速化（2CPUで1.8倍，4CPUで3.1倍）
経由点通過法のアイディア
アクセス
点
経由点の集合
（すべてのセルからのアクセス点）
Washington DC 9559点 =>経由点150程度抽出
経由点グラフ
総点数nに対して√nの点数から成るグラフ
=>全点間の最短路を事前に計算
経由点通過法の最短路クエリ
min [ 始点sからアクセス点A(s)への最短距離+
アクセス点 A(s)からアクセス点A(t)への最短距離+
アクセス点 A(t)から終点tへの最短距離 ]
経由点間の最短距離行列
s
t
経由点の高速計算
アクセス点
+2
+1
0
-1
-2
左
右
Sweep line（赤）を
またぐ端点への
最短路を解き，
左から右への最短路
上の点のみ残す
この操作をすべての
Sweep line（縦，横）
に対して行う
Sweep line
計算例
左の点集合と右の点集合
の間の最短路上の点が
経由点
経由点
にならなかった点
左
右
セルを細かい
順に計算し，
候補を限定する
左
右
左
右
予備実験によると，計算時間が1割から5割程度の減少
前処理の前処理（2-coreの計算）
次数（点に接続する枝数）
が0，1の点の除去
次数 2 の点の短絡除去
9559点から7048点に縮小
2core（New York）の例
264346点
365050枝
次数ヒストグラム
[0, 41169, 40354, 124535,
56998, 1124, 157, 8, 1]
143945点
240687枝
次数ヒストグラム
[0, 0, 0, 95607,
47282, 917, 134, 4, 1]
予備実験によると，計算時間が2割から8割程度の減少
メモリの階層構造
Intel Core 2 : E6600 2.4GHz の例
m : 10-3
n : 10-9
p : 10-12
fast
レジスタ
L1 キャッシュ：
アクセスコストの例
250[ps]
命令 32KB, データ 32KB
x4
TLB addr
L2 キャッシュ: 4MB
1 [ns]
x 100
RAM
100 [ns]
x 100000
slow
Disk(HDD)
10 [ms]
 始点と終点、それに現在の位置から次に訪れるメッシュを先読
みして、メモリから L2 キャッシュに移動してブロッキングする
構造体か配列か？
70.00
Computing Time [sec]
60.00
50.00
40.00
30.00
20.00
10.00
0.00
Xeon 2.33 Ghz / 16GByte
Opteron 2.0 GHz / 4GByte
bucket : structure
bucket : array
bucket : array
2-level Bucket
graph : structure
graph : structure
graph : array
(参考データ)
24.04
43.61
25.78
49.94
34.87
66.37
36.08
54.55
メモリアクセスのオーバヘッドの減少
＆ハードウェアプリフェッチの効果
モデルの拡張に対する検討
時刻依存
の移動時
間をもつ最
短路
不確実性
をもつ移動
時間をもつ
最短路
多目的を
有する最
短路
制約付き
最短路
＝＞アルゴリズムは完成，未実装
課題：前処理による高速化とどのように合わせるのか？
領域分割による前処理
New Yorkの15分割
領域の縁の点
まどの最短路
＋
縁の点間の最短路
＝
経由点通過法と
同様の高速化
分割の方法
• 施設配置問題へのアプローチ（点の座標情報を利
用し，重心に施設を配置することによるクラスタリン
グ）
k-means法，Weiszfeld法（2000万点だと遅い）
• グラフ分割問題へのアプローチ（異なる領域間に跨
る枝数（カット）を最小にするようにグラフをk-分割）
METISソルバー；早い（？）けど，飛び地ができる．
=>座標とグラフ情報を利用した大規模問題に対する
新解法

PPT - LOG OPT HOME

Transcript PPT - LOG OPT HOME

Directory