Transcript ppt file

各種PC クラスタの性能評価
同志社大学 工学部
廣安 知之
三木 光範
谷村 勇輔
日給 \5,000だったら
1ヶ月も働くと...
パソコン工房
89,800円
AMPHIS-1700M4R
Pentium 4 1.7GHz
Memory 256MB
HDD 40GB
DSO/Vパラダイス 81,800円
Magnate SDX
Pentium 4 1.6GHz
Memory 256MB
HDD 40GB
TWO-TOP
ViP 84N-SP1500
Pentium 4 1.5GHz
Memory 256MB
HDD 20GB
90,800円
コモディティハードウエア
CPU
ハードウエア
ネットワーク
性能の向上
価格の急激な下落
COTS (Commodity-off-the-Shelf)-based scalable
parallel systems
PCクラスタ
Hardware
CPU
memory
motherboard
hard disc
case
network card
cable
hub
Super Computer TOP 500
http://www.top500.org
Ranking
1
Name
# Proc
ASCI White
8192
Rmax
(Gflops)
7226
2 AlphaServer SC ES45/1 GHz
3024
4059
Power3 375 MHz 16 way
3228
3052
ASCI Red
9632
2379
ASCI Blue-Pacific
5808
2144
3
4
5
Super Computer TOP 500(self made)
http://www.top500.org
Name
# Proc
Rmax
(Gflops)
30
CPlant/Ross Cluster
1369
706.70
40
SCore IIIe/PIII 933 MHz
1024
618.30
86
Presto III Athlon 1.2 GHz
256
331.70
137
CLIC PIII 800 MHz
530
221.60
184
Netfinity Cluster PIII 1 GHz
320
184.40
Ranking
同志社大学 クラスタシステム
知能情報センター
Cambriaシステム
Cambriaシステム
複数のアプリケーションによる
PCクラスタ特性の比較
Cambriaシステム仕様
CPU
PentiumIII 800MHz 256CPU
Memory
256MB(計 65.536GB)
Network
Fast Ethernet
OS
Debian/GNU Linux
Compiler
gcc
Communication Lam-6.6b1
Gregorシステム仕様
CPU
Memory
PentiumIII 1GHz 128CPU
(64 Nodes dual processor)
512MB(計 32.768GB)
Network
Myrinet2000
OS
Kondara HPC(Red Hat系)
Compiler
gcc , g77
Communication MPICH1.2/GM1.3
Peak性能
128GFlops
Myrinet
Myricom社が開発
最大転送速度が
2Gbpsの高速通信
PCクラスタコンピューティングの
デファクト・スタンダードとして期待
ー Ethernetより優れた性能,
コストパフォーマンスを発揮
Linpack Benchmark
Top500などをはじめ広く使用
密行列の線形代数問題 ガウスの消去法
問題のサイズなどはユーザが指定
HPLを利用の際にはATLASを使用する
高速なCPU
多ノード
膨大なメモリ
高速なネットワーク
適切な放熱,電源処理
コンパイラに依存しない
並列計算
機の総合
的な評価に
向いている
Myrinet2000とEthernetの比較
Linpack Benchmarkはネットワークに依存する
Linpack 結果
Cambria
67.03/204.8 Gflops
(N=80000)
Gregor
69.94/128.0 Gflops
(N=40000)
公式記録
78.62GFlops
(84.58GFlops)
カットオフのある粒子シミュレーション
比較的,通信量が
大きくなるプログラム
領域をどう分割
するか?
カットオフ半径内に収ま
る粒子との相互作用を
考える
結 果
順位
プログラマ 実行結果 (秒)
5.98
マシン名
ピーク性能
(GFLOPS)
ノード数
HITACHI
SR8000/MPP
16 (128)
230.4
所属
東京大学大学院情報理工学系
研究科コンピュータ科学専攻
1
工藤誠
2
丸山直也
16.69
Gregor
64 (128)
128
3
丸山直也
21.09
Hitachi SR8000
32 (256)
256
4
丸山直也
54.70
40
320
5
丸山直也
67.73
11
約15
京都大学大学院情報学研究科
6
丸山直也
69.79
Fujitsu VPP800
Compaq
AlphaServer
DS20E×6
Compaq
AlphaServer
ES40×2
同志社大学工学部
産業技術総合研究所先端情報
計算センター
京都大学大型計算機センター
研究開発部
8
約10
7
丸山直也
87.05
ETL-Wiz
32
21.312
8
丸山直也
97.70
32
16
9
丸山直也
100.13
Presto Cluster
Fujitsu
GP7000/900
京都大学大学院情報学研究科
産業技術総合研究所情報処理
研究部門
東京工業大学 学術国際情報セ
ンター
14
16.8
10
丸山直也
253.56
10
8
11
丸山直也
496.90
Cambria
RCCP Hyades
Alpha-Cluster
8
9.6
京都大学大型計算機センター
同志社大学工学部
筑波大学計算物理学研究セン
ター
最適化における並列化
感度の並列化など
GAの並列化など
Distributed Genetic Algorithms
(Island GAs)
subpopulation
migration
DGA Benchmark
乱数発生の繰り返し
DGAによる処理速度の向上
まとめ
PCクラスタの性能
–CPU
–メモリ
–ネットワーク
–放熱問題
最適化問題
–感度の並列
–分散遺伝的アルゴリズム