Transcript ppt file
各種PC クラスタの性能評価 同志社大学 工学部 廣安 知之 三木 光範 谷村 勇輔 日給 \5,000だったら 1ヶ月も働くと... パソコン工房 89,800円 AMPHIS-1700M4R Pentium 4 1.7GHz Memory 256MB HDD 40GB DSO/Vパラダイス 81,800円 Magnate SDX Pentium 4 1.6GHz Memory 256MB HDD 40GB TWO-TOP ViP 84N-SP1500 Pentium 4 1.5GHz Memory 256MB HDD 20GB 90,800円 コモディティハードウエア CPU ハードウエア ネットワーク 性能の向上 価格の急激な下落 COTS (Commodity-off-the-Shelf)-based scalable parallel systems PCクラスタ Hardware CPU memory motherboard hard disc case network card cable hub Super Computer TOP 500 http://www.top500.org Ranking 1 Name # Proc ASCI White 8192 Rmax (Gflops) 7226 2 AlphaServer SC ES45/1 GHz 3024 4059 Power3 375 MHz 16 way 3228 3052 ASCI Red 9632 2379 ASCI Blue-Pacific 5808 2144 3 4 5 Super Computer TOP 500(self made) http://www.top500.org Name # Proc Rmax (Gflops) 30 CPlant/Ross Cluster 1369 706.70 40 SCore IIIe/PIII 933 MHz 1024 618.30 86 Presto III Athlon 1.2 GHz 256 331.70 137 CLIC PIII 800 MHz 530 221.60 184 Netfinity Cluster PIII 1 GHz 320 184.40 Ranking 同志社大学 クラスタシステム 知能情報センター Cambriaシステム Cambriaシステム 複数のアプリケーションによる PCクラスタ特性の比較 Cambriaシステム仕様 CPU PentiumIII 800MHz 256CPU Memory 256MB(計 65.536GB) Network Fast Ethernet OS Debian/GNU Linux Compiler gcc Communication Lam-6.6b1 Gregorシステム仕様 CPU Memory PentiumIII 1GHz 128CPU (64 Nodes dual processor) 512MB(計 32.768GB) Network Myrinet2000 OS Kondara HPC(Red Hat系) Compiler gcc , g77 Communication MPICH1.2/GM1.3 Peak性能 128GFlops Myrinet Myricom社が開発 最大転送速度が 2Gbpsの高速通信 PCクラスタコンピューティングの デファクト・スタンダードとして期待 ー Ethernetより優れた性能, コストパフォーマンスを発揮 Linpack Benchmark Top500などをはじめ広く使用 密行列の線形代数問題 ガウスの消去法 問題のサイズなどはユーザが指定 HPLを利用の際にはATLASを使用する 高速なCPU 多ノード 膨大なメモリ 高速なネットワーク 適切な放熱,電源処理 コンパイラに依存しない 並列計算 機の総合 的な評価に 向いている Myrinet2000とEthernetの比較 Linpack Benchmarkはネットワークに依存する Linpack 結果 Cambria 67.03/204.8 Gflops (N=80000) Gregor 69.94/128.0 Gflops (N=40000) 公式記録 78.62GFlops (84.58GFlops) カットオフのある粒子シミュレーション 比較的,通信量が 大きくなるプログラム 領域をどう分割 するか? カットオフ半径内に収ま る粒子との相互作用を 考える 結 果 順位 プログラマ 実行結果 (秒) 5.98 マシン名 ピーク性能 (GFLOPS) ノード数 HITACHI SR8000/MPP 16 (128) 230.4 所属 東京大学大学院情報理工学系 研究科コンピュータ科学専攻 1 工藤誠 2 丸山直也 16.69 Gregor 64 (128) 128 3 丸山直也 21.09 Hitachi SR8000 32 (256) 256 4 丸山直也 54.70 40 320 5 丸山直也 67.73 11 約15 京都大学大学院情報学研究科 6 丸山直也 69.79 Fujitsu VPP800 Compaq AlphaServer DS20E×6 Compaq AlphaServer ES40×2 同志社大学工学部 産業技術総合研究所先端情報 計算センター 京都大学大型計算機センター 研究開発部 8 約10 7 丸山直也 87.05 ETL-Wiz 32 21.312 8 丸山直也 97.70 32 16 9 丸山直也 100.13 Presto Cluster Fujitsu GP7000/900 京都大学大学院情報学研究科 産業技術総合研究所情報処理 研究部門 東京工業大学 学術国際情報セ ンター 14 16.8 10 丸山直也 253.56 10 8 11 丸山直也 496.90 Cambria RCCP Hyades Alpha-Cluster 8 9.6 京都大学大型計算機センター 同志社大学工学部 筑波大学計算物理学研究セン ター 最適化における並列化 感度の並列化など GAの並列化など Distributed Genetic Algorithms (Island GAs) subpopulation migration DGA Benchmark 乱数発生の繰り返し DGAによる処理速度の向上 まとめ PCクラスタの性能 –CPU –メモリ –ネットワーク –放熱問題 最適化問題 –感度の並列 –分散遺伝的アルゴリズム