ppt file - 医療情報システム研究室

Download Report

Transcript ppt file - 医療情報システム研究室

並列計算技術によるタンパク質の
構造解析
IBM RS/6000SPを用いた研究
同志社大学大学院 小掠真貴
同志社大学工学部 廣安知之
三木光範
同志社大学(学) 角美智子
研究背景
大規模な科学技術計算
タンパク質立体構造解析
地球外知的生命体探査
地球シミュレータ
画像処理
気象解析
流体解析
研究背景
タンパク質
生物の生命活動に必要
生物学的機能と密接な関係
アルツハイマー病,糖尿病
遺伝子を設計図として作られる
ヒトゲノム研究により
遺伝子情報が次第に明らかになる
遺伝子解析からタンパク質の立体構造解析へ
タンパク質の立体構造解析
タンパク質の構造
アミノ酸配列(一次構造)
立体構造
タンパク質立体構造解析の必要性
新薬の開発
病理の発現機構の解明
タンパク質の立体構造解析
数値計算によるタンパク質の立体構造解析
エネルギーが最も
低くなる状態を求める
最適化手法による
計算が必要となる
最適化問題としての
立体構造解析
最適化問題
ある条件のもとで,目的とするものを最小化(最大化)
するような変数を決定する問題
最も安く行きたい
40min
\120
A
30min
\150
最も早く行きたい
20min \120
30min
\100
50min
\60
42min
\90
115min \380
40min
\120
35min
\220
B
45min
\160
A
30min
\150
20min \120
30min
\100
50min
\60
42min
\90
95min \540
35min
\220
B
45min
\160
最適化手法
最適化手法の分類
数理的手法
最急降下法,ニュートン法など
現実問題を解くことは困難
発見的手法(ヒューリスティック法)
物理現象のアナロジー
生物進化のアナロジー
膨大な計算量
シミュレーテッドアニーリング (SA)
金属の焼きなまし(アニーリング)という物理現象を
コンピュータでシミュレートする方法
高温状態
低温状態
ゆっくり冷やす
エネルギーが大きく
不安定
エネルギーが小さく
安定
シミュレーテッドアニーリング (SA)
f (x1, x2)
SAのアルゴリズム
high temperature
初期化
low temperature
local minimum
Metropolis基準
P = exp
-(Enext-Ecurrent)
T
くり返し
評価
受理判定
クーリング
終了
温度
生成
global minimum
遺伝的アルゴリズム (GA)
生物の進化の過程を模倣した最適化手法
遺伝的アルゴリズム (GA)
f (x1, x2)
初期化
encode
評価
(3, 5 )
decode
くり返し
選択
交叉
突然変異
Individual :
0 1 0 1 0 1
x1
x2
chromosome
終了
(Genetic Operator)
Candidate
solution
遺伝的操作
GAのアルゴリズム
並列処理
プロセッサを複数個用いて,
複数の処理を同時並行的に行うこと
並列処理の必要性
計算の高速化
計算機システムの信頼性,分散性などの向上
並列処理
Time
計算時間の短縮
逐次処理
並列処理
task1
task1
task2
task3
task2
task3
並列処理
Time
プロセッサ間通信
逐次処理
並列処理
task1
task2
task3
task4
task5
task6
task1
task2
task3
communication
task4
task5
task6
IBM RS/6000SP
分散メモリ型超並列プロセッサ
13ノードで構成
Node4~13 : Type1
Node2, 3
: Type2
Node1
: Type3
IBM RS/6000SP
Type1 10ノードによる並列処理
ノード間通信
通信媒体 : SPスイッチ (150MByte/Sec)
Type1のハードウェア構成
遺伝的交叉を用いた
並列シミュレーテッドアニーリング
SAとGAのハイブリッドアルゴリズム
タンパク質の立体構造解析において,
従来のSAよりも性能が高いことが明らかとなっている
分散メモリ型並列計算機に実装するためには
新たなモデルが必要
RS/6000SPに実装するための
遺伝的交叉を用いた並列シミュレーテッド
アニーリングの並列モデルを開発
遺伝的交叉を用いた並列SAによる
タンパク質の立体構造解析
5つのアミノ酸からなるタンパク質Met-enkephalin
最小エネルギー構造
E < -11 kcal/mol
Met-enkephalin
設計変数 19個の二面角
1つの設計変数ごとに
アニーリングの処理を行う
19回のアニーリングの
処理を1MCsweepという
遺伝的交叉を用いた並列SAによる
タンパク質の立体構造解析
構造解析のモデル化とアルゴリズムの適用
1MCsweepあたり
19回のアニーリング
実験結果:解探索能力
0.93
0.90
0.90
実験結果:計算時間
810.53
544.31
409.78
結論
遺伝的交叉を用いた並列SAの並列実装モデル
を開発し,タンパク質立体構造解析をRS/6000SP
によって行った
90%以上の解探索能力
1.98倍の速度向上 (プロセッサ数2倍)
遺伝的交叉を用いた並列SAの実装モデルは
分散メモリ型並列計算機を用いての
タンパク質立体構造解析に有効である
fin
本研究の実施にあたり,岡崎国立共同研究機構
の岡本祐幸先生に多大なご指導をいただいたこ
とに深く感謝申し上げます.
IBM RS/6000SPの利用にあたり,ご指導くださ
いましたけいはんな通信放送機構(TAO)やIBM
の皆様に心より感謝申し上げます.