Nara Women`s University

Download Report

Transcript Nara Women`s University

Nara Women’s University
タンパク質立体構造における
時系列特徴抽出
木村紗知+ ,戸田幹人* ,関嶋政和‡
高田雅美+,野口保‡ ,城和貴+
+:奈良女子大学大学院
人間文化研究科
*:奈良女子大学 理学部 物理科学科
‡:産業技術総合研究所 生命情報工学研究センター
1
目次
立体構造変化を捉えることの重要性
構造から動きへ
Cαの運動方向についての解析
振動方向のクラスター分析と次元逓減化
2
Nara Women’s University
背景(1/2)
生物の体
主として 生体分子+水 で構成
タンパク質 (Protein)
– 生体内では揺らぎながら存在
• 熱運動
– 形状を変形し、他のタンパク質などと結合
多様な機能を実現
生体内における立体構造変化を捉える
3
– 機能予測に直結
Nara Women’s University
背景(2/2)
分子動力学シミュレーション(MD)
– 立体構造のトラジェクトリ
– 熱揺らぎを反映
– 類似構造が含まれる
特徴的構造の抽出
– クラスタリング
4
Nara Women’s University
構造から動きへ
タンパク質のクラスタリング
– 一般的には構造を用いる
熱揺らぎをしているタンパク質
– 時々刻々と周波数が変化している可能性
ウェーブレット解析
揺らぎのパターンでクラスタリング
– 熱揺らぎを受けたタンパク質の動きを捉える
5
Nara Women’s University
実験データ
1TIB
– 残基数:269
MDを2ナノ秒実行
200stepsの時系列
– 1stepの間隔は10ps
– 重心を合わせ、回転運動を取り除く
– Cαの空間座標
6
Nara Women’s University
パワースペクトル
定義式 E(, t ) 
| q (, t) |
~
n
n
qn : Cα 全体からなる系の自由度(268×3)
~
q n : qn をMorlet ウェーブレットを使って連続ウェーブレット変換
タイムステップ(t=0,…,199), 波数(ω=0,…,100),
ω
t
7
Nara Women’s University
特異値分解

定義
– 非正方行列から主要な特徴を取り出す
A  U V
行列A
– あるタイムステップ( ti )における
• 列:周波数
• 行:Cα
左特異ベクトル(U)
– Cαの動きを表す
右特異ベクトル(V)
– 周波数の動きを表す
A
=
分
解
U
Σ
V
8
Nara Women’s University
Cαの運動方向についての解析
第一主成分に対応する左特異ベクトル
– 行列Uの第一列ベクトル
– Cαのゆっくりとした大きな動きを表す
タンパク質の運動する方向を表すベクトル
vi
Cosθ
– 正:同じ方向に動く
– 負:反対の方向に動く
θ
vj
vi
vj
9
Nara Women’s University
Cαの運動方向(1/2)
集団AとBは反対方向に動いている
Time step:55
同じ方向に動く集団A
Cosθ>0.8
Cosθ<-0.8
同じ方向に動く集団B
10
Nara Women’s University
Cαの運動方向(2/2)
集団CとDは同じ方向に動いている
Time step:81
同じ方向に動く集団D
同じ方向に動く集団C
Cosθ>0.8
異なる時刻で
Cosθ<-0.8
異なる集団運動
11
Nara Women’s University
振動方向のクラスター分析(1/3)
内積を距離としてクラスター化
| e1 (ti )  e1 (t j ) |
e1 (ti )
:時間iにおける第一主成分に対応する
左特異ベクトル(行列Uの第一列ベクトル)
– 近い:1
• 同じ向きの振動
– 離れている:0
• 直行する振動
12
Nara Women’s University
振動方向のクラスター分析
(2/3)
クラスター性が低い場合
– なだらかに色が変化
:0
:1
t
t
13
Nara Women’s University
振動方向のクラスター分析(3/3)
クラスター性が高い
– 色の変化がはっきりクラスターに分かれる
考えられる原因
ローカルミニマムに陥る可
能性
グローバルミニマムで異な
る方向に運動する可能性
t
t
14
Nara Women’s University
本研究で用いたデータの
クラスター分析
タイムステップ:20~180
周波数:15~50, 150~185
クラスターAとBは直交する運動
クラスターB
クラスターA
15
Nara Women’s University
本研究で用いたデータの
クラスター分析
タイムステップ:20~180
周波数:15~50, 150~185
クラスターBとCは同じ方向を
向いている運動
クラスターC
クラスターB
16
Nara Women’s University
グラフスペクトル法
多次元データのクラスタリングや次元逓減
化に使用
2 を最小にする
K (   )

i, j
ij
類
似
度
大
i
j
小さくする
拘束条件:
T
  1
(J.Shi. and J.Malik., 2000)
i   j
クラスタリング
17
Nara Women’s University
ラグランジュの未定係数法
λ:未定係数
F ( )   Kij (i   j )  2 
2
ij
T
 2 (  K )  2 
T
T
を最小化する
一般化固有値問題
(  K )  
18
Nara Women’s University
固有ベクトルを用いた
次元逓減
固有値
k
( 0  0
 1  2 
・・・)

固有ベクトル  k

–  1 : 1 に対応

最適なクラスタリング
–  h (h≧2) : より値の大きな固有値に対応
より細かいクラスタリング

1

と  を用いて階層的クラスタリング
2
19
Nara Women’s University
振動方向の遷移の仮説
一つのミニマム内で振動方向が連続的に変化す
る場合
βの
各成分
の値
time
異なるミニマム間を遷移する場合
βの
各成分
の値
time
20
Nara Women’s University

固有ベクトル  1
21
Nara Women’s University

固有ベクトル  2
22
Nara Women’s University

 1 を用いたクラスタリング(1/2)
クラスター1
23
Nara Women’s University

 1 を用いたクラスタリング(2/2)

 2 でさらにクラスター化
クラスター1
クラスター2
24
Nara Women’s University

 2 を用いた
振動方向の遷移の諸相
サブクラスター1
25
Nara Women’s University


 1 と  2 の比較
クラスター内遷移

1
クラスター化

2
26
Nara Women’s University
クラスター内遷移を
どう考えるか?(1/2)
Y
× 底
Y方向
遷移のときに
運動が不連続に変化
鞍点
× 底
27
X
Nara Women’s University
クラスター内遷移を
どう考えるか?(1/2)
Y
× 底
X方向
振動はあまり変わらない
鞍点
× 底
射影する方向によって
振動の変化の
異なる側面が見られる
28
X
Nara Women’s University
まとめ
クラスタリングの着目点
– 構造から動きへ
ウェーブレット解析
– 異なる時刻で異なる集団運動をしていることを
確認
– 振動方向のクラスター分析と次元逓減
– 振動方向の遷移の諸相
29
Nara Women’s University
今後の課題
運動のクラスタリングと構造のクラスタリン
グの対応関係を調べる
より長い時系列に適用
30
Nara Women’s University
31
Nara Women’s University
ウェーブレット変換
周波数解析の手法
– 時間と周波数の変数に依存
– 定義式
~


2 
f (, t ) |  |  df ( )    t 



窓関数
– 解析対象の周波数に合わせた時間幅を持つ
周波数に対する解像度が一定
32
Nara Women’s University
解析に用いたウェーブレット
複素ウェーブレットのMorletウェーブレット
– 窓関数
2
 2

 ( )  Ce
 i  2 2 
e  e 4 




σ:窓の中に入っている波の数
33
Nara Women’s University
ウェーブレット変換の
出力ファイル
ファイル数:807
– 残基数269×原子の自由度3
ファイル内の記述
• 各タイムステップ(t=0, …, 199)
• 各波数(ω=1, …, 199)
周波数成分(Re, Im)
807個
34
Nara Women’s University
有限の幅を持つ実データを
ウェーブレットに適用する際の注意点
境界付近のデータ
信頼性:低い
– ウェーブレットの定義
• τの範囲:-∞から∞
– 実データ:有限の幅
時系列の端部分は除き、解析すべき
周波数
– 低周波数:境界の影響を受ける
– 高周波数:データが離散的になる
信頼性:低い
信頼性:低い
低周波数と高周波数は除き、解析すべき
35
Nara Women’s University
特異値分解

定義
– 非正方行列から主要な特徴を取り出す
A  U V
行列A
– 807行72列
• あるタイムステップ( t i )における
– 列:周波数(15~50, 150~185)
» 高周波と低周波を除く
– 行:Cα
左特異ベクトル(U)
– Cαの動きを表す
右特異ベクトル(V)
– 周波数の動きを表す
A
=
分
解
U
Σ
V
36
Nara Women’s University