奈良女子大集中講義

Download Report

Transcript 奈良女子大集中講義

奈良女子大集中講義
バイオインフォマティクス (9)
相互作用推定
阿久津 達也
京都大学 化学研究所
バイオインフォマティクスセンター
講義予定
• 9月5日
–
–
–
–
分子生物学概観
分子生物学データベース
配列アラインメント
実習1(データベース検索と配列アラインメント)
• 9月6日
–
–
–
–
モチーフ発見
隠れマルコフモデル
カーネル法
進化系統樹推定
• 9月7日
–
–
–
–
タンパク質立体構造予測
相互作用推定
スケールフリーネットワーク
実習2(構造予測)
内容
• 相互作用の種類
• 遺伝子ネットワーク推定
• タンパク質相互作用推定
相互作用の種類
• 遺伝子間相互作用
– どの遺伝子が、どの遺伝子を、どのように制御する
か?
• タンパク質間相互作用
– どのタンパク質と、どのタンパク質が結合するか?
• 化合物-タンパク質間相互作用
– どの化合物と、どのタンパク質が結合するか?
• タンパク質-DNA間相互作用
– どのタンパク質が、DNAのどの部分に結合するか
?
遺伝子発現データからの遺伝子ネットワーク推定
• DNAマイクロアレイ・
DNAチップ技術の進歩
により、数千種類の遺
伝子の発現量が同時に
測定可能となった
• そこで、環境変化(熱シ
ョック、栄養状態)や発
生、細胞分裂時の遺伝
子の時系列データを観
測して、その結果から
遺伝子の制御関係(ネ
ットワーク)を推定
ネットワーク推定のための離散モデル
• ブーリアンネットワーク
– 発現状態を 0,1 の2値で表現し、ブール関数により制御規
則を表現
– デジタル回路と本質的に同じ
• ベイジアンネットワーク
– 制御規則を確率的な規則を用いて表現
• ペトリネットモデル
– トークンの遷移規則により制御規則を表現
ネットワーク推定のための連続モデル
• 線形微分方程式系
– 線形の微分方程式で制御規則を表現
• 非線形微分方程式系
– 非線形の微分方程式で制御規則を表現
• グラフィカルモデリング
– 変数の因果関係をグラフと確率を用いて表現
• ハイブリッドペトリネット
– 微分方程式 + ペトリネット
線形微分方程式系を用いたネットワーク推定(1)
• vi(t): 遺伝子 vi の時刻 t における発現量
• 各遺伝子の発現量の変化が以下の微分方程式に従うと仮定
• 問題: t=Δ, 2Δ, 3Δ, 4Δ, … における vi(t) の値が与えられたとし
て、すべての ai,j を推定
dv i ( t )
dt
 a i , 0  a i ,1 v1 ( t )  a i , 2 v 2 ( t )    a i , n v n ( t )
• 推定法: dvi(t)/dt を (vi(t+Δ) - vi(t))/Δ で近似 ⇒ 差分方程式
vi (t   )  vi (t )

 a i , 0  a i ,1 v1 ( t )  a i , 2 v 2 ( t )    a i , n v n ( t )
• vi(t+Δ) - vi(t) は定数とみなせるので、この式は ai,j を
未知変数とする連立一次方程式
• 最小二乗法などを用いて最適な解を計算
線形微分方程式系を用いたネットワーク推定(2)
•
•
vi(t): 遺伝子 vi の時刻 t にお
ける発現量
問題: t=Δ, 2Δ, 3Δ, 4Δ, … に
おける vi(t) の値が与えられた
として、すべての ai,j を推定
dv 1 ( t )
dt
dv 2 ( t )
dt
dv 3 ( t )
dt
 a 1 , 0  a 1 ,1 v 1 ( t )  a 1 , 2 v 2 ( t )  a 1 , 3 v 3 ( t )
 a 2 , 0  a 2 ,1 v 1 ( t )  a 2 , 2 v 2 ( t )  a 2 , 3 v 3 ( t )
 a 3 , 0  a 3 ,1 v1 ( t )  a 3 , 2 v 2 ( t )  a 3 , 3 v 3 ( t )
dv 1 ( t )
dt
dv 2 ( t )
dt
dv 3 ( t )
dt
•
この例のグラフと微分方程式の関係はイメージ図であり正確ではない
 1 .5  1 .2 v 2 (t )
 2 . 0  0 . 5 v1 ( t )  1 . 2 v 3 ( t )
  1 . 0  1 . 3 v1 ( t )
ドメイン間相互作用に基づくタンパク質相互作用推定
• タンパク質はドメインとよばれる部品から構成
されていると考えられる
• ドメイン間相互作用を直接計測するのは難し
いか、一部のタンパク質間相互作用は実験に
より計測可能
• 既知のタンパク質間相互作用データからドメ
イン間相互作用を予測
• 未知のタンパク質間相互作用を、予測したドメ
イン間相互作用から推定
ドメイン間相互作用の予測(例)
• 左側の3種類の相互作用データから、右のドメイン間相互作用
を推定
P1
P3
D1
D2
P5
D1
D3
D2
D5
D4
D4
D7
D6
D8
P4
D2
D4
D7
D8
P4
D3
D5
D4
D5
P2
D1
ドメイン間相互作用の確率モデル
• 確率モデル[Deng et al., 2002]
– どれか1組ドメインが相互作用すれば、
タンパク質どうしが相互作用
– 各ドメインペアの相互作用の確率は独立
– Pij=1: タンパク質 Pi と Pj が相互作用
– Dmn=1: ドメイン Dm と Dn が相互作用
Prob ( Pij  1)  1 
 (1  Prob(
D mn  Pij
Pi
Dm
Dn
Pj
D mn  1))
アソシエーション法
• 既知データからのドメインどうしの相互
作用の確率を頻度に基づいて推定
• Imn: ドメインペア Dm, Dn を含むタンパ
ク質のペアのうち、相互作用しているペ
アの個数
• Nmn: ドメインペア Dm, Dn を含むタンパ
ク質のペアの個数
Prob ( D mn  1) :
I mn
N mn
Pi
Dm
Dn
Pj
EM法
• 尤度を以下(L)のように定義し、それを極大化する一般手
法である EM法 を適用
• fp: false positive rate, fn: false negative rate
• Pij: Pi と Pj が相互作用する確率
• Oij: Pi と Pj の相互作用が観測される確率
fp  Pr( O ij  1 | Pij  0 )
fn  Pr( O ij  0 | Pij  1)
Pr( O ij  1)  Pr( O ij  1, Pij  1)  Pr( O ij  1, Pij  0 )
 Pr( Pij  1)( 1  fn )  (1  Pr( Pij  1)) fp
L

(Pr( O ij  1)
Oij
(1  Pr( O ij  1))
1  Oij
まとめ
• 相互作用予測
– 様々な相互作用の種類がある
• 遺伝子間相互作用、タンパク質間相互作用、 ...
• 遺伝子間相互作用推定(遺伝子ネットワーク推定)
– 様々な数理モデルを用いた様々な方法が提案されている
– しかし、決定版とよべる方法はなく、高精度の予測は難しい
• タンパク質間相互作用推定
– こちらも、様々な方法が提案されている
– やはり、決定版とよべる方法はなく、高精度の予測は難しい
• 参考文献
1. 阿久津:バイオインフォマティクスの数理とアルゴリズム、共立出版、2007.