EGFR inhibitor 11個

Download Report

Transcript EGFR inhibitor 11個

分子の立体構造と生命講義 7回目
3-Dimensional Molecular Structure for
the Life Science
•
•
•
北里大学薬学部3年前期選択 2008年4月-7月 12回
担当者 梅山秀明、竹田-志鷹真由子、寺師玄記、加納和彦
毎週月曜日4時限 2:30-3:45 港区白金キャンパス1501教室
•
•
•
•
•
•
•
•
•
Hideaki Umeyama, Ph.D., Professor
School of Pharmacy, Kitasato University
5-9-1 Shirokane, Minato-ku, Tokyo 108-8641, Japan
phone : +81-3-5791-6330 fax : +81-3-3446-9553
e-mail:[email protected]
港区白金5-9-1
北里大学薬学部教授
(理化学研究所客員主管研究員、東北大学未来研客員教授)
梅山秀明
•
•
•
•
•
http://famshelp.gsc.riken.jp/famsbase/index.html
http://www.pd-fams.com/index_ja.html
http://www.pharm.kitasato-u.ac.jp/bmd/files/achievement.html
http://www.pharm.kitasato-u.ac.jp/bmd/
http://h20pharm.kitasato-u.websyllabus.jp/content/versionview/235/29
他のドッキングソフトとの
結合モード予測成功率の比較(1)
PDBに登録されている複合体既知構造でのテスト
(116ターゲット;実験構造とRMSDが2Å以下で予測成功)
ChooseLD
ドッキングソフト
予測成功率 (%)
Corina
MINI
平均
DOCK
21.6
20.6
21.1
AutoDock
26.2
27
26.6
GOLD ChemScoreSTD
45.5
45.3
45.4
GOLD GOLDScoreLib
44.1
44.9
44.5
GOLD GOLDScoreSTD
45.2
46.7
46
Onodera et. al. J. Chem. Inf. Model. 47, 1609-1618 (2007)
Tc range
0.16 - 0.08
0.24 - 0.08
0.36 - 0.08
0.56 - 0.08
0.76 - 0.08
0.96 - 0.08
success rate(%)
12.6
20.8
29.2
40.1
44.8
46.4
Tc:Tanimoto係数
実験情報が増えるに従い、予測精度が上昇していく
と考えられる。
他のドッキングソフトとの
結合モード予測成功率の比較(2)
PDBに登録されている複合体既知構造でのテスト
(90ターゲット;GOLD,Glideの計算条件下;予測成功ターゲットの分布 )
GOLD成功 GOLD失敗
ChooseLD成功
38
16
ChooseLD失敗
23
13
Glide 成功
ChooseLD成功
42
ChooseLD失敗
23
Glide失敗
12
13
成功するターゲットにばらつきがあり、様々な
手法を併用することが新規阻害剤発見に必
須であると考える。
(1) ChooseLDのドッキング性能
• T85 のベンチマークセットをもちいたk1の最適化
• T133 を用いた予測精度の検証
(2) ChooseLDのインシリコスクリーニング性能
Epidermal growth factor receptor (EGFR)
を
ターゲットとした場合のk2 とk3の最適化
と
インシリコスクリーニング
EGFR kinase domain の阻害剤の探索を
サンプルとしてk2,k3を最適化する
ゲフィチニブ
(イレッサ)などが阻害
ファミリータンパク質立体構造アライメントによってEGFR
の活性部位(kinase domain) に複合体リガンドを集める。
このタンパク質結合リガンド群かから必要な部品である三次元FP を使って
未知の化合物リガンドをドッキングする
EGFR inhibitor情報の入手先
IC50既知化合物一覧(EGFR inhibitor 11個)
O
O
Cl
O
O
N
O
Cl
Cl
N
N
N
N
N
O
3um/L
N
O
3um/L
N
O
N
3nm/L
O
O
O
O
0.8um/L
O
O
O
O
O
N
N
O
O
N
1.2um/L
11nm/L
N
O
5um/L
N
O
N
O
O
N
O
2.4um/L
N
O
O
N
S
N
N
N
O
N
O
S
O
N
O
O
1.3um/L
35um/L
N
0.35um/L
Simulated annealing
Simulated annealing
新規関数FPAScore
が
最も高い複合体構造
で解答する
MDL CMC Libraryと新たに加えた
IC50既知 化合物(EGFR inhibitor 11個)とを用いたk2値の最適化
Enrichment curve
1.0  nafpk 2
fp _ volume(molecule)  ln
1.0  napk 3
k2
6000
0.5
1.0
2.0
3.0
4.0
5.0
random
5000
rank
4000
3000
2000
1000
0
1
2 3 4 5 6 7 8 9 10 11
the number of ranked compound
K2 =2.0のEnrichment curveが最適である
IC50既知化合物(EGFR inhibitor 11個)とMDL CMC Library を用いた
k3値の最適化(k2 = 1.0を使用した)
1.0  nafpk 2
fp _ volume(molecule)  ln
1.0  napk 3
Optimization of k3
Ranking sorted by
FPAScore
6000
5000
k3 0.5
k3 1.0
k3 2.0
random
4000
3000
2000
1000
0
1
2
3
4
5
6
7
8
9 10 11
the number of ranked compound
K3の変化に対してEnrichment curveが
あまり変化しなかったので、k3 = 1.0とした。
Tc 下限値の最適化 (上限値 1.00, 下限値 x )
(k1 = 4.0, k2 =2.0, k3 = 1.0) FP Library に対するリガンドの
類似性Tanimoto 係数(Tc)
rank
3000
下限値
2500
x
2000
0.08
0.16
0.24
0.32
1500
1000
500
0
1
2 3 4 5 6 7 8 9 10 11
The number of ranked compounds
FP Library に対するTc の下限値は 0.24 のときに
良好なEnrichment curveが得られた。
あまり似ていないタンパク質結合リガンドは含まない方が良い。
反対に、似ているものだけに絞っても好ましくない。
EGFR(Epidermal growth factor receptor)をター
ゲットタンパク質としたインシリコスクリーニングの
条件設定(IC50既知化合物の順位)
Fingerprint libraryに含め
るリガンドと試薬との類似度
の下限値
500位までに既知活
性化合物が5個出現
する。
FPAScoreによる順位
3000
2500
0.08
0.16
0.24
0.32
2000
1500
1000
500
0
1
2
3
4
5
6
7
8
9 10 11
化合物の出現個数(計11個)
試薬ライブラリ (MDL ACD Library)に対する
インシリコスクリーニングのための
絞込み条件1
• 下記のEGFR 特異的 FP band と試薬ライブラリ(MDL
ACD Library)の各化合物のFP band のTc を算出する
• 上記の記述に従って、計算されたTcの大きい順から試
薬ライブラリを20000 化合物までに絞り込む。
EGFR 特異的
FP band
EGFR のATPを基質とするkinase ドメインに対する
インシリコスクリーニングの結果(100位まで表示)
試薬ライブラリに
ATP 誘導体が多く存在する
オレンジはP原子
ATP誘導体を除外し、試薬ライブラリ
からドラッグライクの化合物を抽出す
る必要がある。
試薬ライブラリ (MDL ACD Library)に対する
インシリコスクリーニングのための
絞込み2: ドッキング構造絞り込み
• 分子量350以上800以下の低分子、リンを含まない。
• 重要な水素結合をしているか。(METの主鎖の窒素)
• タンパク質ーリガンドの衝突 2.0 A 以下が存在するドッ
キングリガンド分子をのぞき上位を選択した。
FPAScore 上位10個を表示
(スティックモデル)
Kinase ドメインの空間内におけ
る立体構造相補性を満たす
重要な水素結合を満たす
ドッキング構造がランキング
内に存在した。
購入可能な試薬(MDL ACD Library)であるの
で、すぐにでもEGFR kinase阻害剤の活性値の
測定が可能である。
既知阻害剤から得たFP Library を使用して、
EGFR kinase ドメインに対するインシリコスクリーニング:
FP Library を工夫することによりATP誘
導体をさける事が可能である。
結果のまとめ
• 新しく定義したFPAScore をSA( Simulated Annealing)で最適
化することによって、Rmsd 2.0 A 以下で予測できる割合は
GOLDと同程度である。
• Tc 上限値が低く設定した場合は DOCK, AutoDock と同程度であった。
• ChooseLDはGlide, GOLD, FlexXと比べて独自性があった。
• FPAScoreによるEGFRに対するドッキング構造の順位付け
に関して、k1 = 4.0, k2 =2.0, k3= 1.0 既知阻害剤を上位に
順位付けできるenrichment curveが得られた。
• EGFR kinase ドメインに対するインシリコスクリーニングに
おいて有望と考えられる化合物セットを得ることができた。
(実験で証明の必要有)
ChooseLDの適用例(結合実験の証明が必要)
1. Epidermal growth factor receptor (EGFR)の TGFα
binding ドメイン 阻害剤のインシリコスクリーニング
2. Vascular endothelial growth factor
(VEGF) Receptor- 2 にKRN633, KRN951をドッキング
3. Plasmodium falciparum enoyl acyl carrier protein
reductase に対する低分子(NAD)が介在した状態での
ドッキング
EGFR のTGFα binding ドメインの阻害剤の探索
二量体形成
阻害
EGFR二量体形成阻害剤のインシリコスクリーニング
TGFα binding
domain
EGFR (PDBID : 1MOX)
EGFRが二量体を形成するため
に必要なペプチドであり、
阻害剤のターゲットとなる
TGFα binding ドメイン 近傍に
TGF類似体のペプチドをFAMS Complex で
モデリングし、その側鎖を切り出した。
(同じFPが多数得られる主鎖は除いた。)
医薬品をドッキング
試薬をドッキング
タンパク質-タンパク質相互作用をFP Library
をとして使用できることを示した。
VEGFR-2 に対するKRN633, KRN951ドッキング構造の予測
Cl
O
O
O
H
N
H
N
N
N
O
KRN633
IC50 = 1.16nm/L
Mol Cancer Ther 2004;3(12).
Cl
O
H
N
H
N
O
N
O
O
O
FAMS(
J Mol Graph 18 258-72, 305-6 (2000))
でモデルを構築
N
KRN951
IC50 = 0.16nm/L
Cancer Res 2006; 66: (18).
(鋳型PDBID:2P2H_A
Homology:99.3%)残基欠損を補うため
KRN633
Simulated annealing
Simulated annealing
新規関数FPAScore
が
最も高い複合体構造
で解答する
VEGFR2 にKRN633をドッキング
ドッキングに使用されたFP Library の上位10
個のPDBID
2HZN_A , 1YWN_A , 2J5F_A , 2IVU_A ,
2H8H_A , 2OH4_A , 1GAG_A ,
1FPU_A ,2C0I_A , 2P4I_A
ChooseLDによる予測構造 10 個
Tc range 1.00 - 0.08
10個とも同様の構造が得られた。
予測構造のばらつきが少なく、信頼できる予測構造と考える。
VEGFR-2 にKRN951をドッキング
ドッキングに使用されたFP Library の上
位10個のPDBID
ChooseLDによる予測構造 10 個
2I0V_A , 2HZN_A, 2OH4_A , 1FGI_A ,
1YWN_A , 1FPU_A , 2OFU_A, 2C0I_A ,
2H8H_A , 2FGI_A
使用Tc range 1.00-0.08
FP Library Tc Maximum (0.29)
推定成功率24.3%
予測構造10個中8個がほぼ同じ構造であった。
Plasmodium falciparum enoyl acyl carrier protein reductaseに対
する低分子(NAD)が介在した状態でのドッキング
既知阻害剤
NAD
NADを含んだ複合体をターゲットとした。
医薬品ライブラリからドッキングし
FPAScore上位10構造を解答
NAD
ChooseLDはNAD, 水などの低
分子が介在してもドッキングが
可能である
Fingerprint alignment
Fingerprint
alignment
ChooseLD(CHOOse biological information SemiEmpirically on the Ligand Docking)法による
リガンドドッキング
ターゲットタンパク質の
三次元座標
ターゲットリガンドの
三次元座標
複合体構造を予測
ChooseLD法 概要
• PDBに対するホモロジー検索。
既知タンパク質ーリガンド複合体構造を入手
• タンパク質の立体構造アライメントにより、リガンド
をターゲットタンパク質の座標系に変換し、
figerprint library構築
(基本的な考え方:相互作用自由エネルギーを満たすと仮定した
figerprintを用いる)
• フレッキシブルリガンドドッキング
C/C++で記述した。約20,000行。
テキスト処理はスクリプト言語(Perl Ruby等)を用いた。
ChooseLD法 FPAScore(fingerprint alignment score)
自由エネルギー最小を満たすようなfingerprintを選び出す関数
FPAScore F (aligned_ fp, fp _ rmsd, molecule)
 BaseScore(aligned_ fp, fp _ rmsd)
 fp _ volume(molecule)
 fp _ contact_ surface(molecule)
BaseScore(aligned_ fp, fp _ rmsd) 
ドッキング項
RawScore(aligned_ fp)
1  ln( fp _ rmsdk1  1) (Figerprintの一致度)
1.0  nafpk 2
fp _ volume(molecule)  ln
1.0  napk 3
結合部位との衝突項
n
fp _ contact_ surface(molecule) 
density_ of _ atom(atom(i))
i 1
total _ density_ of _ atom(molecule)
結合部位との
接触項
並列計算を常時利用
大量の計算を複数の計算機に分散する
計算の
分散
FPAScore F (aligned_ fp, fp _ rmsd, molecule)
 BaseScore(aligned_ fp, fp _ rmsd)
 fp _ volume(molecule)
 fp _ contact_ surface(molecule)
結果の収集
計算機の数が増えるほど
 試薬リストを速く得ることができる
 大量のターゲットタンパク質に対してインシリコスクリーニングが可能となる
ChooseLD法の使用プロトコル(rsh;メモリ非共有型並列計算)
その他のプロトコル
世界中のネットワークにつながっている個人使用のデスクトップコン
ピュータを計算資源にする試み(BOINC等)
バーチャルライブラリの構築
(リガンドドッキングの準備過程)
• MDL® Available Chemicals Directory(年4回更新)
• MDL® Comprehensive Medicinal Chemistry(年1回更新)
• ナミキ商事 HTS 300万化合物
PostgreSQLを用いたテーブルによる化合物絞り込み、および
検索高速化
Tanimoto係数検索用関数をPostgresSQLの拡張関数として
C言語で実装
インシリコスクリーニングの結果整理
(阻害剤候補リスト)
SQLiteによる検索プログラムの実装
細かな検索条件の指定が可能(Perl、 Rubyで実装した)
Webインターフェイスを介した結果の視覚化
ディスカッションに
使用できる。
iPS細胞時代における
インシリコスクリーニングの役割
iPS細胞
テーラーメイド医療
個人特有の細胞、組織、
臓器
in-vitro
活性試験
In-vitro とin-vivo の
中間の活性試験
in-vivo
活性試験
新薬の有効性、安全性試験
インシリコスクリーニングの加速
が必要となる。
結論
• 新しく定義したFPAScore を用いるバイオインフォマティクスに基づい
たリガンドドッキングとインシリコスクリーニング法、ChooseLD を開
発した。
• FPAScore をSimulated Annealing で最適化する方法によって、
Rmsd 2.0 A 以下で予測できる割合はGOLDと同程度であり、Tc上
限値が低い場合は DOCK, AutoDock と同程度であった。
• 性能は既存の古典的物理関数を用いるアルゴリズムと同程度であり、
Glide, GOLD, FlexXと比べて独自性があった(従来法との併用でイ
ンシリコスクリーニングの精度が上昇すると期待される)。
• EGFR のkinaseドメインを用いてターゲットタンパク質に応じて、
FPAScore のk1, k2, k3 を最適化することにより良好なenrichment
curve が得られることを示した。
• 応用としてEGFR dimer 阻害剤インシリコスクリーニング、VEGFR2に対するKRN633, KRN951をドッキング、マラリアの標的タンパク
質に対するインシリコスクリーニングでChooseLDの可能性を示した。
今後の検討課題
• 最適化アルゴリズムの改良
遺伝的アルゴリズム、レプリカ交換法等
• 配列的に似ていない既知複合体構造からFP
Library Ligand をえる
PSI-Blast : Sequence-Profile Alignment
-> Profile-Profile Alignment
• FP が全く存在しない場合への対応
3D1Dスコアが優位になるようにリガンドを配置
既存物理関数のドッキングソフトを用いてFP
Library Ligand を作成
現状の課題
• 最適化アルゴリズムの改良
遺伝的アルゴリズム、レプリカ交換法等
• 配列的に似ていない既知複合体構造からFP Library を
得る
PSI-Blast (Sequence-Profile Alignment) に加えて
SPARK2, SP3 (Profile-Profile Alignment)
• FP が全く存在しない場合への対応
3D1Dスコアが優位になるようにリガンドを配置したり、古
典的物理関数のドッキングソフト等を用いてFP Library
を構築する
* 将来、PDBの登録数の増加に伴い、ChooseLDの精度
が向上すると考える。
下記の発表資料を参考にしました。
平成19年12月3日 課程博士 公開論文発表会
バイオインフォマティクスに基づいた
リガンドドッキングと
インシリコスクリーニング法の開発
生物分子設計博士課程
DP-05103 高谷大輔
指導教授 梅山秀明
分子の立体構造と生命講義 7回目
3-Dimensional Molecular Structure for
the Life Science
•
•
•
北里大学薬学部3年前期選択 2008年4月-7月 12回
担当者 梅山秀明、竹田-志鷹真由子、寺師玄記、加納和彦
毎週月曜日4時限 2:30-3:45 港区白金キャンパス1501教室
•
•
•
•
•
•
•
•
•
Hideaki Umeyama, Ph.D., Professor
School of Pharmacy, Kitasato University
5-9-1 Shirokane, Minato-ku, Tokyo 108-8641, Japan
phone : +81-3-5791-6330 fax : +81-3-3446-9553
e-mail:[email protected]
港区白金5-9-1
北里大学薬学部教授
(理化学研究所客員主管研究員、東北大学未来研客員教授)
梅山秀明
•
•
•
•
•
http://famshelp.gsc.riken.jp/famsbase/index.html
http://www.pd-fams.com/index_ja.html
http://www.pharm.kitasato-u.ac.jp/bmd/files/achievement.html
http://www.pharm.kitasato-u.ac.jp/bmd/
http://h20pharm.kitasato-u.websyllabus.jp/content/versionview/235/29