低分子化合物の結合情報を含む高精度タンパク質 立体構造予測
Download
Report
Transcript 低分子化合物の結合情報を含む高精度タンパク質 立体構造予測
低分子化合物の結合情報を含む高精度タンパク
質
立体構造予測データベースを全世界に公開
-創薬研究の効率化や新規機能性生体物質の創製に向けて-
2006.9.28 2:00PM
独立行政法人 理化学研究
所
ゲノム科学総合研究センター
タンパク質構造・機能研究グループ
タンパク質とは
アミノ酸(20種類)がつながり、3次元的な「立体構造」(形)をとったもの
アミノ酸配列
Glu
RNA
X線結晶解析
NMRなどから
得られた立体
構造情報
DNA
遺伝子配列
1
ホモロジーモデリングとは
立体構造未知のタンパク質(目的タンパク質)の立体構造を、類似のアミノ酸配
列をもつ立体構造既知のタンパク質(参照タンパク質)を参照して予測する方法
アミノ酸配列
コンピュータを用いた
ホモロジーモデリング
目的タンパク質
(立体構造未知)
X線結晶解析
NMRなどから
得られた立体
構造情報
参照タンパク質
(立体構造既知)
標的タンパク質の立体構造予測(モデリング)
医薬品開発など
ホモロジーモデリング法の開発
FAMS
CHIMERA
様々な情報や研究者の工
夫を入れながら、対話的に
モデリングできるシステム。
CHIMERAの工程の自動化
を目指して開発されたシステ
ム。ゲノムワイドなモデリング
に適している。
SKE-CHIMERA
CHIMERAとFAMSを統合したウェブユーザーフェースシステム
モデリングの際に参考になる様々な情報をデータベース化し、自動化
できる部分は自動化されているため、簡便に大量な情報を取り入れな
がら対話的にモデリングを行うことができるシステム。創薬などにおいて
求められる高精度なモデルを構築するのに適している。
タンパク質の機能、リガンドとの相互作用などを考える際に、側鎖のコンフォ
メーションは非常に重要。そこで、主鎖構造のみならず、側鎖構造も精度良く
予測できることを目指した。
データベース構築の流れ
構造未知タンパク質のアミノ酸配列
SKE-CHIMERA
CHIMERA
(インタラクティブ)
アライメント
研究者はウェブユーザーインターフェースを通し
て、CHIMERAとFAMSの繰り返しにより、優れた
立体構造のモデルに仕上げることができる
FAMS
(全自動システム)
繰り返し
データ
ベース
モデル
RIKEN FAMSBASE
・高精度なタンパク質立体
構造予測(モデリング)情報
・ヒト遺伝子モデリングデータ
・ラット、マウス実験動物遺伝子モデリングデータ
・全タンパク質モデリングデータ
・全277生物種遺伝子モデリングデータ
モデル構築
モデリング情報、低分子化合物情報などを含め
たデータベース、およびこれらの情報を最新の
状態に維持するためのシステムを構築した。
・モデリングされたタン
パク質データの評価値
・タンパク質に結合する
低分子化合物情報
・タンパク質の説明
RIKEN FAMSBASEのホームページ
http://famshelp.gsc.riken.jp/famsbase/
全277生物種遺伝子
モデリングデータ
全タンパク質
モデリングデータ
ラット、マウス遺伝子
モデリングデータ
ヒト遺伝子
モデリングデータ
検索画面
ゲノム名検索
遺伝子番号検索
タンパク質構造番号検索
期待値検索
配列相同性検索
キーワード検索
アミノ酸配列検索
検索結果画面の例
GDT_TS
=90
GDT_TS
=48
評価値 GDT_TS : Global Distance Test Total Score
検索結果画面の例
GDT_TS
=90
GDT_TS
=48
評価値 GDT_TS : Global Distance Test Total Score
RIKEN FAMSBASEの使い方ーアミノ酸配列からモデリングする場合ー
まず、 http://famshelp.gsc.riken.jp/famsbase/
を経由してRIKEN FAMSBASE
http://famshelp.gsc.riken.jp/famsbase/famsbase.html
に入ります。
一方、ブラウザの別ウインドウで、http://www.ncbi.nlm.nih.gov
サイトを開いて調べたい立体構造未知のタンパク質のアミノ酸配
列を入手する。
Searchウインドウに、目的タンパ
ク質名、例えば「human
multidrug resistance protein
MDR1」を入力して「Go」をクリッ
クします。
P08183 を選択します。
「Human
FAMSBASE」
を選択します。
最初はDisplay: 「GenPept」の
ページが現れるので、Display の
プルダウンメニューから「FASTA」
を選択します。
FASTA のページが現れます。
RIKEN FAMSBASEの検
索画面の Sequence
Search (BLAST) にアミノ
酸配列をペーストし、直下
の「BLAST search」 ボタ
ンをクリックします。
次頁へ
目的タンパク質表
示されたアミノ酸配
列を範囲選択&コ
ピーします。
前頁から
タンパク質立体構造ビューワーソフトでダウンロードさ
れた構造情報ファイル(この例では MDR1 のモデルと
reference PDB: 1Z2R の重ね合わせ)を読み込み、
ビューワーソフトの表示方法を操作すると、このような
タンパク質立体構造を見ることができます。
BLAST の結果画面で
Score の値が最高値を
示している「2484」の部
分をクリックします
BLAST の結果画
面で
「NP_000918.2」
をクリックします。
BLAST の結果の詳細
が表示されます。
reference PDB
の PDBID
「1Z2R」をクリッ
クします
上段には立体構造データファイ
ルのダウンロードのボタン等、
中段には reference PDB のア
ミノ酸配列との比較、配列比較
の下にはリガンド情報が表示さ
れます。
「Superimpose」ボタンをクリッ
クすると、RIKEN FAMSBASE
の検索画面(前頁)でアミノ酸配
列入力をした目的タンパク質
(human multidrug resistance
protein MDR1) のモデルと、モ
デルを作る土台となるタンパク
質の立体構造(reference
PDB)を重ね合わせた構造情
報ファイル(拡張子pdb)が自動
的にダウンロードされます。
モデリングデータや評価値
の一覧表が表示されます。
RIKEN FAMSBASE トップページの上段の「Simple Japanese explanation to use RIKEN FAMSBASE from a journal site」から簡単な日本語マニュアルが、
また、「Searching examples for Riken Famsbase」から詳しい使い方や実例を紹介したファイルがダウンロードできます。
RIKEN FAMSBASE トップページの下段の Links に、タンパク質立体構造ビューワーソフト (PYMOLなど) へのリンクが貼ってあります。
モデリングから得られた立体構造とモデリングに使用した
参照タンパク質の立体構造を重ね合わせた例
数字は評価値 GDT_TS (Global Distance Test Total Score)。評価値が高いほど重ね合わせた構造はよく一致している。
60
タンパク質立体構造予測の国際コンテスト
Critical Assessment of Techniques for
Protein Structure Prediction Round 6 (CASP6)
http://predictioncenter.org/casp6/Casp6.html
タンパク質立体構造予測の精度を競う国際 blind コンテスト
実験的に立体構造が解明(公開)される直前のタンパク質
のアミノ酸配列が出題される。
参加者は、予測モデルを期限日までに提出する。
CASP6(2004年) SKE-CHIMERAを用いて本研究室も参加
6月7日~9月2日 コンテスト開催
出題ターゲット数 : 64 (90ドメイン)
参加グループ数 : 266
12月4日~8日 結果発表会 (Gaeta in Italy)
主催者側から成績が発表される。
成績が優秀であった上位入賞グループは、招待講演を行う。
December 5th: Homology Based Modeling Day
http://predictioncenter.org/casp6/meeting/presentations/CASP6_Program.doc
assessorによる評価
9:00 CM/easy, CM/hard
Alfonso Valencia
10:00 FR/H
Roland Dunbrack
11:10 Group 450 Ginalski
Krzysztof Ginalski
11:30 Group 176 Skolnick-Zhang
Jeffrey Skolnick
11:50 Group 591 VENCLOVAS
Ceslovas Venclovas
12:10 Group 272 CBRC-3D
Kentaro Tomii
12:30 Group 454 CHIMERA
Mayuko Takeda-Shitaka
12:50 Group 35 GeneSilico-Group
Marcin Feder
招待講演
18:30 Group 242 ZHOUSPARKS2
Yaoqi Zhou
(server)
18:50 Group 400 ACE
Ming Li
招待講演
(human predictor)
独自に開発したシステムを用いて参加し、250を超える参加グループの中で、
予測構造の正確さで国際的に高い評価を得ることができた。
Takeda-Shitaka M. et al., Proteins, 61 Suppl 7, 122-127 (2005).
コンテストに使われたタンパク質の例
Target 229_2 (37%) TM0919, T. maritima (CM/easy)
psipred
sam-t02-dssp
sam-t02-stride
robetta-jufo-3d
profsec
:CEEEECCCEEEEEECCCCEEEEECCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCEEEEEEEEEECCCCCCCEEEEEEEEEE
:CEEEECSTCEEEEEETTSEEEEECCCHHTTTCTCCCCHHHHHHHHHHHHHHHHHHHHHHHTTCCCCCEEEEEEEEEECCTTSCCEEEEEEEEEEE
:CEEEEETTTEEEEEETTTEEEEEETTTTTTTTTTCCCHHHHHHHHHHHHHHHHHHHHHHHHCCCCCTTEEEEEEEEECTTTTTTEEEEEEEEEEE
:CEEEEECCEEEEEEECCCCEEECCCCCCCCCCCCCCCCHHHHHHHCCCCCHHHHHHHHHHHCCCCCCEEEEEEEEEEECCCCCCCEEEEEEEEEE
:CEEEEECCCEEEEECCCCCEEEECCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCEEEEEEEEEECCCCCCEEEEEEEEEEE
T0229
:MQARWIGNMMFHVRTDSNHDVLMDTKEEVGGKDAAPRPLELVLTGLMGCTGMDVVSILRKMKVIDQMKDFRIEIEYERTEEHPRIFTKVHLKYIF
:ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGR--QDVVDCEVKLTSERRE---RLFTHINLHFIV
:ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGR--QDVVDCEVKLTSERRE---RLFTHINLHFIV
:ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGR--QDVVDCEVKLTSERRE---RLFTHINLHFIV
:ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQ--DVVDCEVKLTSERRE---RLFTHINLHFIV
:ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQ--DVVDCEVKLTSERRE---RLFTHINLHFIV
:ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQ--DVVDCEVKLTSERRE---RLFTHINLHFIV
:ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQD--VVDCEVKLTSERRE---RLFTHINLHFIV
:ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQD--VVDCEVKLTSERRE---RLFTHINLHFIV
:ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQD--VVDCEVKLTSERRE---RLFTHINLHFIV
:ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQDV--VDCEVKLTSERRE---RLFTHINLHFIV
:ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQDV--VDCEVKLTSERRE---RLFTHINLHFIV
:ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQDV--VDCEVKLTSERRE---RLFTHINLHFIV
:ARVKWVEGLTFLGESASGHQILMDG----NSGDKAPSPMEMVLMAAGGCSAIDVVSILQKGR--QDVVDCEVKLTSERRE---RLFTHINLHFIV
:ARVKWVEGLTFLGESASGHQILMDG----NSGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQ--DVVDCEVKLTSERRE---RLFTHINLHFIV
:ARVKWVEGLTFLGESASGHQILMDG----NSGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQD--VVDCEVKLTSERRE---RLFTHINLHFIV
:ARVKWVEGLTFLGESASGHQILMDGNS----GDKAPSPMEMVLMAAGGCSAIDVVSILQKGR--QDVVDCEVKLTSERRE---RLFTHINLHFIV
:ARVKWVEGLTFLGESASGHQILMDGNS----GDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQ--DVVDCEVKLTSERRE---RLFTHINLHFIV
:ARVKWVEGLTFLGESASGHQILMDGNS----GDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQD--VVDCEVKLTSERRE---RLFTHINLHFIV
:ARVKWVEGLTFLGESASGHQILMDG----NSGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQDV--VDCEVKLTSERRE---RLFTHINLHFIV
psipred
sam-t02-dssp
sam-t02-stride
robetta-jufo-3d
profsec
:EECCCCCHHHHHHHHHHHCCCCCCEEEECCCCCEEEEEEEECC
:ECSSCCCHHHHHHHHHHHHHHHHHHHHHHTTCCEEEEEEEEEC
:ECTTTCCHHHHHHHHHHHHHTCCCHHHHHTTTEEEEEEEEECC
:EEECCCCHHHHHHHHHHHCCCCCCCCCHHCCCEEEEEEEEECC
:EECCCCCHHHHHHHHHHHHHCCCCCEEEECCCCEEEEEEEECC
T0229
:KFDGEPPKDKVEKAVQLSQEKYCSVSAILKCSSKVTYEIVYEN
:TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA
:TGRD-LKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA
:TGRDL-KDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA
:TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA
:TGRD-LKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA
:TGRDL-KDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA
:TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA
:TGRD-LKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA
:TGRDL-KDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA
:TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA
:TGRD-LKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA
:TGRDL-KDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA
:TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA
:TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA
:TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA
:TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA
:TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA
:TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA
:TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVV
model
native: 1vla
GDT_TS = 80.15
The highest score
among the participants.
タンパク質立体構造情報に基づく合理的薬剤設計
(SBDD:Structure-Based Drug Design)
SBDD研究のながれ
ゲノム情報の解読
創薬ターゲットの
選定
計算による立体
構造予測
タンパク質の機能は,特異的に結合する分子(基質)と
の相互作用により制御され,この結合には立体構造的
な相補性が重要な役割を果たす.一方,疾病の多くは,
タンパク質の正常な活動からの逸脱に起因すると考えら
れる.したがって,ある疾病関連タンパク質が特定された
場合,その立体構造から引き出される情報を利用するこ
とにより,合理的な薬剤設計を行うことが可能となる.
また,PCクラスター等大規模計算機システムとの組み合
わせにより,短期間・低コストでの創薬が期待できる.
実験による立体
構造決定
計算によるヒット
化合物探索
実験によるリード化合
物探索
計算によるリード化
合物最適化
立体構造解析
活性部位
化合物探索
化合物最適化
実験によるリード化
合物最適化
薬剤候補物質