Transcript NIG_TUS

日本語バイオポータルサイトJabion
バイオインフォマティクス道具箱
菅原秀明1、阿部貴志1、重元康昌2、宮崎智3
1国立遺伝学研究所 生命情報・DDBJセンター、2富士通株式会社、 3東京理科大学薬学部
バイオインフォマティクス道具箱 (http://www.bioportal.jp/bioinfo/)
 これからバイオインフォマティクスを始めたい方からインターネット上のデータ資源をもっと活用したい方
まで対象にしています。
 「どんなデータを利用できるのか?」、「どんな解析サービスがどこにあるの?」、「どのように解析ツール
を使えばいいの?」といった疑問を解決できます。
ゲノムメニュー(国立遺伝学研究所)
バイオインフォマティクス解析に必要となる様々な生物種ごとにゲノム情報をまとめたものです。ヒトやチンパンジーなど
解読されたゲノムを網羅しています。生物種は、和名・学名の両方で検索できます。
「ゲノムメニュー」トップページ
イネゲノムが公開されているDB
一覧が表示される
道具箱トップページ
Webサービス(国立遺伝学研究所)
インターネット上で公開されているデータベースと解析ツールを自由に組み合わせて、利用者が目的に応じた新
しい解析ツールを簡単に作成するための素材となるサービス(Webサービス)を開発・提供しています。
Webサービスとは? インターネット上でのアプリケーション間通信を実現する技術です。
・一般的にHTTP上で動作し、RPCやXMLでのメッセージ交換を
実現する技術。
・ システム連携をする上で、相互接続性が優れている技術。
トップページ
(Simple Object Access Protocol (SOAP)を適用したものと定義する)
解析手順(ワークフロー)例の公開 : 比較的一般的に使用され
る解析を例にWebサービスの使い方の紹介を行っています。
ヒト遺伝子の相同性検索ワークフロー
プログラムがDirectoryを参照して必要なデータ資源を発見する
•
プログラムが発見したWebサービスを利用して結果を取得する
プログラムが取得した結果を手元のデータシステムに格納する
手元のデータシステムでの処理を行う。
•
Directory service
Web
services
providers
Publis
h
(UDDI, ebXML)
Search
Service request
We services
providers
解析ワークフロー(■: 解析に使用するWebサービス)
Bind
Bind
In-house data
system
Web
services
providers
目的
– ヒトゲノム遺伝子をデータベース内から探索し、他の生物種の類似遺伝子探
索を行い、遺伝子の機能、ならびに進化的な由来を推定する。
ワークフロー構築手順の概要
1. Refseqによるヒト遺伝子の探索
2. BLASTXによる相同性検索
3. 相同性検索結果からのベストヒットだった遺伝子の機能・生物種の抽出
Web services
providers
Work flow
described by
WSFL/XLANG
Refseq
ヒト遺伝子配列
(アミノ酸)
抽出
Blastp
出力結果
Stein, L. (2002) Creating a bioinformatics nation, Nature, 417, 119-120
バイオの分野では、解析ツールやDBを統合的に使用するのが一般的。
Web サービスを活用することによって、アクセス方法を標準化し、
さまざまな組み合わせの実現を容易にすることが可能。
公開されている素材 (現在 68methods)
Ensembl
例えば、Ensemblに登録されているヒト遺伝子名で
マウスと同じ遺伝子名と同じ遺伝子だけを抽出
するといった場合、「Ensembl」メソッドを追加する
すれば抽出するが可能
バイオメタデータベースの構築と公開(東京理科大学)
インターネット上の生物学的データベースの構造とアクセス時のCGIを解析し、利用可能なデータベースとアクセス手
法の組み合わせを網羅的にデータベース化し公開している。このメタ情報自身をウェッブサービス化することで、研究
者の目的に応じた研究用データを自動的に探索し、取得する仕組みの研究開発へ拡張している。2005年5月現在
の蓄積レコード数は、17,163件に達している。
条件設定の詳細
レコードの詳細
レコードの固
有番号
DDBJやNCBIな
ど、データベー
ス提供期間の名
称
公開されている
DBの名称
下記の分類を記述
Complete:マニュアルによる
基本情報の査定終了
Finish:査定作業終了
Reviewing:査定中
Exception:CGIの自動解析は
できない。
Access denied:ロボットによる
アクセスは否定されるもの。
ホームページのURLと条件設定のURLはそれぞれのオリジナルサイトへのリンクになって
います。画面左下の「検索・解析サービス利用のためのURL解析」ボタンをクリックすると、
このデータベースを利用するための条件設定のページ上で使われているHTMLのタグがオ
リジナルのページとともに別ウィンドウで閲覧できます(次図)。
上図は、前ページの「検索・解析サービス利用のためのURL解析」ボタンを
クリックして表示したもの。この例は、DDBJで公開されているアクセッション
番号からの検索サービスであるgetentryシステムのタグを解析したもの。利
用者に入力を期待する各箇所(選択リストやラジオボタンなど)に対応した、
GUI内での名称が()内に赤字で表示される。このページでは、データベース
を指定するためのラジオボタンをdatabaseと総称していることがわかる(上図
の青色で囲んだ部分)。