分子計算の計算量

Download Report

Transcript 分子計算の計算量

分子コンピュータの理論と構築
• リーダー: 萩谷昌己(計算機科学・東京大学大学院理学系研究科)
• メンバー:
–
–
–
–
横森貴(計算機科学・早稲田大学教育学部)
小林聡(計算機科学・電気通信大学電気通信学部)
榊原康文(計算機科学・東京電機大学理工学部)
陶山明(生物物理学・東京大学大学院総合文化研究科)
– 坂本健作(生物化学・東京大学大学院理学系研究科)
– 伏見譲 (生物物理学・埼玉大学工学部)
– 山村雅幸 (システム工学・東京工業大学総合理工学研究科)
– 有田正規 (ゲノム情報学・経済産業省産業技術総合研究所)
• リサーチ・アソシエート:
– 西川明男(計算機科学・東京大学→大阪電気通信大学)
– John Rose(生物物理学・東京大学)
• 期間:1996年10月~2001年3月
「分子計算」の目標
• 生体分子の計算能力の解析
– 計算論的な観点から生体分子とその反応を解析する。
– 生命の神秘の一つの側面
• 生体分子の計算能力の工学的応用
⇒ コンピュータに限定されるわけではない。
–
–
–
–
組み合わせ的最適化 ← 超並列性
バイオテクノロジー (computationally inspired biotechnology)
ナノテクノロジー・ナノマシーン ← 微小性
最終的には医薬への応用 ← 細胞による計算
• 分子による計算のための新しい情報技術
– 新しい計算パラダイム
– 新しいシミュレーション技術
関連分野
• 分子エレクトロニクス
– 分子素子を用いた電子回路(既存の計算パラダイム)
– 分子回路の構成技術(ナノテクノロジー)としての分子計算
• 量子計算
– 量子重ね合わせによる超並列計算
– 分子量子計算(量子計算と分子計算の融合)
– 量子デバイスの構成技術(ナノテクノロジー)としての分子計算
• ゲノム情報 (genome informatics)
– 計算機技術のゲノム解析への応用
– ヒトゲノム・プロジェクトの一環
– 分子計算とは逆の方向
しかし、ゲノム情報は分子計算の重要な応用分野と考えられる。
• 人工生命
• 人工分子進化
プロジェクトの主な成果
•
•
•
•
•
•
•
•
分子計算の理論
分子計算の解析と設計支援
自律的DNA計算の分子実装
固相法を利用したオートメーション化された
DNA計算
分子メモリ
3SR法に基づく分子進化リアクター
シグナル伝達経路のモデリングと細胞計算
への応用
DNAナノテクノロジー
研究成果の分類
• 分子計算のための計算モデル
– 新しい計算モデルの提案
– 計算可能性・計算量などの解析
• 分子計算の実装技術・設計技術
– 新しい実験技術
– シミュレーション技術・符号化技術
• 分子計算の応用
– バイオテクノロジー
– ナノテクノロジー
個々の研究成果はいくつかの分野にまたがっている。
固相法を利用した
オートメーション化された
DNA計算
陶山 明(東京大学)
Adleman-Liptonパラダイム
• Adleman (Science 1994)
– ハミルトン経路問題をDNAを用いて解く。
• Lipton, et al.
– SAT問題をDNAを用いて解く。
• 分子による超並列計算
– 主として組み合わせ的最適化
– DNAの自己会合によるランダムな生成
• 解の候補 = DNA分子
– 生物学実験技術を駆使した解の選択
– 規模の拡大 ⇒ 収量を増やしエラーを減らす努力
• ロボット・化学IC
Adlemanによるハミルトン経路問題の解法
解の選択と抽出
解の候補をすべて含むプールの生成
4
NP完全問題
PCR
3
0
HPP
O0
1
6
2
O2-3
O6
5
O3-4
PAGE
AF-SEP
………………..
GTATATCCGAGCTATTCGAG CTTAAAGCTAGGCTAGGTAC
CGATAAGCTCGAATTTCGAT
O3
O1
HP
O2
O3
O4
O5
陶山の Dynamic Programming
DNA Computer
• “counting” (Ogihara and Ray)
– n変数 3-SATに対して O(20.4n)分子
• “dynamic programming” (陶山)
• 生成と選択の繰り返し
– 部分的解の候補の生成
– 部分的解の選択
• 必要な分子数のオーダーは下がらないが、
係数は激減する。
• 固相法
– 磁気ビーズを用いたアフィニティ・セパレーション
– 自動化に有利 ⇒ ロボット
基本演算の実装
get (T, +s), get (T, -s)
annealing
and
ligation
annealing
s
annealing
Taq DNA ligase
T
s
s
s
amplify (T, T1, T2, …Tn)
append (T, s, e)
e
PCR
immobilization
and
cold wash
immobilization
s
s
s
e
immobilization
and
cold wash
s
hot wash
cold wash
s
get (T, -s)
hot wash
s
hot wash
and
divide
T1, T2, …Tn
get (T, +s)
計算規模の拡大について
• 陶山の見積もり
– 100変数の3-SATに対して 2x10-3 g の DNA
Adleman-Lipton では 2x1012 g の DNA
– 3月末まで: 10変数40節の3-SAT
– 究極の目標: 100変数400節の3-SAT
• しかし、100変数は決して多くはない。
– 電子コンピュータを凌駕するためには、
アルゴリズムと実験技術の両面において、
多くのブレークスルーが必要である。
– 例えば、ロボット...
Robot for DNA Computing Based on
MAGTRATIONTM
Programming in DNA Computer
function
dna 3 sat ( u 1 , v 1 , w 1 , ... , u m , v m , w m )
begin
T2  { X 1 X
T
T
2
F
, X1 X
T
2
T
, X1 X
F
2
F
, X1 X
F
2
};
for k  3 to n do
T
amplify
[Instrument]
[Reset Counter] 0
[Home Position] 0
[MJ-Open Lid]
・・・
[Get1(0)]
[Get2(1)]
[Append(2)]
・・・
[Exit]
F
(T k 1 , T w , T w );
for j  1 to m do
if w j  x k then
T w  getuvsat
F
F
(T w , u j , v j );
end
if w j   x k then
T w  getuvsat
T
T
(T w , u j , v j );
end
end
T
T
 append (T w , X
T
k
T
F
 append (T w , X
F
k
T
F
T k  merge( T , T
T
F
,X
,X
T /F
k 1
T /F
k 1
X
X
T
k
);
F
k
);
);
end
return detect (T n );
end
Pascal/C-level
protocol-level
(1-1-4)
[MJ-Open Lid]
Do 2
_SEND
"LID OPEN"
Do
10
_SEND "LID?"
Wait_msec
500
_CMP_GSTR
"OPEN"
IF_Goto EQ 0 ;open
Wait_msec 1000
Loop
Loop
; Time out
End
;open
script-level
DNAコンピューティングによるゲノム解析
DNA進符号化された
ゲノム情報
DNA/RNA分子がもつ
ゲノム情報
DNA/RNA分子反応による
計算処理
DNA進符号
DNAチップによる
処理結果の表示
処理結果の
DNA/RNA分子の出力
(DNAC)への
変換反応
ゲノムDNA、cDNA/mRNAなどの情報をDNAコンピュータで解析する場合、それら
の情報はまず最初に分子反応により正規直交化された塩基配列の並びである
DNA進符号に変換される。
DNA進符号で表現された入力情報は、DNAコンピュータのCPUがサポートする命
令を並べたプログラムにより処理される。
その結果はDNA進符号のビット列を表示するDNAチップにより出力される。出力結
果を逆変換して対応する分子を調製することも可能である。
遺伝子発現解析のための
DNAコンピュータプログラム
fu n ction gene_ex pression_profile (cD N A , a 1 , … , a m , A 1 , … , A m )
b egin
T a = {a 1 , a 2 , … , a m };
T A = {A 1 , A 2 , … , A m };
T in pu t = {cD N A };
T d cn = append (T a , T A , T in put );
T g ep = get (T d cn , T dcn );
am plify (T g ep , T 1 , T 2 , … , T n );
T d1 = {rD 1 1 , rD 1 2 , … , rD 1 n };
T d2 _k = {rD 2 k };
for k = 1 to n d o
T dcn_k = app end (T d 2_ k , T d 1 , T k );
for j = 1 to n d o
T d1 _j = get (T d cn _k , D 1 j ):
detect (T d 1_ j );
en d
en d
get ( T , + s ), get ( T , - s )
試 験 管 T の 中 か ら 部 分 配 列 s を 含 む (含 ま な い ) D N A 分 子
を取 り出 す 。
append ( T , s , e )
試 験 管 T の 中 に あ る 末 端 条 件 eを 満 た す D N A分 子 の 端 に
配 列 sを 付 加 す る 。
m erge ( T 1 , T 2 , … , T n )
試 験 管 T 1, T 2, … , T n の 中 に あ る D N A 分 子 を 一 緒 に す る 。
am plify( T , T 1 , T 2 , … , T n )
試 験 管 T の 中 に あ る D N A 分 子 を 試 験 管 T 1 , T 2 , … , T n に (濃
度 を 変 え な い で )分 注 す る 。
detect( T )
試 験 管 T の 中 に あ る DNA分 子 を 検 出 す る 。
DNAチップによる遺伝子多型解析
生活習慣病など病気との相関
薬剤効力、副作用との相関
病気の予防、診断
治療での利用
DNAコンピューティングによるSNPs計測
DNAコンピューティングによる遺伝子発現計測の方法をそのままSNPs
計測に適用することができる。
既存の方法と比べて優れている点は以下のとおりである。
並列性:
マルチプレックスSNPsタイピングを高速・低コストで行うことができる。
時間:DNAチップによる処理まで含めて約3時間
約2分/SNP
コスト:サイト数×多型数=100のタイピングで約3,000円
約30円/SNP
定量性:
多個体混合サンプルを用いて、各多型の出現頻度を正確に決定する
ことができる。
演算性:
多型のパターンの判定、パターンの探索などの情報処理を行うことが
できる。
News
株式会社ノバスジーン
オリンパス光学工業株式会社と三井情報開発株式会社が
研究開発型ベンチャー「株式会社ノバスジーン」を設立
生体分子コンピューティング技術を応用した
遺伝子受託解析サービスを開始
生体分子コンピューティング技術の共同研究開発
主に大学等研究機関の研究者との共同研究により、将来の
生体分子コンピューティング技術の研究開発を進めます。
分子計算の理論
分子計算モデル
新計算パラダイムの探究
横森 貴(早稲田大学)
榊原康文(東京電機大学)
小林 聡(電気通信大学)
研究成果(概要)
•
•
•
•
•
•
環状スプライシングモデル
自律的会合モデル:YAC
演繹型計算モデル
複数試験管モデル
木スプライシング計算モデル
細胞膜モデル
反応濃度予測アルゴリズム
分子計算を用いたブール式の
学習アルゴリズム
知的DNAチップの提案
DNA計算によるブール式の学習
DNA計算の超並列性を利用して,計算量的に困
難な問題であるブール式の学習を効率よく解く



ブール式をDNA配列に符号化する方法
符号化されたブール式を分子生物学の実験手
法を用いて試験管内で評価する方法
セルフアセンブリを用いた大域的並列性と局所
的並列性の2つの超並列性を利用
ブール式の符号化と試験管内での評価方法
ブール式の例:
( x1  x 2 )  (  x 3 )
marker x 1 x 2 empty stopper marker empty empty  x 3
+
 x1
 x2
 x3
a = (111)
アニーリング:
marker x 1 x 2 empty stopper marker empty empty  x 3
PCR伸長:
 x3
ブール式の学習の遺伝子発現解析への
応用
 知的DNAチップの提案:
 3つ手法の組み合わせ:
• DNA符号化数(陶山グループ)
• DNA計算を用いたブール式の学習アルゴリズム
(例からのブール式の帰納的学習)
• DNAチップ技術
 知的DNAチップ実現方法
 知的DNAチップの遺伝子発現解析への応用
の提案
DNA計算を用いた遺伝子発現解析の
情報処理:知的DNAチップ
遺 直接入力:
伝
子
の
発
現
DNAコンピュータ
出力:
(Encode)
DNA符号化数 試験管内での情報処理
in vitro
•DNA分子の直接入力
•超並列性
DNAチップ上
での出力
分子計算の解析と設計支援
萩谷昌己(東京大学)
西川明男(大阪電気通信大学)
John Rose(東京大学)
有田正規(産業技術総合研究所)
分子計算の解析と設計支援
• 分子計算のシミュレーション
– シミュレータ:VNA (Virtual Nucleic Acid)
– 格子モデルによるヘアピン形成のシミュレーション
• 符号化のための手法とツール
– computational incoherency
– mバランス性
– 種々の制約を定義できる符号生成ツール
• 分子計算の計算量の解析
– SAT Engineの計算量の解析
確率アルゴリズムとしての分子計算
VNA: Virtual DNAのシミュレータ
• 抽象塩基による効率化
分子 ― 仮想ストランドのハイブリッド
abcd
||
CDEF
• シミュレーション方法
– 分子の組み合わせ的な生成
– 微分方程式の数値解放による濃度計算
• 組み合わせ爆発の回避
– シミュレーション技術としての新規性
– 濃度を用いて組み合わせ的な生成を制御
融合
Virtual DNA の反応
• hybridization
ZA, ua
ZA
⇒ |
au
• denaturation
• extension
ZA
| ⇒
au
• restriction digestion
ZAU
|||
zau
Virtual DNA の反応 (cont.)
• self-hybridization
(extension)
• ligation
b
a
B
A
SAT Engine の計算量
• エラーの確率
– e 1 : ヘアピン形成に失敗した分子数
(false positive)
M exp(t /n 1.5) < e 1
– e 2 : 正しい割り当てが生成されない確率
(false negative)
M = (3+a) ln(1/e 2)
t > (1+a) n ln(1/e 1 )+ln(ln(1/e 2 ))+n 2.5 ln(3+a)
• 計算のオーダー
– 時間 --- O(n 2.5)
– 分子数 --- O((3+a) n ln(1/e 2))
自律的DNA計算の
分子実装
坂本健作(東京大学)
萩谷昌己(東京大学)
自律的分子計算
• Adleman-Liptonパラダイム
– 解の候補の生成 = 自律的な反応
– 解の選択 = 外部からの多くの実験操作
• ワンポット反応 ⇒ 自律的計算
連続した自律的な分子反応による計算
– WinfreeのDNAタイル
– 坂本のヘアピン・エンジン
Whiplash PCR と SAT Engine
• より「純粋な形」の分子計算の探求と解析
• 応用:
– ナノテクノロジー・ナノマシンーン
– (computationally inspired) biotechnology
ヘアピン・エンジン
• ヘアピン構造の形成による分子計算
– ヘアピン --- 典型的な二次構造
• Whiplash PCR
– DNAオートマトン: DNAによる状態機械の実現
– 5回の連続的な状態遷移
• SAT Engine
– ヘアピン構造を用いた解の選択
Adleman-Liptonの第二ステップも自律的になった。
– 6変数10節の3‐SAT
SAT Engine
• Sakamoto et al., Science, May 19, 2000.
• 特願平11-165114
• DNAのヘアピン構造による解の選択
– 制限酵素による切断
– exclusive PCR
• 3-SAT
–
–
–
–
各節からリテラルを一つずつ選んで ssDNA を生成
相補的なリテラル = 相補的な配列
矛盾の検出 ⇒ ヘアピン
6変数10節の3-SAT問題
• SAT計算の本質的な部分 = ヘアピン形成
– 自律的分子計算
(a∨b∨c)∧(¬d∨e∨¬f)∧ … ∧(¬c∨¬b∨a)∧ ...
b
e
¬b
b
¬b
制限酵素による切断
exclusive PCR
ヘアピン構造による選択
• 制限酵素による切断
– リテラルを表す配列中に制限酵素サイトを
挿入
• Exclusive PCR
– 一般にPCRはヘアピンに対して増幅率が
低い。
– exclusive PCRでは、各サイクルで溶液を
薄めることにより、ヘアピンと非ヘアピンの
増幅率の差を大きくしている。
• 実験操作の数は変数や節の数に依存しない。
分子メモリ
山村雅幸(東京工業大学)
Tom Head (Binghamton)
分子メモリ
固体メモリ
分子メモリ
(アクエアス・メモリ)
アクエアス・アルゴリズム
Initialize
特徴
1. 同一分子から出発
Pour(3)
•
•
汎用
配列設計不要
SetToZero(1st) SetToZero(3rd) SetToZero(5th) 2. 水の役割は本質的
• 同一分布で分割
• 容易に混合
3. 最後に1の数を勘定
Unite
•
•
電気泳動など
読み取りは要工夫
4. Write once
Pour(4)
•
•
NP完全のあるクラス
さまざまな実装法
環状DNAへの破壊書込み
Cut
Extend
Ligate
3x3 ナイト配置問題
abcdefgh
a
d
f
g
11111111
b
01111111
c
h
a
e
b
h
10111111
NAND (a,b)
NAND (e,f)
NAND (b,c)
NAND (f,g)
NAND (c,d)
NAND (g,h)
NAND (d,e)
NAND (h,a)
c
d
g
f
e
分子メモリの今後
• アクエアス・コンピューティング
– 破壊書き込みメモリの水溶液
• 抽象性高、人為操作大の極端なDNA計算
• さまざまな実装が可能
– 環状DNA+制限酵素・修飾酵素
• Leiden CDL、Binghamton CEL
– 線状DNA+PNA侵入
• Titech DNA/PNA
• アイデア募集中
– タンパクの利用
– 光(百万倍早い)
3SR法に基づく
分子進化リアクター
伏見
譲(埼玉大学)
3SRフローリアクター=自然淘汰型進化リアクター
=>進化型分子コンピュータ
V
F
DNAi
D=
RNAi
F
:希釈率
V
F
適応度=比増殖速度
i=1,2,…,1010~15
定常状態:
集団平均比増殖速度 = D
データ
プログラム
(正解)
(最適プログラム)
塩基配列
物理化学的特性
比増殖速度
(最大値)
突然変異、組換えによる
新たなプログラム候補者の発生
分子系によるアルゴリズムの自動獲得
の可能性
核酸分子系による増幅プログラムの自動獲得
環境(実験操作として表現
されたプログラムの不変部分):
SP6 RNA polymerase
HIV-1 RT
RT-primer
Promoter-primer
3SR増幅機構をコードしたDNA
プロモーター
ヘアピン増幅機構(1)をコードしたDNA
プロモーター
ヘアピン増幅機構(2)をコードしたDNA
プロモーター
CATCH増幅機構をコードしたDNA
プロモーター
プロモーター
各増幅機構は各研究者が考えついたものだが、われわれの分子系は
一つの進化リアクター中でその全てを実現して見せた。
シグナル伝達経路のモデリングと
細胞計算への応用
有田
正規(産総研)
シグナル伝達系のモデル
(と細胞計算への応用)
シグナルの受容からへ初期遺伝子の発現まで
東大医学部芳賀研究室との共同研究
NGF
EGF
p
PMA
Carbachol
p
PLC
PMA
Grb2/Sos
PKC
DAG
Ras
Raf-1
B-Raf
Rap1
MEK
MAPK
CalDAG
&
zif268
Ca++
IP
NGFでの生物実験
H7
×
試薬
NGF
NGF
K252a
GF
○
EGF
p
PD
△
EGTA
○
PMA
GF+EGTA K252
○
×
EGTA
Carbachol
p
H7
Grb2/Sos
PKC
Ras
Raf-1
PD098059
PLC
GF109203X
B-Raf
Rap1
MEK
MAPK
DAG
CalDAG
&
zif268
IP
Ca++
NGFの結果の解釈
H7
×
試薬
NGF
NGF
K252a
GF
○
EGF
p
PD
△
EGTA
○
PMA
GF+EGTA K252
○
×
EGTA
Carbachol
p
PLC
Grb2/Sos
H7
PKC
Ras
Raf-1
GF109203X
B-Raf
Rap1
MEK
PD098059
MAPK
DAG
CalDAG
&
zif268
IP
Ca++
自動推論
試薬
NGF
H7
×
NGF
K252a
PD
△
EGTA
○
GF+EGTA K252
○
×
• NGFから到達可能な
点を探索:
p
Grb2/Sos
H7
Ras
Raf-1
B-Raf
MEK
PD098059
GF
○
MAPK
– H7 … 探索パスの切
断点に効くはず
– PD … 切断点でない
部位に効くか、MEKを
バイパスする経路が
存在
zif268
実行画面
• Javaによる実装
• 簡単な推論
• 複数の異なる実
験内容を入力で
きるように工夫
DNAナノテクノロジー
ーAFMによるナノテクノロジーとDNA計算
によるパターン形成技術の統合の試みー
西川明男(大阪電気通信大学)
Sonia Antranz Contera, 文元鐡, 吉信達夫
岩崎裕(大阪大学)
背景と動機
• 分子計算プロジェクトの成果を活かして、新しい
応用を目指したい。
• Atomic Force Microscopyによるナノテクノロジー
によるパターン生成(top down)
• DNA計算によるパターン生成(bottom up)
AFMによるナノテクノロジーとDNA計算によるパ
ターン生成を組み合わせることでより優れたパ
ターン生成を目指したい。
AFMナノテクノロジー
--AFMによる酸化膜のドットパターン-トップダウン的に
シリコン表面に
酸化膜を形成
Silicon oxide pattern
by Moon et al.
DNA計算によるパターン生成
• SeemanとWinfreeらは、4本のDNAからで
きているDNAタイルを組み合わせてDNA
クリスタルを形成した。この時、4つの
sticky endをどう与えるかによってパターン
が変わる。
比較的簡単な
2本鎖DNAの末端
を利用すると、配線
などにも使える
可能性あり
本研究のアプローチ
最初に目標とするパターン→より複雑なパターンへ
酸化膜ドットパターン上にSH末端を持つDNAのオリゴマー
を固定し、これに別のオリゴマーを計画的にハイブリダイズ
させてシリコン表面上にDNAで配線パターン形成
現在までの進展状況
• DNAオリゴマーをシリコン酸化膜上に固定
する。 (SC1プロセスによる酸化膜)
• AFMによる固定されたDNAの画像化
• 同一の固定プロセスを施して、シリコンとシ
リコン酸化膜上で、DNAの固定され方の
差を見る。(酸化膜にだけ固定されてほし
い。)
今後の課題
• DNAの配列に応じて、別々のドットパター
ンに固定する方法を開発せねばならない。
• ドット上にDNAを固定する実験を行う。
• 単に表面に吸着しているDNAと共有結合
で固定されているDNAの見え方の違いを
確認する。
• バッファの洗浄だけではなく、バッファの選
択を再考する必要がある。
Molecular Programming
おわりにかえて
分子プログラミング
• 計算論から設計論への展開
– 生体分子反応を設計・制御する技術の確立
• 生体分子 (DNA, RNA, protein)
• 分子プログラム --- 二つの部分
--- 組み合わせ的複雑さ
– 分子自身に符号化されたプログラム (e.g., DNA配列)
– 実験操作列によって実行されるプログラム
• 分子プログラミングとは ...
– 両者のプログラムを協調させることにより、
生体分子反応を設計・制御
• 基本的であるがゆえに多くの応用を想定
– バイオテクノロジー
– ナノテクノロジー
– コンビナトリアル・ケミストリー