16 photosynthesis proteins

Download Report

Transcript 16 photosynthesis proteins

色素体の起源と進化
ラン藻と色素体の系統関係
色素体ゲノム装置の不連続進化
東京大学大学院総合文化研究科
生命環境科学系
佐藤直樹
ラン藻と色素体の系統関係
これまでの研究
葉緑体がシアノバクテリアによる細胞内共生によって生じたという仮説は,顕微
鏡が生物の観察に用いられ,さまざまな生物の観察が行われた19世紀初頭には
すでに先駆的な学者によって提唱されていた。しかし,これは単に見かけが似て
いること以上のものではなかった。その後,20世紀後半になって,電子顕微鏡
による細胞内構造の観察や,生化学的な分析,光合成のしくみの詳しい解析など
が進むにつれ,シアノバクテリアと葉緑体の類似性が指摘されるようになった。
これを受けて,L. Margulisが1970年前後に葉緑体を含むいくつかの細胞内小器官の
細胞内共生由来説を出版した。さらに,1980年代に入り,葉緑体ゲノムにコード
された遺伝子がシアノバクテリアの対応する遺伝子ときわめてよく似ていること
が指摘されるようになった。また,分子進化の中立説(1970年木村資生)に支え
られた分子系統解析がコンピュータの発達とともに活発に行われるようになった。
16S rRNA配列に基づく系統解析の結果,葉緑体ゲノムが単系統であり,シアノバ
クテリアゲノムに由来することが確実と考えられるようになった。
1995年のNelissenらの研究では,単系統である葉緑体ゲノムが,シアノバクテリア
の最も根元に近いところから分岐することが示された。さらに,1999年にはTurner
らによって多数の新たな配列を加えた解析が行われ,この結果がさらに支持され
ることとなった。
An NJ tree of plastids and cyanobacteria
多数の種を加えたrRNA
に基づく系統樹
Gloeobacter as a root for
plastids and cyanobacteria
Anabaena, Synechocystis,
Thermosynechococcus,
and Trichodesmium are
paraphyletic.
Turner et al. (1999)
J. Eukaryot. Microbiol.
46: 327-338
これらのrRNA系統樹では
たしかに葉緑体は単系統で,シアノバクテリアの根
元から分岐しているが,そのときのシアノバクテリ
ア部分の系統関係は大きく異なっていた。さらに,
葉緑体ゲノムに保存されているタンパク質配列を
使った解析も行われるようになると,rRNA配列に
よる解析とは,シアノバクテリア部分の分岐の仕方
が大きく異なることが判ってきた。
これまではシアノバクテリアは比較的根元の方で,
多数のグループに分岐していたが,タンパク質配列
による系統樹では,大きく2つに分岐することが特
徴である。
どちらが正しいのか,判らなくなってきた。
NJ tree of 27 conserved
protein sequences of
cyanobacteria and plastids
A protein tree
(BI法)
Various trees
どうしてこんなに違うのだろう?
系統解析の方法は難しく,本当にどの分岐パターンが正し
いのか,なかなか決められない。16S rRNAをもちいた
Nelissen et al. (1995,NJ法), Turner et al. (1999,最尤法)など
の解析では,シアノの分岐の根元から色素体が分岐すると
されてきた。しかし,タンパク質配列を使うと,海洋性シアノ
だけで別の系統を構成するような系統樹ができる。
しかし,同じ配列を使ってやってみると,どうも同じ結果が得
られない。NJ法は距離を使うだけの簡便法であり,最尤法は
配列数が多いとすべての場合を尽くしきれない。最近,
Bayes法を用いたMarkov Chain Monte Carlo (MCMC)法が
実用化され,配列数が多くても,効率的に最尤系統樹に到
達できるようになった。
Bayes Inference calculation
Software: MrBayes version 3.1 + MPI version 2
RNA Data: 16S rRNA (from RDP + GenBank)
Protein Data: GenBank genomes
1. Protein alignment (gclust, clustalw)
2. Use only sites with gaps < 0.2 (siseq-getclu)
3. Convert to DNA alignment (siseq-nucaln)
4. Exclude the 3rd positions
Model selection: model test (GTR, invgamma); lnL values of
MrBayes with various parameters (nst=1,2 and 6; equal,
propinv, gamma, adgamma, invgamma)
Parameters: unlink parameters for all genes; 4x4 model,
except double model for base-paired sites of 16S rRNA
Generations: 800,000 to 50,000,000
Machines: PM G5 dual 2.5 MHz (2 CPU), HGC Sun Fire
15000 (8 CPU): 1 to 5 days
An example of BI calculation
(16S rRNA)
Cx5r4.nex
16S rRNA
base-pair
20 speciess
with S63
unlink
nst1
invgamma
800,000 0.038938
nst2
invgamma
800,000 0.008462
nst6
invgamma
800,000 0.021006
800,000 0.015661
1,200,000
0.005053
2,000,000
0.005498
nst6
equal
800,000 0.002734
nst6
propinv
800,000 0.004554
nst6
gamma
800,000 0.011108
-9041.75
-8989.44
-8955.80
-8955.65
-8958.62
-8955.44
-10211.94
-9368.61
-8988.76
(Bact,Glv,((Tel,(S63,Mar)),(Syn,Ana),Plastid2))
(Bact,Glv,((Tel,(S63,Mar)),((Syn,Ana),Plastid2)))
(Bact,Glv,((Tel,(S63,Mar)),((Syn,Ana),Plastid2)))
(Bact,Glv,((Tel,(S63,Mar)),((Syn,Ana),Plastid2)))
(Bact,Glv,((Tel,(S63,Mar)),((Syn,Ana),Plastid2)))
(Bact,Glv,((Tel,(S63,Mar)),((Syn,Ana),Plastid2)))
(Bact,Glv,((Tel,(S63,Mar)),((Syn,Ana),Plastid)))
(Bact,Glv,((Tel,(S63,Mar)),((Syn,Ana),Plastid)))
(Bact,Glv,((Tel,(S63,Mar)),((Syn,Ana),Plastid3)))
List of homologs
27 proteins conserved in plastids and cyanobacteria
11 housekeeping proteins
(cyano + plastids + bacteria)
16 photosynthesis proteins
(cyano + plastids)
An example of BI calculation
(16S rRNA + 11 proteins)
Model
RNA
11 prot
nst6
invgamma
invgamma
nst6
invgamma
adgamma
generations
std dev
lnL
consensus
1,200,000
0.019840
-83161.27
tree4
2,000,000
0.010600
-83160.80
tree4
2,000,000
0.003078
-83159.06
1,200,000
0.003374
-82937.43
1,200,000
0.009117
2,000,000
#
tree1
tree4
tree4'
0.260
0.377
0.131
1
0.222
0.477
0.131
tree4
2
0.300
0.347
0.174
tree4
1
0.194
0.448
0.277
-82934.31
tree4
2
0.170
0.564
0.157
0.028401
-82935.83
tree4
1
0.202
0.460
0.244
2,000,000
0.006068
-82930.52
tree4
2
0.141
0.539
0.225
2,000,000
0.021435
-82934.69
tree4
3
0.175
0.521
0.225
2,000,000
0.017061
-82941.03
tree4
4
0.131
0.416
0.352
2,000,000
0.009566
-82933.27
tree4
5
0.169
0.522
0.213
5,000,000
0.013359
-82933.62
tree4
1
0.191
0.511
0.198
5,000,000
0.001963
-82936.63
tree4
2
0.202
0.534
0.185
5,000,000
0.004956
-82936.14
tree4
3
0.186
0.477
0.240
5,000,000
0.009852
-82934.24
tree4
4
0.194
0.548
0.166
5,000,000
0.002102
-82934.82
tree4
5
0.160
0.558
0.206
tree1 = (Bact,Glv,((Tel,(S63,Mar)),(Syn,(Ana,Plastid))))
tree4 = (Bact,Glv,((Tel,(S63,Mar)),(Syn,(Ana,Plastid2))))
tree4' = (Bact,Glv,((Tel,(S63,Mar)),(Syn,(Ana,Plastid2'))))
Plastid = (Green,(Cpa,Red))
Mar = (S81,(Pm2,(Pm1,Pm3)))
Plastid2 = (Cpa,(Red,Green))
Bact = (Ecoli,Bst)
Plastid2' = (Cpa,(Red,Green)) different order in Green
16S rRNA
不用意にたくさんの配列を入れて計算すると,右の図のようにおかしな形になる。
特にSynechococcus C9やPseudanabaena6903が入ると,計算ごとに結果が異なっ
てくるので,これらの配列自体に問題がありそうである。使う配列の数,使う遺伝
子の種類をさまざまに変えたとき,同じになるようなデータを使うべきである。
11 proteins and 16S rRNA
これら20種を使ったとき,タンパク質(左)でもrRNA(前ページ左)でも
ほぼ類似の結果が得られる。そこでこれらをあわせて解析したのが,右の結果
である。
16 or 27 proteins
光合成関連タンパク質でやった結果(左:細菌を含まない)も前ペー
ジでも使った保存タンパク質11種類を加えた結果(右)も,大筋でま
えの結果を支持する。
系統解析の結果
1. これらの系統樹からわかることは,シアノバクテリアの系統
が,最初に分岐したGloeobacterを除いて大きく2つの系統に
なるということである。一方は,海洋性の単細胞シアノバク
テリアと淡水性のSynechococcusを含み,他方は糸状性の
AnabaenaなどとSynechocystisなどを含む系統である。
2. 色素体は単系統であるが,灰色藻がもとから分岐したのか,
それとも緑色と紅色の分岐が先であり灰色藻がそのどちらか
の姉妹群であるのかは,これまでの計算では確定できない。
3. 色素体は,上記のシアノバクテリアの2大系統のうち,後の
グループから分岐したことが,あらゆるデータから支持され
る。
4. 従って,次のページの図のようになる。
Phylogeny of
cyanobacteria,
algae and plants
色素体ゲノム装置の不連続進化
概要1
シアノバクテリアの共生によって,たくさんの遺伝子が原始藻類細胞に持ち込
まれたはずである。その中には,現在も植物・藻類で使われているタンパク質
(CPRENDOs: chloroplast proteins of endosymbiont origin. 比較ゲノムの説明を
参照)もあるが,多くのタンパク質の遺伝子は失われた。オルガネラのゲノム
装置を構成する成分でも,DNAポリメラーゼは全く別のものに置き換えられた
(森山君が研究している)他,RNAポリメラーゼのシグマ因子は細胞核コード
に変わった。シアノバクテリアの転写因子もほとんどが失われたが,紅藻系統
では,DnaB, HU, OmpR型転写因子などが色素体ゲノムまたは核ゲノムコード
として残っている。一方,緑色系統ではほとんど完全にこれらも失われ,原核
由来の制御因子は何もなくなってしまった。これは,原始藻類細胞の中という
環境が,独立生物としてのシアノバクテリアの環境に比べ,著しく安定になっ
たことを反映している。同様のことは,寄生性のバクテリアであるBuchnera,
Chlamidiaなどでもゲノム縮小として表れている。
この段階では,転写因子はないが,RNAプロセシングの酵素が導入された。こ
れにより,転写ではなく転写後の調節を行うという葉緑体で知られる遺伝子発
現の特徴が生まれた。
概要2
ところが,緑藻が陸に上がって陸上植物が誕生すると状況が一変する。陸上では,非常に
強い環境ストレスのため,植物は多細胞化して細胞が分業するようになった。さらに,生
活環を持つようになって,栄養成長に不都合な時には休眠するようになった。コケ植物や
シダ植物の胞子,種子植物の種子などである。これらの休眠細胞では,クロロフィルをも
つと光ダメージを受けるおそれがあるため,色素も持たなくなった。そうすると,今度は,
休眠細胞から光合成細胞を分化する際に葉緑体を発達させることになった。葉緑体が先で,
原色素体は後からできたのであるが,発達段階の説明では逆の順になっていることに注意。
そこで,被子植物では,最初に色素体ゲノムのスイッチを入れるため,これまでミトコン
ドリアで使っていた核コードRNAポリメラーゼを重複させて色素体でも使うようにした。
これがNEP(nuclear-encoded RNA polymerase)である。これに対して,葉緑体ゲノムに
コードされるものをPEPと呼ぶ。この他,環境や細胞分化に応じて色素体はさまざまな機
能・形態の分化を行うが,それを制御するために多数の新たな転写因子が葉緑体に送り込
まれた。すでに原核由来の因子の遺伝子は失われているので,これら新たな転写因子は,
真核細胞で使われていたものを転用して使うことになった。たとえば,亜硫酸還元酵素
(SiR)は,葉緑体DNAに結合してその転写活性を著しく低下させるが,これは可逆的であ
る。従って,葉緑体発達の最初にDNAがたくさん複製されたとき,それがすぐに転写され
てはこまるので,SiRによって転写しないように抑えている。その後,葉緑体の発達にあ
わせてSiRがはずれていく。これらの過程をまとめると次ページの図になる。
Discontinuous evolution
of plastid genomic
machinery(1)
DNA polymerase
Adapted from N. Sato (2001) Trends in Plant Science 6: 151-156