DBTSS:The DataBase of Transcription Start Sites, and CpG islands

Transcript DBTSS:The DataBase of Transcription Start Sites, and CpG islands

DNA配列情報からの転写・翻訳制御情報のバイ
オインフォマティックス
山下理宇
東北大学東北メディカル・メガバンク機構ゲノム解析部門
[email protected]
08/11/2012 Network medicine特論
自己紹介
2001年~2012年東京大学医科学研究所ヒトゲノム解析センター
転写開始点データベースDBTSSとそれを用いた転写解析
melina2、DBTSSの構築
2012年4月〜東北大学東北メディカル・メガバンク機構
東北地方におけるバイオバンクの構築
大規模ゲノムコホート調査
本日の内容
始めに
 遺伝子についての雑談
転写制御解析
 転写開始点の重要性と多様性
 NGS時代の転写制御解析
 転写制御領域の解析手法
翻訳制御解析の例
http://www.hgc.jp/~ryamasi/Japanese/others.html
気楽な意見交換ができたら嬉しいです。
遺伝子を自分の中で定義し
てみて下さい。
遺伝子はいくつあると思
いますか？
ある問い合わせ
ラボに中学校の先生から電話（多分2003年）
先生：あの〜、ヒトの遺伝子はいくつあるんですか？
私：う〜ん、ちょっと難しい問題ですね。・・・・
ということで、いくつと言うことは、難しいんですよ。
先生: そうですか。難しいんですね。
よくわかりました。
先生：で、いくつありますか？
私：・・・
遙か遠い記憶によると・・・
遺伝子 = DNAの中で転写されて翻訳される部分
DNAは遺伝子である
×
遺伝子はDNAである
○
DNAには遺伝子領域として使われるのは数%で、
ほとんどはjunk DNA
ゲノムブラウザ上の遺伝子
refGene.txt
http://hgdownload.soe.ucsc.edu/goldenPath/hg19/database/からrefGene.txtをダウンロード
行数
NMで35132行
NRで6887行
合計42019行
Splicing variants
ユニーク行
NMで32678行
NRで6077行
合計38755行
NMで696遺伝子がゲノム上の複数箇所にmapping
複数箇所マッピングの理由
X,Y染色体にある例
HLA領域
ちなみに
こういうコマンドで処理できます。
long non-coding RNA
http://www.lncipedia.org/
これらは遺伝子？？
本日の内容
始めに
 遺伝子についての雑談
転写制御解析
 転写開始点の重要性と多様性
 NGS時代の転写制御解析
 転写制御領域の解析手法
翻訳制御解析の例
生命を制御する転写・翻訳
細胞
核
細胞質
様々な機能
DNA
転写開始点
TF
GTF
mRNA
転写
pol II
タンパク質
翻訳
転写・翻訳制御機構は生命活動のエッセンス！！
転写開始点を決めるには・・・
転写
genome
mRNA(full)
Genbank
AAAA
TTTT
TTTT
TTTT
Refseq cDNA
TTTT
Full length cDNA
TTTT
5’EST
5’はどこ？
５‘端が保証さ
れたcDNA
転写開始点を決めるには、5’端が保証されたcDNA配列が不可欠
DBTSS
 実験的に保証された５‘端配列(TSS)
 Oligo-capping法（東京大学, かずさDNA研)
 CAP-trapper法 (理研)
TSS
TSS
Genome
5’-EST
DBTSS: DataBase of Transcritption Start Sites
(http://dbtss.hgc.jp)
DBTSSは遺伝子の転写開始点を知るためのツール
２００１年約20万配列
サンガー時代のDBTSS
Data in DBTSS
human
open
genome
ver.1
2001Sep.
ver.2
mouse
#clones
#mapped
#NM
#LocusLink genome #clones
hg7
217402
111382
7889
-
-
2002Mar.
hg11
400225
183845
9336
-
mm1
33482
14606
2789
ver.3
2003May.
hg13
400225
190964 11234
9470
mm2
580209
195446
7524
6875
ver.4
2004Nov
hg16
400225
277794 15536
12780
mm3
580209
290714 11116
10933
ver.5
2005Sep
hg17
1780295 1359000 19753
15262
mm5
580209
364487 14746
14162
Ver. 5
human
19753 / 22682(87.1%)
mouse
14746 / 17213(85.7%)
>100 samples
2005年 140万配列
-
#mapped
#NM
#LocusLink
-
-
-
転写開始点の例
cDNA
TP53
長さ: 100 bp ~ 500 bp
sangerシークエンサー使用
転写開始点の多様性
そろっている
揺らぎがある
その他
選択的
甲状腺
一つの遺伝子の転写開始点は一つとは限らない
CpG+-遺伝子と組織特異性
human
mouse
CpG-遺伝子は、組織特異性が高い傾向にある
CpG+-遺伝子のGOアノテーション
CpG＋
metabolism
enzyme
CpG−
Cell communication
Physiological process
Extracellular
Signal transduction
プロモータのCpG islandsと組織特異性は相関がある
Yamashita et al 2005
シークエンサーの歴史
illumina HiSeq2000
配列決定可能塩基数/day
100億
ヒトゲノム(30億)
illumina GAII (クラスターPCR)
SOLiD (エマルジョンPCR)
1億
ロシュ454 GS20 (pyro)
100万
ABI 3700 (キャピラリー)
ABI 37３0 (キャピラリー)
ABI 377 (ゲル)
1万
ABI 373 (ゲル)
次世代シークエンサーの使用開始
MCF7:Human breast adenocarcinoma cell line
HEK293: human embryonic kidney
2007年 2100万配列
Wakaguri et al 2008 NAR
An example DBTSS（TP53)
cDNA
>100 samples
1.4M cDNAs
HEK293
illumina
12M tags
MCF7
illumina
10M tags
DBTSSの現状 version ７,8
sample_name
cell or tissue
condition
time_corse
tag_count
TSC
TSC (5ppm)
HIF1
DLD1
1%NT
24h
7723359
192857
11149
HIF2
DLD1
1%NT
24h
7727105
135023
12959
HIF3
DLD1
21%NT
24h
7410902
87419
10102
HIF4
DLD1
1%NT
24h
8737554
91764
9511
HIF5
DLD1
21%NT
24h
8644835
177125
10027
HIF6
DLD1
21%NT
24h
8353702
116081
9892
Beas2B STAT IL4+
Beas2B
IL4
4h
22954017
296499
10596
Beas2B STAT IL4-
Beas2B
21127774
282561
10467
Beas2B parent IL4+
Beas2B
15166848
141048
11310
Beas2B parent IL4-
Beas2B
11628747
84197
9647
Beas2B siRNA- IL4+
Beas2B
8243100
228762
12285
Beas2B siRNA- IL4-
Beas2B
7857509
125663
11151
Beas2B siRNA+ IL4+
Beas2B
5879777
155014
10841
Beas2B siRNA+ IL4-
Beas2B
5931745
103793
10747
Ramos_plus
Ramos
15268493
247636
9689
Ramos_minus
Ramos
15759413
213897
8998
MCF7_1%
MCF7
1%NT
7771727
115152
9822
MCF7_21%
MCF7
21%NT
8014509
102347
9587
TIG_1%
TIG
1%NT
9162153
152476
10187
TIG_21%
TIG
21%NT
9618602
94809
9825
293_1%
HEK293
1%NT
11110306
107072
9378
293_21%
HEK293
21%NT
9576529
135573
9227
FetalHeart
Fetal heart
10182282
349524
13638
FetalKidney
Fetal kidney
8424482
241175
13505
FetalLiver
Fetal liver
4741889
134631
7568
FetalThymus
Fetal thymus
7122556
281927
14014
FetalBrain
Fetal brain
11285710
313120
13712
Heart
heart
9378901
192818
7804
Kidney
kidney
11196359
204522
10423
Brain
brain
11561960
418537
11542
IL4
IL4
IL4
IL4
4h
4h
4h
4h
7 細胞腫、21組織、
48 サンプル
2009年 3億配列
2011年 4.8億配列
TSS variation of TP53
testis
ovary
19 tissues
SNP viewer
NM_013293,transformer 2 alpha homolog
Ensembl
Ethnic SNP
dbSNP
NCBI
Refseq
GWAS: 5800 SNP
TSS seq tags
転写開始点付近のSNPs
かなりたくさんのSNPが転写開始点付近に存在する
TSSと転写マーカーとの比較
Protein
RNA Seq (polysome)
RNA Seq (cytoplasmic)
AAAA
ribosome
cDNA sequencing
RNA Seq (nucleus)
Nucleosome Seq
AAAA
mRNA
TSS Seq
polII
nucleosome
ChIP Seq (some TFs)
Ac
ChIP Seq (polII)
genome
me
ChIP Seq (H3Ac/H3K4me3)
1. ヌクレオソーム構造、ヒストン修飾？
2. 転写されているか? （pol II）？
Nucleus
Cytoplasm
2011年 +12億配列
3. 翻訳されているか? (polysome analysis)
現在17億配列
総合的な転写制御データベースと
してのDBTSS
ChIP-seqデータ
Yamashita et
2011
Pol II chip-seq
DNA
polII
polII
ChIP Seq (polII)
17,194,001 tags
#total peak
polII Chip-seq
#peak in RefSeq region %
#peak outside of RefSeq region
39150
32374 83%
6776
>5ppm
6265
4038 64%
-
<5ppm
74916
5410
-
7%
1182 (22%) are >5ppm in other sample
Arrested
Pol II?
PoI IIが存在しているが転写されていない例もある
Nucleosome structure
Transcription factor
MNaseI treatment
Sequencing
Nucleosome structure
nucleosome
genome
Nucleosome Seq
19,570,149 tags
Nucleosome structures
No anti-sense
Bi-directional transcription
-160 ~ -100
Histone modification
Figure 4-39 Molecular Biology of the Cell (© Garland Science 2008)
Histone modification
ChIP Seq (H3Ac/H3K4me3)
57,931,186 tags
Ac
mRNA
me
Ac
me
Polysome fraction analysis
Figure 6-76a Molecular Biology of the Cell (© Garland Science 2008)
Polysome fraction analysis
#total peak #>=3tags in polysome %
#enrichment in polysome
%
>5ppm
6265
5539
88%
1687
27%
<5ppm
74916
6140
8%
342
0.5%
Definition of alternative promoter
alternative promoter: AP
100
60
brain
AP2
30
heart
AP2
AP1
60
AP1
100
kidney
…..
AP1
11,406 genes have >5ppm TSC
4,937 genes have alternative promoters
classification of promoters based on AP
usage
選択的プロモータの例
HoxB6
epitope
PAP1
PAP2
(kD)
25
20
15
NM_018952 (HoxB6)
TSS tag
pol II binding
PAP1
1170ppm
bound
Corresponding cDNA
BC014651
Longest ORF in the
cDNA
Expected molecular
weight of protein
product
Translation caveat
polysome tag enrich (p
value)
RNA Seq tag
(polysome)
PAP2
25ppm
bound
X58431
(HIT00195371)*1
224 aa
140 aa
25.4 kD
15.2 kD
no
no
1e-7
2e-3
9ppm
5ppm
(kD)
翻訳制御の例
Cdx2
epitope
PAP1
PAP2
50
37
25
20
15
10
NM_001265 (Cdx2)
TSS tag
pol II binding
Corresponding cDNA
Longest ORF in the
cDNA
Expected molecular
weight of protein
product
Translation caveat
polysome tag enrich (p
value)
RNA Seq tag (polysome)
PAP1
76ppm
bound
BC014461
PAP2
26ppm
bound
RCT02405
313 aa
<100 aa
45.7 kD
(15.0 kD)*2
no
yes
1e-3
0.7
62ppm
0.7ppm
Yamashita et al 2011
mRNAの中には転写されているが翻訳されていない物もある
さて・・・
転写開始点が重要な
事は分かった。
では、そこからプロモータ
配列が得られたときにど
う解析を進めればよいの
だ？
転写因子結合部位とモチーフ
転写因子結合部位 ≒ モチーフ
遺伝子A
プロモータ
既知のモチーフはデータベースにある
制限酵素と異なり、曖昧
プロモータ領域に存在する既知のモチーフを探してみようか…
既知Motifのデータベース
 TRANSFAC
 Publicは無償だが、有償の方がデータ多い
 重複があるので取り扱い注意
 http://www.biobase.de/
 JASPAR
 無償
 重複なしだったはず….
 http://jaspar.genereg.net
JASPAR: Top page
ここをクリック
特定のモチーフを
検索可能
Bryne JC, et al, Nucleic Acids Res. 2008
Jan;36(Database issue):D102-6.
既知Motifの探索法
TATA-box
fb,I = counts of base b in position i
頻度
N =number of sites
A
61
16
352
3
354
268
360
222
155
56
83
82
82
68
77
C
145
46
0
10
0
0
3
2
44
135
147
127
118
107
101
G
152
18
2
2
5
0
10
44
157
150
128
128
128
139
140
T
31
309
35
374
30
121
6
121
33
48
31
52
61
75
71
389
389
389
389
389
389
379
389
389
389
389
389
389
389
389
A
0.17
0.08
0.79
0.05
0.80
0.61
0.83
0.52
0.37
0.16
0.22
0.22
0.22
0.19
0.21
C
0.35
0.14
0.04
0.06
0.04
0.04
0.05
0.05
0.14
0.33
0.36
0.31
0.29
0.27
0.26
G
0.37
0.08
0.05
0.05
0.05
0.04
0.06
0.14
0.38
0.36
0.32
0.32
0.32
0.34
0.34
T
0.11
0.70
0.12
0.84
0.11
0.30
0.06
0.30
0.11
0.14
0.11
0.15
0.17
0.20
0.19
1.67 -2.36
1.68
1.30
1.73
1.05
0.58 -0.63 -0.19 -0.20 -0.20 -0.42 -0.27
p(b,i) = corrected probability of base
b in position i
s(b) = pseudocount
確率
Position specific weighet matrix
A
-0.54 -1.71
C
0.49 -0.83 -2.57 -1.98 -2.57 -2.57 -2.35 -2.43 -0.88
0.40
0.51
0.33
0.24
0.12
0.05
G
0.55 -1.63 -2.43 -2.43 -2.24 -2.57 -1.95 -0.88
0.54
0.34
0.34
0.34
0.44
0.45
T
-1.21
A
T
-1.21
min
max
1.49 -1.10
A
T
1.68
1.3
A
1.30
1.73
T
C
1.73
1.05 -1.15
T
G
1.05
0.60
0.4 -1.21
G
0.54
0.51
（Sandelin A. 2004 Nat. Rev. Gen.より改変）
0.34
G
0.34
0.34
score
C
-22.99
1.75
1.68
A
-1.21 -1.71 -2.57 -2.43 -2.57 -2.57 -2.35 -2.43 -1.15 -0.79 -1.21 -0.71 -0.54 -0.42 -0.37
1.67
1.75
A
p（ｂ） = background probability
0.27 -1.15 -0.79 -1.21 -0.71 -0.54 -0.30 -0.37
8.67
1.49
1.67
A
0.27 -2.17
0.05
0.55
1.49
1.75 -1.23
0.60
0.34
0.44
0.44
0.45
14.42
８４.6%
% = (score-min)/(max-min)
既知Motifの探索法
DNA配列
AGATATAAAATCTGGGCTGACTGCGCGATGGCTAGCATGCGCCAATGCACCGAATGCGCATGCATGCA
1.37
-0.14
8.67
(14.92 - 8.67) / (14.92 - (-22.99)) = 0.846
positive
この操作をDNA配列全てかつ全てのモチーフにたいして行う。
JASPAR: 入力画面
検索する種などを選択も可能
検索するモチーフ
を選択
配列を入力
探索!!
JASPAR: 結果
TP53 プロモータ領域1200bp(-1000 ~ +200)
こんなはずじゃ
なかった・・・
1200bpに893カ所!？
どうするか？
 1. スコアの高いものを使う
 2. 距離を考慮する
 3. 保存度を考慮する
 ４. 複数モチーフの組み合わせで考える
いずれにせよ、実験的手法などで、もう少し絞っ
た方が良いです。
共通モチーフ検索の必要性
 同じように発現する遺伝子は、同じ転写因子
によって制御されている？
遺伝子A
遺伝子B
遺伝子C
遺伝子D
どうやって、共通配列（モチーフ）を求めるか
大きく2つの道
既存のモチーフを探し、
統計的に有意なモチーフ
を抽出する
両者の結果を
組み合わせる
特徴のある
遺伝子群
de novoでモチーフを探す
既知モチーフ数え上げ手法
全プロモータ
ある実験で発現の上昇が見ら
れた遺伝子群のプロモータ
…
…
プロモータ 20000個
モチーフ 1000個 (5%)
プロモータ 50個
モチーフ 10個 (20%)
超幾何分布を仮定する → 「R」を使う
http://cran.r-project.org/
> 1 - phyper(10,1000,(20000-1000),50)
2.863409e-05
実例
遺伝子A
遺伝子B
遺伝子C
-1000 ~ +200
-500 ~ +100
-200 ~ +50
JASPARを使用、thresholdは、80%, 85%, 90%
モチーフセット3種 × threshold 3首 = 9種
バックグラウンドと比較
実験的な解釈
TRAF6-/-とwild typeのマウスを比較
Wild typeで発現が高い遺伝子群にSTAT1結合部位が予測
実験的にSTAT1が下流で働いていることを確認
oPOSSUM
http://www.cisreg.ca/oPOSSUM/
Ho-Sui SJ et al 2005
遺伝子リストに存在する既知転写因子結合部位（JASPAR)の推定
de novoモチーフ検索
 既知のモチーフしか抽出できないの？
遺伝子領域A
遺伝子領域B
遺伝子領域C
遺伝子領域D
ある配列群の中に有意に多く観察される配列群を抽出する
未知Motifの探索の限界
配列が3つだったら・・・・→ 3次元
配列がnだったら・・・・→ n次元!!!
数え上げ、確率的手法…
・MEME、Gibbs、CONSENSUS….
未知Motifの探索の限界
Nature Biotech. 2005
13種のモチーフ検出プログラムの比較
既存の確率的手法の問題点
 得られたモチーフが最適解とは限らない
 パラメータ調整の必要性
 プログラム間での結果比較が難しい
MEME
Gibbs
Motif 1 sites sorted by position p-value
-------------------------------------------------------------------------------Sequence name
Start
P-value
Site
----------------- ----------------------SEQ8;
172 9.57e-10 CCCGGAGTAT CTCAATCGTAGATGA ATACCACTTT
SEQ3;
112 9.57e-10 GTTATATTGG CTCAATCGTAGATGA AACCAGACTC
SEQ5;
185 1.96e-09 ACGGGCAAGC CTCAATCGTAGAGGA T
SEQ6;
105 2.82e-09 GTCAGCCGGT CTCAATCGTAGATCA GAGGCGAGAA
SEQ4;
173 4.67e-09 GTTCGAGAGC CTCAATCGTAGATAA CCTCTCTGGC
SEQ2;
172 4.67e-09 AAGCGTCGTG CTCAATCGTAGATAA CAGAGGTCGG
SEQ10;
3 7.52e-09
TT CTCAATCGTAGAGTA TGCTTAGAGG
SEQ9;
93 7.52e-09 CGCCTAGAAA CTCAATCGTAGAGTA TCACGCACCG
SEQ1;
52 9.33e-09 CTTTACTCGG CTCAATCGTAGAGGC GGTGCCGCGA
SEQ7;
177 1.95e-08 AAGTCTTTGA CTCAATCGTAGACCC AACACTTGA
-------------------------------------------------------------------------------MOTIF A
1-1
2-1
3-1
4-1
5-1
6-1
7-1
8-1
9-1
10-1
53
173
113
174
186
106
178
173
94
4
tttactcggc
agcgtcgtgc
ttatattggc
ttcgagagcc
cgggcaagcc
tcagccggtc
agtctttgac
ccggagtatc
gcctagaaac
ttc
TCAATCGTAG
TCAATCGTAG
TCAATCGTAG
TCAATCGTAG
TCAATCGTAG
TCAATCGTAG
TCAATCGTAG
TCAATCGTAG
TCAATCGTAG
TCAATCGTAG
aggcggtgcc
ataacagagg
atgaaaccag
ataacctctc
aggat
atcagaggcg
acccaacact
atgaatacca
agtatcacgc
agtatgctta
62
182
122
183
195
115
187
182
103
13
モチーフ発見ツール Melina2
1.配列をFASTAフォーマットで入力
Consensus, MEME, Gibbs
Sampler, MDScan, Weeder
2.パラメータ、プログラムを設定
3.submit
http://melina2.hgc.jp
Okumura et al 2007
Melina2結果画面
1.モチーフを選択
2.sequence logo
3.既知の類似モチーフ検索
Melina2結果画面
1.モチーフを選択
2.sequence logo
3.既知の類似モチーフ検索
4.プロモータ上の探索
現在の状況・・・
Roche GS FLX+
Hiseq2500
Ion Proton
今までのモチーフ抽出プログラムはせいぜい数百配列を対象
次世代シークエンサーの登場 ChIP-seqの時代に
ChIP-seqでは正確な結合位置はわ
からない
TF
Genome
大量の配列からモチーフ抽出をするニーズ
ChIP-seq用プログラム
 DREME
 MEMEを作っているグループが提供
HEGMA: 京都大学市瀬先生が開発
解析の例
Beas2b IL4で刺激、STAT6のChIP-seq
3 tag以上を抽出
＊本当は配列のオーバーラップ
とバックグラウンドを考慮する必
要があります
→ MACS等のソフトを使う
ftp://ftp.hgc.jp/pub/hgc/db/dbtss/dbtss_ver8/hg19_liftover/ChIPseq/Beas2b/b2b_pls_stat6_ip.bed.gz
DREME input
1.ファイルを選択
直接pasteも可
2.メールアドレスを入力
http://meme.sdsc.edu/meme/
Bailey TL. Bioinformatics 2011
DREME 結果
TOMTOM 結果
モチーフ探しの未来
 de novoモチーフ抽出の究極のツール
 ChIP-seqからの転写因子結合部位探し
の需要
 既存のモチーフは、本当に正しいか
ChIP-exoがやってきた
Cell 2011
もしかしたら、転写因子結合部位を探す
ためのChIP-seqは無くなるかも・・・
転写因子は複数の認識部位を持つ
本日の内容
始めに
 遺伝子についての雑談
転写制御解析
 転写開始点の重要性と多様性
 NGS時代の転写制御解析
 転写制御領域の解析手法
翻訳制御解析の例
転写開始点の多様性
そろっている
揺らぎがある
その他
選択的
甲状腺
一つの遺伝子の転写開始点は一つとは限らない
fixed TSSの鳥瞰図
Initiator
Pyrimidine rich region
-3〜+5
-100〜+100
クラスターに属する遺伝子
翻訳に関わるものが多い
Terminal oligo-pyrimidineを持つTOP遺伝子群
TOP遺伝子について
 Terminal oligo-pyrimidine rich sequenceを持つ
 Ribosomal protein ＋ RP以外8種が既知
 培養細胞で飢餓状態にすると、選択的に翻訳停止
翻訳調節
ON/OFF
X
m7G-CTTTTT---------ATG-----------
・TOPのコンセンサス配列は？
・どの遺伝子がTOP遺伝子なのか？
曖昧であったTOP遺伝子の再定義を試みる
TOP 遺伝子候補の検出
1. -1:+4 must be C/T
PSWMをTOP遺伝子候補 2. +1 must be C
3. The PSWM score >0.1
TOP candidates(#gene)
all
known-TOP ribosomal
-
>=2
1645
8
78
8
75
Human 1645 遺伝子→ mouse?
#gene
%
all TOP candidates
1645
100
homologus
1314
80
239
15
both
239→40/81が翻訳制御を受けていることがわかった
mRNA長と翻訳制御の関係
region
After TPA
r
A
3'-UTR
0.56
B
5'-UTR
0.42
C
RNA
0.61
D
ORF
0.53
Yamashita et al 2008
TOP配列だけでなく、mRNA長も翻訳制御に関わっている可能性
ribosome profiling
Degree of translation
refseq遺伝子
untranslated
translated
lincRNA
Long intergenic non-coding RNA
翻訳されているlincRNAは結構多い？？
Genes in ribosome fraction
Genes in RNA fraction
Example: Linc-XPR1
どこまで遺伝子としますか?
 ORFを持つmRNA,tRNA,rRNA
 miRNA,snoRNA etc
 lncRNA
 プロモータ領域
 その他の転写制御領域
Nature, 2012
ゲノム上の80%が生化学的
な機能を持つ
まとめ
 ゲノム屋が「遺伝子」という言葉を使う場合は、
無意識のうちに前提が異なっている場合があ
るので注意！！
 遺伝子は転写・翻訳制御が時間的・空間的に
行われており、それを考慮した解析が不可欠
遺伝子の定義・遺伝子が
やっていることは結構適当
・・・・・
Acknowledgements
 Medical genome science, Univ. of Tokyo
 Dr. Yutaka Suzuki
 Dr. Hiroyuki Wakaguri
 Dr. Sumio Sugano
 Takako Arauchi (nucleosome analysis)
 Dr. Kosuke Tanimoto (Western analysis)
 Dr. Akinori Kanai (polysome analysis)
 Etsuko Sekimori
 Institute of Medical Science, Univ. of Tokyo
 Dr. Kenta Nakai
 Yoshiaki Tanaka (nucleosome data analysis)

DBTSS:The DataBase of Transcription Start Sites, and CpG islands

Transcript DBTSS:The DataBase of Transcription Start Sites, and CpG islands

Directory