第五章ppt - 北京大学生命科学学院

Download Report

Transcript 第五章ppt - 北京大学生命科学学院

第
五
章
分子生物学研究法
(上)DNA、RNA及蛋白质操作技术
扉页:
当你进入实验室时,要像脱去外衣那样放下你
的想象力,因为实验操作中不能有一丁点儿的想象,
否则,你对事物的观察就会受影响;当你翻开书本
的时候,你又必须尽可能展开想象的“翅膀”,否
则,你就不可能走在别人的前面。
基因操作主要包括DNA分子的切割与连接、细胞转
化、核酸序列分析以及基因人工合成、表达、定点
突变和PCR扩增等,是分子生物学研究的核心技术。
基因工程是指在体外将核酸分子插入病毒、质粒或
其它载体分子,构成遗传物质的新组合,使之进入
原先没有这类分子的寄主细胞内并进行持续稳定的
繁殖和表达。
根癌土壤农杆菌(Agrobaoterium tumefaciens)侵染植
物细胞后能将其Ti(tumor inducing)质粒上的一段
DNA(T-DNA)插入到被侵染细胞的基因组,并能稳
定地遗传给后代,植物的遗传转化(植物基因工程)
技术随之得到迅速发展。
5. 1 重组DNA技术史话
基因工程技术是核酸操作技术的一部分,只不过它强
调了外源核酸分子在另一种不同的寄主细胞中的繁衍
与性状表达。
事实上,这种跨越物种屏障、把来自其它生物的基因
置于新的寄主生物细胞之中的能力,是基因工程技术
区别于其它生命科学技术的根本特征。
表5-1重组DNA技术史上的主要事件
年 份
事
件
1869
F.Miescher首次从莱茵河鲑鱼精子中分离DNA。
1957
A.Kornberg从大肠杆菌中发现了DNA聚合酶I。
1959-1960
Uchoa发现RNA聚合酶和信使RNA,并证明mRNA决
定了蛋白质分子中的氨基酸序列。
1961
Nirenberg破译了第一个遗传密码;Jacob和Monod
提出了调节基因表达的操纵子模型。
1964
Yanofsky和Brenner等人证明,多肽链上的氨基酸序
列与该基因中的核苷酸序列存在着共线性关系。
1965
Holley完成了酵母丙氨酸tRNA的全序列测定;科学家
证明细菌的抗药性通常由“质粒”DNA所决定。
1966
Nirenberg,Uchoa,Khorana,Crick等人破译了全
部遗传密码。
1967
1970
第一次发现DNA连接酶
Smith,Wilcox和Kelley分离了第一种限制性核酸
内切酶,Temin和Baltimore从RNA肿瘤病毒中发
现反转录酶。
1972-1973
Boyer,Berg等人发展了DNA重组技术,于72年
获得第一个重组DNA分子,73年完成第一例细菌
基因克隆。
1975-1977
Sanger与Maxam和Gilbert等人发明了DNA序列
测定技术,1977年完成了全长5387bp的噬菌体
φ174基因组测定。
1978
首次在大肠杆菌中生产由人工合成基因表达的人
脑激素和人胰岛素。
1980
美国联邦最高法院裁定微生物基因工程可以被专
利化。
1981
Palmiter和Brinster获得转基因小鼠,Spradling
和Rubin得到转基因果蝇。
1982
1983
1984
1986
1988
1989
1992
1994
1996
1997
2000
2001
美、英批准使用第一例基因工程药物——胰岛素,
Sanger等人完成了入噬菌体48,502bp全序列测定。
获得第一例转基因植物。
斯坦福大学获得关于重组DNA的专利。
GMO首次在环境中释放。
Watson出任“人类基因组计划”首席科学家。
DuPont公司获得转肿瘤基因小鼠—“Oncomouse”。
欧共体35个实验室联合完成酵母第三染色体全序列测定
(315kb)。
第一批基因工程西红柿在美国上市。
完成了酵母基因组(1.25×107bp)全序列测定。
英国爱丁堡罗斯林研究所获得克隆羊。
完成拟南芥的全序列测定(1.2×108bp)。
完成第一个人类基因组全序列测定(2.7×109bp)。
上个世纪中下叶以来,现代分子生物学的迅猛发展源
自工具酶的发现。
(一)限制性核酸内切酶
能够识别DNA上的特定碱基序列并从这个位点切开
DNA分子。
第一个核酸内切酶EcoRI是Boyer实验室在1972年发
现的,它能特异性识别GAATTC序列,将双链DNA分
子在这个位点切开并产生具有粘性末端的小片段。
图5-1 几种主要DNA内切酶所识别的序列及
其酶切末端。
图5-2 DNA连接酶能把不同的DNA片段连接成一个整体
多聚核苷酸链中新生磷酸糖苷键的产生过程
单核苷酸5‘-磷酸基团向核酸链的3’-OH发起进攻
RE 切割随机DNA分子(假定4种碱基在DNA中均匀
分布)的概率由该酶所识别的碱基数目按照4n 来计
算,如一个6碱基切割酶平均每4096 bp核DNA有一
个酶切位点(46),而一个4碱基切割酶平均每256
bp核DNA就有一个酶切位点(44)。
重组DNA实验中常见的主要工具酶
酶
类
功
能
限制性核酸内切酶
识别并在特定位点切开DNA
DNA连接酶
通过磷酸二酯键把两个或多个DNA片段连接
成一个DNA分子
DNA聚合酶I(大肠杆菌) 按5'到3'方向加入新的核苷酸,补平DNA双
链中的缺口
反转录酶
按照RNA分子中的碱基序列,根据碱基互补
原则合成DNA链
多核苷酸激酶
把磷酸基团加到多聚核苷酸链的5'-OH末端
(进行末端标记实验或用来进行DNA的连接
末端转移酶
在双链核酸的3‘末端加上多聚或单核苷酸
DNA外切酶III
从DNA链的3'末端逐个切除单核苷酸
λ噬菌体DNA外切酶
从DNA链的5'末端逐个切除单核苷酸
碱性磷酸酯酶
切除位于DNA链末端的磷酸基团
嘧啶
鸟嘌呤
腺嘌呤
嘌呤
胞嘧啶
尿嘧啶
胸腺嘧啶
组成DNA和RNA分子的五种含氮碱基的结构式
仅仅能在体外利用限制性核酸内切酶和DNA连接酶
进行DNA的切割和重组,还不能满足基因工程的要
求,只有将它们连接到具备自主复制能力的DNA分
子上,才能在寄主细胞中进行繁殖。
具备自主复制能力的DNA分子就是分子克隆的载体
(vector)。病毒、噬菌体和质粒等小分子量复制
子都可以作为基因导入的载体。
(二)基因克隆的载体
1、pSC101质粒载体
• 长9.09kb,带有四环素抗性基因(tetr)及EcoRI、
HindIII、BamHI、SalI、XhoI、PvuII以及SmaI等
7种限制性核酸内切酶的单酶切位点,在HindIII、
BamHI和SalI等3个位点插入外源基因,会导致tetr
失活。
大肠杆菌
pSC101 质
粒载体示
意图。
是第一个基因克隆载体。缺点:它是一种严紧型复制
控制的低拷贝质粒,平均每个寄主细胞仅有1~2个拷
贝,从带有该质粒的寄主细胞中提取pSC101 DNA,
产量很低。
2、ColE1质粒载体
• 松弛型复制控制的多拷贝质粒。
一般情况下,当培养基中氨基酸被耗尽,或是在细
胞培养物中加入氯霉素以抑制蛋白质的合成,寄主
染色体DNA的复制便被抑制,细胞的生长也随之停
止。
• 松弛型质粒DNA却继续复制数小时,使每个寄主细
胞中ColE1质粒的拷贝数达到1000~3000个,占细胞
总DNA的50%左右。
EcoRI
AflII
NruI
ApaLI
SmaI
SacII
O
RF
1
ori
ColE1
6.64 kb
BelI
MscI
2
F
R
O
ClaI
ColE1质粒DNA复制起始部位调控因子之间关系
前体RNA(RNAII)的转录起始于复制起点上游,需经
RNaseH加工后产生有555个核苷酸的引物,起始DNA
合成。
RNA 1在RNA 2的5’末端,转录方向相反,因此能通过
氢键配对与后者相互作用,阻止RNaseH加工RNA 2,
使其不能转化为有活性的引物,阻碍复制起始。
没有Rop蛋白,RNA 1基因就不能起始转录。
3、pBR322质粒载体
由三个不同来源的部分组成的:
第一部分来源于pSF2124质粒易位子Tn3的氨苄青霉
素抗性基因(AmpR);
第 二 部 分 来 源 于 pSC101 质 粒 的 四 环 素 抗 性 基 因
(tetr);
第三部分则来源于ColE1的派生质粒pMB1的DNA复
制起点(ori)。
Ampr
pBR322
4.36 kb
优点是具有较小的分子量(4363 bp)。能携带6-8 kb
的外源DNA片段,操作较为便利。
有两种抗生素抗性基因作为转化子的选择标记。
有较高的拷贝数,经过氯霉素扩增,每个细胞可累积
1000~3000个拷贝,便于制备重组体DNA。
4、pUC质粒载体(包括四个部分):
• 来自pBR322质粒的复制起点(ori)
• 氨苄青霉素抗性基因(ampr)
• 大肠杆菌β-半乳糖酶基因(lacZ)启动子及编码
α-肽链的DNA序列。特称为lacZ’基因
• 位于lacZ’基因5’-端的一段多克隆位点(MCS),
外源基因插入破坏lacZ ’基因功能
pUC18
2.69 kb
LacZ编码β-半乳糖苷酶氨基端146个氨基酸的α-肽,
IPTG(异丙基- β-D-硫代半乳糖苷)诱导该基因表达,
所合成的β-半乳糖苷酶α-肽与宿主细胞编码的缺陷型
β-半乳糖苷酶互补,产生有活性的β-半乳糖苷酶,水
解培养基中的X-gal(5-溴-4-氯-3-吲哚-β-D-半乳糖
苷),生成蓝色的溴氯吲哚。
含X-gal培养基中非转化菌落呈蓝色,含有重组DNA
分子的菌落为白色。
优点:
更小的分子量和更高的拷贝数。在pBR322基础上
构建pUC质粒载体时,仅保留下其中的氨苄青霉素抗
性 基 因 及 复 制 起 点 , 其 分 子 小 了 许 多 , pUC8 为
2750bp,pUC18为2686bp。由于缺失rop基因,pUC
质粒不经氯霉素扩增时,平均每个细胞即可达
500~700个拷贝。
pUC质粒结构中具有来自大肠杆菌lac操纵子的lacZ’基
因,所编码的α-肽链可参与α-互补作用。因此,可用
X-gal显色法实现对重组体转化子的鉴定。
具有多克隆位点MCS区段,可以把具两种不同粘性末
端(如EcoRI和BamHI)的外源DNA片段直接克隆到
pUC8质粒载体上。
5、 pGEM-3Z质粒
长度为2743bp,编码有一个氨苄青霉素抗性基因和
一个lacZ'基因。
含有两个噬菌体启动子(T7和SP6),为RNA聚合酶的
附着提供了特异性识别位点。加入T7或SP6 RNA聚合
酶,所克隆的外源基因便会转录出相应的mRNA。
6、穿梭质粒载体(shuttle plasmid vector)
由人工构建的具有原核和真核两种不同复制起点
和选择标记,可在不同的寄主细胞内存活和复制的
质粒载体。
这类质粒载体可保证外源DNA序列在不同物种
(原核和真核)的细胞内得到扩增,用途广泛。
7、pBluescript噬菌粒载体
pBluescript是一类从pUC载体派生而来的噬菌粒
载 体 , 简 称 为 pBS ( +/- ) , 如 今 则 更 多 地 叫 作
pBluescript KS(+/-)或pBluescript SK(+/-)。
• SK表示多克隆位点区的取向,即lacZ基因是按照
SacI→KpnI的方向转录;
• (+/ -)表示单链噬菌体f1复制起点的两种相反的取
向。
• f1(+)起点表示当pBluescript噬菌粒载体和辅助噬
菌体共感染寄主细胞时,能够回收到lacZ基因的有意
义链DNA;而f1(-)起点则表示当pBluesript噬菌粒
载体与辅助噬菌体共感染寄主细胞时,可回收到lacZ
基因的无意义链DNA。
(i)在多克隆位点区(MCS)的两侧,存在一对T3和T7
噬菌体的启动子,用以定向指导插入在多克隆位点上
的外源基因的转录;
(ii)具有单链噬菌体f1的复制起点和一个来自ColE1质
粒的复制起点,保证pBluescript噬菌粒载体在有无辅
助噬菌体共感染时,按照不同的复制形式分别合成出
单链或双链DNA;
(iii)编码有一个氨苄青霉素抗性基因,作为转化子
克隆的选择标记;
(iv)含有一个lacZ基因,可以按照X-gal-IPTG组织化
学显色法筛选噬菌粒载体的重组子。
5. 2 DNA操作技术
5. 2. 1核酸的凝胶电泳
自 从 琼 脂 糖 ( agarose ) 和 聚 丙 烯 酰 胺
(polyacrylamide)凝胶被引入核酸研究以来,按分
子量大小分离DNA的凝胶电泳技术,已经发展成为一
种分析鉴定重组DNA分子及蛋白质与核酸相互作用的
重要实验手段。
一种分子被放置到电场中,它就会以一定的速度移向
适当的电极。我们把这种电泳分子在电场作用下的迁
移速度,叫做电泳的迁移率,它与电场强度和电泳分
子本身所携带的净电荷数成正比,与片段大小成反比。
生理条件下,核酸分子中的磷酸基团呈离子化状态,
所 以 , DNA 和 RNA 又 被 称 为 多 聚 阴 离 子
(polyanions),在电场中向正电极的方向迁移。
由于糖-磷酸骨架在结构上的重复性质,相同数量的
双链DNA几乎具有等量的净电荷,因此它们能以同
样的速度向正电极方向迁移。
琼脂糖凝胶分辨DNA片段的范围为0.2~50kb之间。
聚丙烯酰胺凝胶的分辨范围为1到1000个碱基对之间。
凝胶浓度的高低影响凝胶介质孔隙的大小,浓度越
高,孔隙越小,其分辨能力就越强。
表5-3 琼脂糖及聚丙烯酰胺凝胶分辨DNA片
段的能力
凝胶类型及浓度
分离DNA的大小范围(bp)
0.3%琼脂糖
50 000~1 000
0.7%琼脂糖
20 000~1 000
1.4%琼脂糖
6 000~300
4.0%聚丙烯酰胺
1 000~100
10.0%聚丙烯酰胺
500~25
20.0%聚丙烯酰胺
50~1
溴化 乙锭染 料的 化
学结构及其对DNA分
子的 插入作 用 。 由
于插 入了溴 化乙 锭
分子 ,在紫 外光 照
射下 ,琼脂 糖凝 胶
电泳中DNA的条带便
呈现出橘黄色荧光,
易于鉴定。
DNA脉冲电场凝胶电泳示意图
5. 2. 2 细菌转化与目标DNA分子的增殖
获得了用外源 DNA片段和载体分子重组而成的杂种
DNA分子后,还必须通过一个被称为细菌转化的过程
将其重新导入到寄主细胞中,才能保证重组DNA分子
的增殖。
外源DNA能在宿主细胞中通过自身载体上的复制起始
位点进行复制增殖,从而在宿主细胞中长期保存,并
以完整的形式从细胞中被分离纯化出来。
细菌转化(transformation),是指一种细菌菌株由
于捕获了来自供体菌株的DNA而导致性状特征发生遗
传改变的过程。
重组DNA操作过程示意图
为提高效率,可对受体菌进行物理或化学处理,增
加其获取DNA的能力。经过这种处理的细胞被称作感
受态细胞(competent cells)。
CaCl2法
将快速生长期大肠杆菌置于经0℃预处理的低渗CaCl2
溶液中,细胞膨胀,膜通透性改变,易与外源DNA相
粘附。
将该体系转移到42℃下做短暂的热刺激,外源DNA就
可能被细胞吸收。将经过转化后的细胞置于选择性培
养基上,筛选阳性克隆。
转化效率可达到5×106~2×107个转化子/µg超螺旋质
粒DNA。
细菌转化及蓝白斑筛选
电击法
电脉冲可以在细胞膜上造成小凹陷,形成疏水孔洞。
随着跨膜电压增加,大疏水性孔洞会转变为亲水性
孔洞,介质中的DNA进入细胞质。
将生长至对数中期的E. coli菌液冷却至4℃后离心,
洗 菌 后 用 10% 的 甘 油 悬 浮 , 将 高 密 度 菌 液
(~2×1010/ml)置于特制的电极杯中进行电击。
获得最大转化效率时场强一般为12.5~15kV/cm,
时间跨度一般为4.5~5.5毫秒。
电击转化与温度有关,一般在0~4℃进行。由于转
化载体上常带有LacZ基因,多用带有不同抗生素
的选择性培养基结合α-互补蓝白斑筛选法鉴定转化
细胞。
利用噬菌体颗粒能够有效地将DNA注入到寄主细胞中
这一特点,科学家还发明了重组体DNA分子的体外包
装法。经包装的基因工程噬菌体颗粒能够借助细菌
表面的噬菌体接受器位点将DNA注入受体细菌,并在
这些细胞中得到繁殖和表达。
5. 2. 3聚合酶链式反应(PCR)技术
聚合酶链式反应是快速扩增DNA序列最常用的方法。
PCR反应的模板DNA若是基因组上的某个片段,就
称 为 genomic PCR , 若 是 mRNA 反 转 录 产 生 的
cDNA,就称为RT-PCR。
图5-7 聚合酶链式反应(PCR)技术
图5-8 PCR指 数 扩增时 循
环次数与DNA产物数量的
比较
1989年12月, 著名的自然科学杂志“SCIENCE”将
PCR和它所使用的聚合酶命名为第一个“年度分子”。
主编Daniel Koshland Jr. 写道:第一篇有关PCR的论
文发表于1985年。自那以后,PCR已经发展成为日益
强大的和有广泛用途的技术。…… 有了PCR,极少量
遗传物质也能扩增产生大量一般实验室都能得到的、
可用于生化分析和鉴定的材料。
“SCIENCE”确实在1985年发表了第一篇关于PCR的
论文。但是,却拒绝了由穆利斯撰写的描述PCR技
术的论文。编辑部给他回了一封标准的拒稿信:
“这篇文章虽然通过了评审委员会的初选,但不幸
的是,专家们对本文的评审结论并没有像对同时期
拟录用的稿件那样积极。所以,尊稿无力竞争本刊
有限的版面。”
凯利·穆利斯(Kary Mullis),1944年出生,1962年
在佐治亚理工学院化学工程专业毕业.
受同学们的蛊惑,1966年报考加州伯克利大学生化专
业研究生被录取。
1968年一个人在NATURE发表“时间反演的宇宙学
意义”论文并侥幸通过了博士生资格考试。
1972年,以“微生物铁转运因子的结构与有机合成”
获得博士学位。
毕业后,尝试写小说,但因“不能使一部分人物具有
不幸的遭遇”而失败,又因厌恶天天宰杀实验小鼠而
两次丢掉工作。
他有一条知名的可能引起不少同学共鸣的学习曲线:
刚开始时,对拓宽自身知识面表现出极大的兴趣—知
识迅速上升,然后徘徊不前,最终进入失望和不安阶
段—辞职
以后去一家小咖啡馆当了两年经理。1979年加入西特
斯公司,负责DNA合成。
正是费时费力的DNA合成(单引物,以算术级数增
长),激发了他的思维。
1983年8月,穆利斯第一次在公司正式作了一个有关
PCR原理的学术报告。人们对这个报告的反应冷谈,
只有少数几个实验技术人员有些兴趣。穆利斯回忆说,
“绝大多数人要么在我结束报告之前就离开了会场,
要么故意留下来给我出难题。他们认为这些肯定是胡
说八道。”
普遍的观点是,虽然我不够聪明,没看出问题的要害,
但肯定有理由证明这个方法不行,要不为什么从前没
人想到呢?
PCR技术的原理
首先将双链DNA分子在临近沸点的温度下加热分离
成两条单链DNA分子,DNA聚合酶以单链DNA为模
板并利用反应混合物中的四种脱氧核苷三磷酸、合适
的 Mg2+ 浓 度 和 实 验 中 提 供 的 引 物 序 列 合 成 新 生 的
DNA分子。
• DNA解链(变性)
• 引物与模板DNA相结合(退火)
• DNA合成(链的延伸)三步。
经不断重复循环之后,反应混合物中所含有的双链
DNA分子数,即两条引物结合位点之间的DNA区段
的拷贝数,理论上的最高值应是2n,实得1.8n.
将 含 有 待 扩 增 DNA 样 品 的 反 应 混 合 物 放 置 在 高 温
(>94℃)环境下加热1分钟,使双链DNA变性,形成
单链模板DNA。
94℃加热,变性
(也叫淬火)
降低反应温度(退火,约50℃),约1分钟,使寡核
苷酸引物与两条单链模板DNA结合在靶DNA区段两端
的互补序列位置上。
50℃~60℃,退火
引物与模板DNA相
结合
将反应混合物的温度上升到72℃左右保温1-数分钟,
在DNA聚合酶的作用下,从引物的3'-端加入脱氧核苷
三磷酸,并沿着模板分子按5'→3'方向延伸,合成新
生DNA互补链。
PCR扩增,72℃左右, 按每
分钟1000个碱基对设计
循环往复
实验中通过对拟南芥基因芯片数据分析, 鉴定出一个
受干旱胁迫诱导的cDNA。干旱、紫外线、脱落酸、
高盐以及水杨酸等胁迫条件处理后表达量均有显著提
高, 特别是干旱处理3h后表达量极显著提高。
多序列比对和系统进化分析发现该基因含有典型的
AP2/EREBP DNA结合结构域,且属于DREB亚家族。
由于其N端富含谷氨酰氨残基, 将它命名为QRAP2
(Glutamine-rich AP2)。
5. 2. 4 实时定量PCR
(real time quantitative PCR,Q-PCR)
由于PCR敏感性高,扩增产物总量变异系数大,定
量不准确。90年代末期出现了Q-PCR,利用荧光检
测PCR仪绘制DNA扩增过程中的累积速率动态变化
图,基本消除在测定终端产物丰度时变异系数较大
的问题。
混合在PCR反应液中的荧光探针只有与大片段DNA
结合后,才能够被激发出荧光。
随着新合成DNA片段的增加,由于结合到DNA上
的荧光探针增加,被激发产生的荧光相应增加。
非序列特异性荧光染料SYBR Green I, 激发光波长
520nm。
SYBR Green I
作探针的实时
定 量 PCR 实 验
过程图示
Ct值是产物荧光强度首次超过设定阈值时,PCR反
应所需的循环数。利用标准曲线,可以确定样品中待
检测靶DNA的绝对含量。
A 扩增曲线
B标准曲线
Log值
荧光强度
循环数
循环数
图5-11用实时定量PCR法分析未知样品靶基因的绝对
量
线性范围的确定
为确保荧光检测的确实是靶DNA,又设计了仅能与
目的DNA特异结合的荧光探针。
TaqMan探针是一段与靶DNA序列中间部位结合的
单链DNA,长50bp-150bp,该DNA的5’和3’端带
有短波长和长波长两个不同荧光基团,由于彼此距
离靠近,在荧光共振能量转移(FRET)作用下发
生荧光淬灭,因而检测不到荧光。
随着PCR反应的进行,TaqMan 探针结合到目的
DNA 序 列 上 , 并 且 会 被 具 有 外 切 酶 活 性 的 Taq
DNA聚合酶逐个切除而降解。切下来的荧光基团解
除了荧光淬灭的束缚,会在激发光下发出荧光,因
此,产生的荧光强度直接反映了所扩增靶DNA的总
量。
TaqMan 探
针实时定
量 PCR 技
术
表5-3 实时定量PCR相对定量实验的数据处理*
Wus Ct值
平均值(Avg)
野生型拟南芥
(WT)
突变体拟南芥(Mu)
31.49
21.78
30.87
21.95
31.34
22.04
31.23+0.32
21.92+0.13
△Ct(AvgCt WT-AvgCtMu)
9.31+0.19
相对比值
(1.8△Ct)
239+26.25
*拟南芥野生型和突变体样品经由拟南芥持家基因(UBQ10)进
行均一化处理。
5. 2. 5 重亚硫酸盐测序技术(Bisulfite Sequencing)
DNA分子上可能发生多种化学修饰,如甲基化、乙
酰化等。在不改变DNA序列的情况下,通过对DNA
分子的化学修饰,可以改变基因表达水平。相对于
传统的遗传学——即只有DNA序列变化才能导致基
因表达的改变——而言,这种现象被称为表观遗传
学(Epigenetics)。
主要实验过程:
• 将待测DNA样品用限制性内切酶处理或超声波破碎
等物理方法打断成500~1000 bp的碎片,
• 重亚硫酸盐处理使DNA中未甲基化的胞嘧啶脱氨基
变成尿嘧啶,PCR扩增后被测序仪读为胸腺嘧啶。
• 已甲基化的胞嘧啶由于甲基的保护而不受影响。
• 参考原始序列判定原C位点是否甲基化——未甲基
化的C位点变为T,甲基化的C位点仍保持为C。
重亚硫酸盐
测序
(bisulfite
sequencing)
• 因为没有甲基保护的C在重亚硫酸盐处理后转变为
U,引物设计时要将该位点相应改为T。
• 由于DNA上的C位点通常不是百分之百甲基化或非
甲基化,所以合成引物时要用简并位点,正向引物
中为Y (Y=C或T),反向引物中记做R (R=G或A)。
• 重亚硫酸盐测序分析时,必须对同一目标片段进行
多次测序,通常要求至少测序11次,以避免产生同
源测序(sibling sequencing)。
5. 2. 6 基因组DNA文库构建
把某种生物的基因组DNA切成适当大小,分别与载
体组合,导入微生物细胞,形成克隆。汇集包含基
因组中所有DNA序列的克隆(理论上每个序列至少
有一个代表),这样的克隆片段的总汇,称为基因
组DNA文库。
可用Clark和Carbon公式预测一个完整基因组文库应包
含的克隆数目:
N=ln(1-p) / ln(1-f)
N表示一个基因组文库所应该包含的重组克隆数目
p 表示所期望的靶基因在文库中出现的概率
f表示重组克隆平均插入长度与基因组DNA总长之比。
以人为例,其基因组大小为3×109 bp,若要求p = 99%,
平均插入片段大小为20 kb,则N = 6.9×105。
构建基因组文库最常用的是λ噬菌体载体(克隆能力
约15—20kb)和限制性内切酶部分消化法。例如用
识 别 4 个 核 苷 酸 的 核 酸 限 制 性 内 切 酶 Sau3A , 与
BamHI是一对同尾酶消化DNA,由Sau3A酶切产生
的DNA片段可插入到经BamHI消化的λ噬菌体载体上。
图5-13 用Sau3A限制性核酸内切酶消化真核
生物基因组DNA并利用噬菌体载体构建基因
组文库的过程图示。
λ噬菌体作为克隆载
体的体外包装过程
此外,还有很多大容量克隆载体,如柯斯质粒、细菌
人工染色体(BAC)、P1源人工染色体(PAC)、
酵母人工染色体(YAC)等都可用于基因组文库的构
建。
它们的优点是可以插入更大片段DNA,但是稳定性
一般较差,在大量复制的过程中容易出现缺失现象。
操作也相对较困难。
5. 3 RNA基本操作技术
真核生物基因组DNA庞大,有大量重复序列,很难直
接 分 离 得 到 靶 基 因 片 段 。 而 cDNA 来 自 反 转 录 的
mRNA,无冗余序列,通过筛选cDNA文库,可较快
地分离到相关基因。
细胞中的总RNA包括mRNA,rRNA ,tRNA以及一些
小RNA(sRNA)。
一个典型的动物细胞约含10-5μg RNA,其中:
•80%-85%为rRNA
•15%-20%为tRNA及sRNA
•mRNA约占总RNA 的1%-5%
rRNA分子具有确定的大小和核苷酸序列,特
别是28S和18S特征性条带是电泳鉴定总RNA
纯度和完整性的重要参数。
图5-14
PolyATtract
mRNA的分离纯
化过程简图。
RNA的浓度和纯度可以通过测定其OD260和OD280 来
判 断 。 OD260 为 1 时 相 当 于 浓 度 为 40μg/ml , 而
OD260/OD280 的比值如果在1.8-2.0之间,表示所提取
的RNA纯度较好,如果样品中有蛋白质或酚污染,则
OD260/ OD280的比值将明显低于1.8。
由于RNA分子敏感脆弱,在自然状态下难以被扩增,
为了研究mRNA所包含的功能基因信息,一般将其反
转录成稳定的DNA双螺旋(cDNA,complementary
DNA),再插入到可以自我复制的载体中。
图5-15 cDNA合
成过程示意图。
图5-16 定向cDNA 合成及分子修饰
因为绝大多数大肠杆菌细胞都会切除带有5'-甲基胞
嘧啶的外源DNA,所以实验中常选用mcrA- mcrB菌株以防止cDNA被降解。
cDNA文库的构建
cDNA的长度一般在0.5-8 kb之间,质粒载体和噬菌体
类载体都能满足要求。
cDNA文库常用Uni-zap XR(一种λ噬菌粒载体)做载
体,它具备噬菌体的高效性和质粒载体系统利用蓝白斑
筛选的便利,可容纳0-10 kb DNA插入片段,含有
pBluescript载体的全部序列。
重组后可通过体内剪切反应(In Vivo Excision)将
cDNA插入片段转移到质粒系统中进行筛选、克隆和序
列分析。
基因文库的筛选
基因文库的筛选是指通过某种特殊方法从基因文库
中鉴定出含有所需重组DNA分子的特定克隆的过
程。筛选的方法有很多种,如核酸杂交法,PCR
筛选法和免疫筛选法等。
核酸杂交法:
核酸杂交法以其广泛的适用性和快速性成为基因
文库筛选中最常用的一种方法,用放射性标记的特异
DNA探针适用于高密度的菌落杂交筛选。
将待筛选菌落转移到硝酸纤维素膜上,适当温育。
同时保留原来的菌落平板作对照。
图 5-17 通过核酸杂交筛选目的克隆流程图
取出已经长有菌落的膜,用碱液处理,使菌落发生
裂解,DNA随之变性。用蛋白酶K处理硝酸纤维素
膜去除蛋白质,形成菌落DNA的印迹。
80℃烘烤滤膜,将DNA固定在膜上。将滤膜与放
射性标记的DNA或RNA探针杂交,通过放射性自
显影显示杂交结果。通过对应于平板上的位置找到
相应克隆。
PCR筛选法
将整个文库(以质粒的形式或者细菌的形式均可)保
存在多孔培养板上,用设计好的目的基因探针对每个
孔进行PCR筛选,鉴定出阳性的孔,把每个阳性孔
中的克隆再稀释到次级多孔板中进行PCR筛选。重
复以上程序,直到鉴定出与目的基因对应的单个克隆
为止。
免疫筛选法
该法仅适用于对表达文库的筛选。若实验中靶基
因的序列完全未知但是有针对该基因产物的特异性抗
体,就可以采用免疫筛选法。
图5-18 噬菌体表
达文库的免疫化
学筛选法示意图
5. 4 基因克隆(clone)技术
在多细胞的高等生物个体水平上,克隆表示由具有相
同基因型的同一物种的两个或数个个体组成的群体。
从 同 一 受 精 卵 分 裂 而 来 的 单 卵 双 生 子
(monozygotic twins)便是属于同一克隆。
在细胞水平上,克隆一词是指由同一个祖细胞
(progenitor cell)分裂而来的一群带有完全相同
遗传物质的子细胞。
在分子生物学上,人们把将外源DNA插入具有复制
能力的载体DNA中,使之得以永久保存和复制这种
过程称为克隆。
5. 4 RACE技术
Rapid amplification of cDNA ends
• 在已知cDNA序列基础上克隆5’或3’端缺失序列
的技术。根据已知序列设计基因片段内部特异引
物,由该片段向外侧进行PCR扩增得到目的序列。
• 用于扩增5’端的方法称为5’RACE,用于扩增3’
端的称为3’RACE。
5’ RACE
• 在反转录酶的作用下,以基因片段内部特异性引物
(GSP1)启始cDNA第一条链合成。
• RNase降解模板链mRNA,纯化第一链。
• 用末端转移酶在cDNA链3’端加入连续的dCTP。
• 以连有oligo(dG) 的锚定引物和基因片段内部特异的
nested引物进行PCR扩增,得到目的片段,用nest
PCR检测。
3’RACE
1、用oligo(dT)锚定
引物启始 cDNA第一
链的合成.
2、降解模板mRNA.
3、用通用锚定引物
UAP和基因片段内部
特异引物进行PCR扩
增得到目的3’片段,
用nest PCR法检测.
除了获得全长cDNA之外,RACE技术还被用于获得5’
和3’端非转录序列,研究转录起始位点的不均一性,
研究启动子区的保守性等。
5. 4. 2 cDNA差示分析法 (RDA, Representation
Difference Analysis)
通过降低cDNA群体复杂性和更换cDNA两端接头等
方法,特异性扩增目的基因片段。
4碱基切割酶处理Tester和Driver,形成平均为256
bp的代表群,保留了绝大部分遗传信息。
每次T减D反应后仅设置72℃复性与延伸,94℃变性
这两个参数共20个PCR循环,PCR产物的特异性和
所得探针的纯度高。
5. 4. 3 Gateway大规模克隆技术
Gateway技术利用λ噬菌体进行位点特异性DNA片段
重组,实现了不需要传统的酶切联接过程的基因快速
克隆和载体间平行转移。
Gateway
大规模克
隆策略
TOPO反应:
将目的基因PCR产物连入Entry载体。载体上的
CCCTT被拓扑异构酶所识别,通过与切口处的磷
酸基团形成共价键,将该酶偶联在载体上。
5’GTGG粘性末端攻击PCR产物的互补性末端并与
接头序列CACC退火,使PCR产物以正确方向连入
Entry载体。
LR反应:
将目的片段从Entry 载体中重组入表达载体。Entry载
体上基因两端具有attL1和attL2位点,目的载体上含
有attR1和attR2位点,在重组蛋白的作用下发生定向
重组,形成新的位点attB1和attB2,将目的基因转移
到表达载体中。
Get cDNA
TOPO
Get Entry Vector
LR
Get Expression Vector
120 AP2/EREBP genes were cloned
5. 4. 4 基因的图位克隆法 (Map-based cloning)
所有具有某种表现型的基因都可以通过该方法克
隆得到。
通过构建遗传连锁图,将目的基因定位到某个染
色体的特定位点,并在其两侧确定紧密连锁的
RFLP或RAPD分子标记。
通过对不同的生态型及限制性内切酶和杂交探针的分
析,找出与目的基因距离最近的分子标记,通过染色
体步移法将位于这两个标记之间的基因片段克隆并分
离出来,根据基因功能互作原理鉴定目的基因。
图5-26 染色体步移法克隆基因示意图
在RFLP作图中,连锁距离是根据重组率来计算的,
1cM(厘摩)相当于1%的重组率。人类基因组中,
1cM≈1000kb;拟南芥菜中,1cM≈290kb;小麦中,
1cM≈3500kb。
用图位克
隆法获得
水稻脆杆
基因BCL
A. 将BCL定位于水稻3号染色体(Chr3)分子标
记C524a和RM16之间;
B. 覆盖BCL位点的BAC大片段。
C. BCL位点的精细定位。BCL位点被定位于分子
标记P2和P4之间与P3共分离。
D. BCL基因结构。红色为编码区,白色为5’和3’
非翻译区,黑色线段为内含子。bcl-1和bcl-2
表示两个突变位点。
5. 4. 5 热不对称交错多聚酶链式反应克隆T-DNA插入
位点侧翼序列
TAIL-PCR:Thermal Asymmetric Inter-Laced PCR
常规PCR技术能扩增两引物之间的DNA区段,然而,
有时我们也希望扩增位于靶DNA区段之外的未知DNA
序列,这就需要应用反向PCR(reverse PCR)技术。
• 用一种在靶序列上没有酶切位点的核酸限制性内
切酶消化DNA;
• 产生大小不同的线性DNA片段群体,其中靶DNA
区段的DNA分子长度不超过2~3kb,经连接后重新
环化;
• 按靶序列设计的一对引物与互补序列退火结合,
其延伸方向如箭头所指。
反 向 PCR 的 基 本 操 作 程
序 。 波 纹 线 表 示 靶 DNA
区段,箭头表示限制性内
切酶位点,分别用方框表
示 靶 DNA 区 段 的 左 侧 和
右侧序列。
实验中常用热不对称交错多聚酶链式反应(TAILPCR:Thermal Asymmetric Inter-Laced PCR)扩
增T-DNA插入位点侧翼序列,获得转基因植物插入位
点特异性分子证据。
TAIL-PCR使用一套巢式(nested)特异引物(TDNA边界引物,TR)和一个短的随机简并引物
(AD)。
第一轮反应(Primary reaction)是TAIL-PCR的重
要环节,先进行5轮高严谨性循环,特异性引物与模
板退火,只能发生单引物循环,T-DNA上游侧翼序列
得到线性扩增。
大幅度降低退火温度,使AD及TR均与模板DNA相结
合,指数扩增一个循环。
此后,两个高严谨、一个低严谨循环交替进行
(PCRII),共15个循环。特异性序列(两端分别拥
有TR1和AD序列)和非特异性序列I(只有TR1,没
有AD序列)大大超过非特异性序列II (两端均为AD
序列)。
PCRII中,特异性序列再次被优先扩增,经稀释的非
特异性序列I也已大为降低,此时已没有明显的背景
片段了。
PCRIII是真正意义上的PCR,共20个循环,进一步
扩增特异性序列。
5. 5 蛋白质与蛋白质组学技术
蛋 白 质 组 学 是 蛋 白 质 ( protein ) 和 基 因 组
(genome)研究在形式和内容两方面的结合,该
技术致力于研究某一物种、个体、器官、组织或细
胞在特定条件、特定时间所表达的全部蛋白质图谱。
蛋白质组与基因组既相互对应又有显著不同,基因
组是确定的,每个个体只有一个基因组,而基因的
表达调控水平(蛋白组)却会发生显著的变化。
5. 5. 1 双向电泳技术
Two-Dimensional Electrophoresis,2-D
等电聚焦(Isoelectric focusing,IEF)及SDS聚丙烯酰胺凝胶(SDS-PAGE)双向电泳技术。
蛋白质是两性分子,在不同pH缓冲液中表现出不
同的带电性,因此,在两性电解质电泳体系中,不
同等电点的蛋白质会聚集在介质上不同的区域(等
电点)从而被分离。
蛋白质的分子量决定了SDS-蛋白复合物在凝胶电
泳中的迁移率,因为聚丙烯酰胺凝胶中的SDS带有
大量的负电荷,与之相比,蛋白质所带电荷量可忽
略不计。因此,蛋白质在SDS凝胶电场中的运动速
度和距离完全取决于其分子量。
2D-E map of protein from Arabidopsis
seeds 30h after germination
Quantitative analysis of cp29A and cp29B from
seeds at 0-96 h after germination
5. 5. 2 荧光差异显示双向电泳技术
早期的蛋白质组学研究内容主要是蛋白质组的表
达模式,即利用常规2-DE技术鉴定并建立某一生物体
在特定时期的全部蛋白表达谱。
然而, 蛋白质组在不同生命进程中是动态变化的,
不同生物的个体、组织或细胞在不同发育时期,分化
阶段,以及不同的生理,病理条件下基因表达是不一
致的,所对应的蛋白质组具有特异性。
比较蛋白质组学(comparative proteomics)应运
而生,成为后基因组学时代重要学科。
Cy2 Labeled
IS
Cy3 Labeled
fl
Cy5 Labeled
WT
5. 5. 3 蛋白质质谱分析技术
现行质谱仪主要有三个连续的组成部分,即离子源,
离子分离区和检测器。
较常用的有基质辅助的激光解析电离-飞行时间质谱
(Matrix-Assisted Laser Desorption Ionization
Time-Of-Flight spectrometry,MALDI-TOF)和
电喷雾质谱(Electrospray ionization,ESI-MS)。
MALDI-TOF的工作原理:将蛋白质酶解成小肽段后
与基质(主要是有机酸)混合,将样品混合物点到
金属靶表面上并使之干燥结晶,然后用激光轰击,
将呈离子化气体状态的待分析物从靶表面喷射出去。
离子化气体肽段在电场中被加速后到达检测器的时
间由肽段的质量和其所带电荷数的比值(m/z)决定。
图5-31 MALDI–TOF分子质谱仪原理图
将感兴趣的蛋白点回收后,进行胰蛋白酶胶内酶解,
收集酶解肽段。一级质谱将经蛋白酶降解后的肽段按
照质荷比(m/z)及强度(intensity)进行解析,形
成肽指纹图谱(PMF),每个母离子峰代表一种肽
段,其强度代表了肽段多少。
二级质谱是挑选一级质谱中有代表性的母离子峰以诱
导碰撞解离(collision-induced dissociation,CID)
方式打碎,形成肽段碎片指纹图谱(PFF)。然后,
结合一级PMF和二级PFF数据,进行数据库搜索,
获得蛋白质的具体鉴定信息。