Transcript 第九章群体遗传学
第九章 群体遗传学 (population genetics) 案例 一对外表正常的新婚夫妇,新郎是上海人,新娘是 美国马萨诸塞州人,双方均无遗传病家族史,他们看到邻居家 一对非近亲结婚的健康夫妇生了个苯丙酮尿症(PKU)患儿, 很担忧将来自己的孩子也遭此厄运,因此前来进行遗传咨询。 1、这对夫妇有可能生出PKU的患儿吗?如果有可能,其 风险与哪些因素有关,如何计算? 2、PKU致病基因的突变率是多少? 3、现在对PKU患者的有效治疗,是否会增加群体中致病 基因的频率? 群体 (population )孟德尔式群体 (Mendelian population ) 指生活在某一地区的、能够相互交配并能产生具有生殖能力后代 的个体群。 群体遗传学 (population genetics)研究群体的遗传结构及其变化规律 的科学,主要是应用数学的思维和方法研究和探讨群体的基因频率、基因型频率及其 和某些因素的关系。 医学群体遗传学 (medical population genetics) 基因库 (gene pool)一个群体所具有的全部遗传信息 第一节 群体中的遗传平衡 一、基因频率和基因型频率 基因频率(gene frequency): 某一基因的数量/所有等位 基因数量 (例如) 基因型频率(genotype frequency): 某一基因型个体数/总个 体数 MN血型——共显性遗传,基因定位——4q 基因型 表型 个体数 M / M 747× 0.312=233 M / N 747× 0.515 =385 N / N 747 ×0.173 =129 总计 747 M血型 MN血型 N血型 一对等位基因决定一个表型性状 公式:p =D +1/2H M基因的频率: p =(233 ×2+385)/(747×2) =R +1/2H q MN血型——共显性遗传,基因定位——4q 基因型 表型 个体数 M / M 747× 0.312=233 M / N 747× 0.515 =385 N / N 747 ×0.173 =129 总计 747 M血型 MN血型 N血型 一对等位基因决定一个表型性状 M基因的频率: p =(233 ×2+385)/(747×2) 二、遗传平衡定律 (law of genetic equilibrium,1908) Hardy-Weinberg定律:在一定条件下,群体中的基因频 率和基因型频率在世代传递中保持代代不变。 条件:1、群体很大;2、随机婚配;3、没有突变发生; 4、没有选择;5、无大规模的个体迁移。 遗传平衡公式:假设一对等位基因A和 a,基因A的频率为p, 基因a的频率为q, p + q =1,( p + q )2=1, p 2+2pq +q 2=1 在一个遗传平衡的群体里: p 2——AA; q 2——aa;2pq——Aa 即 AA:Aa:aa = p 2:2pq :q 2 • • • • • • • • 假设有一个100万人口的群体,某一对等 位基因A 和a,AA个体有60万人,Aa个体20万人,aa个体也有20 万人。 基因型AA、Aa和aa的频率: D =60/100=0.6 H =20/100=0.2 R =20/100=0.2 群体基因A和a的基因频率: p =D +1/2H =0.6+0.2/2=0.7 q =R +1/2H =0.2+0.2/2=0.3 亲本精卵随机结合子一代基因型及其频 率 精 A p=0.7 子 a q=0.3 卵 A p=0.7 AA p2=0.49 Aa pq =0.21 子 a q=0.3 Aa pq =0.21 aa q2 =0.09 • 子一代基因A的频率 p = D +1/2H =0.49+1/2(0.21+0.21) =0.7 q =R +1/2H =0.09+1/2(0.21+0.21) =0.3 子一代精卵随机结合子二代基因型及其频率 精 A p=0.7 子 a q=0.3 卵 A p=0.7 AA p2=0.49 Aa pq =0.21 子 a q=0.3 Aa pq =0.21 aa q2 =0.09 三、遗传平衡定律的应用 (一)遗传平衡群体的判定 例题:在一个群体中,AA的频率为0.36, Aa的频率为0.48, aa的频率为0.16,判定此群体是否是遗传平衡群体。 A基因频率: p =D+1/2H=0.36 +0.48/2 =0.6 a基因频率: q =R+1/2H=1-0.6 =0.4 根据遗传平衡公式推算理论值: AA的频率 p 2=0.6 2=0.36 Aa的频率 2pq =2 ×0.6 ×0.4=0.48 aa的频率 q2=0.42=0.16 基因型频率的实际值和平衡状态时的理论值完全一样。 结论:该群体是遗传平衡群体。 (二)基因频率的计算 1、AR病基因频率的计算 隐性致病基因纯合体(aa)发病,发病率( aa基因型 频率)等于q2 。 例题:在我国人群中,白化病(AR)的群体发病率 1/20000,求致病基因和正常基因的频率以及 各 种基因型的频率。 aa q2=1/20000 q= 1/20000 =0.007 A p=1-q=1-0.007=0.993 AA p2=0.9932=0.986 因此Aa p2 :2pq :q 2=0.986 :1/70 ≈ :1/20000 2pq=2×0.993 ×0.007 0.014=1/70 =20000 : 286 : 1 表明AR遗传中,致病基因多以杂合子携带者的方式存在 2、 AD病基因频率的计算 理论上, AA 和Aa——患者,群体发病率=p 2+2pq 实际上,群体中AD病多为杂合子Aa发病。 原因:正常基因a 突变基因A是小概率事件,同样 等位基因位点上同时发生突变形成AA的情况很少。 AA个体病情更加严重,不容易存活。 在AD遗传中发病率就是指杂合子Aa的频率。 设AD病发病率为H,由于致病基因的频率p很小,q接近1, 所以: H = 2pq ≈ 2p p =(1/2) H 例题:丹麦某地区软骨发育不全性侏儒发病率为1/10000,求 基因频率。 致病基因A的频率 p =(1/2)H = (1/2) ✕1/10000 =0.0005 3、X连锁基因的频率 男性——半合子,其基因频率,基因型频率或表型频率相同。 遗传平衡群体中X连锁基因的基因型及其频率 性别 发病率 男性 0.93 基因型 XA Y 表现型 基因型频率 正常 Xa Y p 色盲 q 0.07 女性 XA XA (0.93) 2=0.865 正常 p 2 第二节 影响群体遗传平衡的因素 一、突变及突变间的平衡 (一)突变 突变率(mutation rate)—— n ✕10-6/基因/代 (二)突变间的平衡 正向突变(forward mutation) pu A a 若 a 回复突变(reverse mutation) pu > qv 则 A ↴ ↱ 若 pu < qv 则 A ↱ qv pu =qv ,将维持动态遗传平衡。 q = u / ( v + u ) • 同理: p = v / ( v + u ) 若 • 在突变存在的情况下,基因频率由等位基因突变率u和v的差 异所决定,群体平衡是由等位基因的双向突变来维持。 中性突变(neutral mutation)——无害、无益,选择无作用 例题:人类对苯硫脲(PTC)的尝味能力决定于5q15的等位 基因T和t。我国汉族人群中对PTC失去尝味能力的味盲(t t) 的频率为9%,如果u = 0.9 ×10-6 /代, v =2.1 ×10-6 /代, 该群 体是否处于遗传平衡状态。 q = u / ( v + u ) =0.9/(2.1 +0.9) =0.3 二、选择及选择与突变间的平衡 (一)选择(selection)是指由于基因型的差别而导致 生存能力和生育能力的差别。 1、适合度(fitness,f)是指一定环境条件下,某种基 因型个体能够生存并能将其基因传给后代的能力。 相对生育率(relative fertility) 例题:有人在丹麦进行调查,108名软骨发育不全性侏儒 共生育了27个孩子,这些患者457个正常同胞共生育了 582个孩子,求软骨发育不全性侏儒的适合度 f 。 f =(27/108)/(582/457) =0.2 2、选择系数(selection coefficient,S)指在选择的 作用下降低了的适合度。 S =1 - f (二)选择与突变间的平衡 选择压力 突变压力 (selection pressure) (mutation pressure) 群体 遗传结构 1、选择对常染色体显性基因的作用—— AA, Aa 选择只对表现出致病基因有害性状的个体起作用。 设每一代被淘汰的基因为 ∆p ∆p =S p 发病率—— H, 则 H=2pq p=(1/2 )H ∆p = (1/2 )S H S =1 时, ∆p =p ,f =0 ,A基因一代后全部消失。 0< S< 1时, v= ∆p = (1/2 )S H 例题:在丹麦的某医院中,几年来所生94075名婴儿中有10 个是软骨发育不全性侏儒患者,已知本病的适 合度 f =0.2,求软骨发育不全性侏儒基因的突变率。 S =1-f =1-0.2 =0.8 H =10/94075 =0.0001063 v = (1/2 )S H =0.5× 0.8× 0.0001063 =42.5 ×10-6/代 2、选择对常染色体隐性基因的作用 —— aa Aa —— 表型正常,不受选择的作用。 u = Sq2 例题:苯丙酮尿症在我国人群中的发病率为1/16500,本病的 适合度为0.3,求苯丙酮尿症致病基因的突变率。 S=1-f =1-0.3 = 0.7 q2=1/16500= 0.00006 u = Sq2 =0.7 ×0.00006 3、选择对X连锁隐性基因的作用 —— XaXa ,XaY 男性——半合子, XaY,被选择, 发病率为 q 1条X染色体,占群体的1/3。 女性——XaXa ,数量少忽略不计; XAXa 不被选择 2 条X染色体。 u =(1/3)Sq 例题:甲型血友病在男性中的发病率为0.00008,适合度 为0.29,求甲型血友病的基因突变率。 S =1-f =1-0.29 =0.71 u =(1/3)Sq =(1/3) ×0.71 ×0.00008 =19 ×10-6/ 代 (三)选择压力的变化对遗传平衡的影响 1、选择压力的增强 一代 AD病 0 Aa f =0 , S =1 p v ——p 迅速降低 AR病 aa f =0 , S =1 Aa 不被选择 降低缓慢 隐性致病基因频率降低的速度公式: N=1/ qn– 1/q q 2 =0 例题:白化病基因在群体中的频率为0.01,如果选择压 力增强,使所有白化病患者均不生育,要经过多少世代 才能使白化病基因频率降低一半? q =0.01 =1/100 qn =(1/2) (1/100) =1/200 N=1/ qn– 1/q =1/(1/200) – 1/(1/100) =200-100 =100(代) 一世代为25年, 要经过2500年才能使白化病基因频率 降低一半。 2、选择压力的放松 一代后 假设由 f =1,S =0 AD病: S =1 ,f =0 致病基因 p变为0, 维持 v =S p =p 每代都增加v这么多 p1 = p +v =2p 发病率: 2 p1 q=4pq (增加一倍) AR病: f =1,S =0 时,每代增加u,发病率上升缓慢。 例题:某种AR病的群体发病率为1/10000,突变率为 50 ×10-6/代,适合度为0。假如经过治疗患者能和正常人一 样生育,那么经过多少代的选择放松,致病基因频率才能增 加1倍? q2=1/10000 q =1/100 =0.01, f =1, S =0 0.01 + 50 ×10-6 ×N =0.01 ×2 N =(0.02-0.01)/(50 ×10-6 ) =200 (代) 经过200代,5000年的选择放松,致病基因频率才能 增加1倍。 三、随机遗传漂变(random genetic drift)在一个小群体中, 由于所生育的子女较少,可能会使基因频率产生相当大的随机波动,称 为随机遗传漂变 ,简称遗传漂变。 • 遗传漂变是影响小群体遗传结构的重要因素。 • 群体越小,基因频率遗传漂变幅度越大,可能使某一等基因固定而另一 等基因消失;群体越大,基因频率遗传漂变幅度也就越小,甚至能接近 平衡状态。 四、隔离(isolation)由于自然条件或宗教、民族风俗习惯等因素 所形成的隔离使该群体与其他人群无基因交流,使纯合子的比例增加, 产生类似于近亲婚配的遗传效应。 建立者效应(founder effect) 五、迁移(migration)基因流(gene flow) 迁移压力(migration pressure)又称基因流(genef4ow) 指具有某一基因频率群体的一部分个体因某种原因迁入与其基因频率不 同的另一群体中,并杂交定居,从而改变了迁入群体的基因频率,这种 影响称为迁移压力 宁夏 回族 20% 汉族 9% 六、近亲婚配 近亲:3 —— 4代内有共同祖先。 (一)近婚系数(inbreeding coefficient,F) 1、近婚系数的概念 是指近婚婚配后,其子女从婚配双方得到祖先同一 等位 基因的概率。 2、近婚系数的计算 (1)常染色体基因的近婚系数 同胞兄妹 的近婚系数 A1A2 A3A4 P1 P2 B1 B2 S A1A! A3A3 近婚系数 A2A2 F =4×(1/2)4 A4A4 =1/4 同胞兄妹婚配基因传递 二级亲属 的近婚系数 A1A2 A3A4 P2 P1 B2 B1 C S A1A! A3A3 A2A2 A 4A 4 近婚系数 F =4×(1/2)5 =1/8 舅甥女(姑侄、叔侄女、姨外甥)婚配基因传递 三级亲属 的近婚系数 A1A2 A3A4 P1 P2 B1 B2 C1 C2 S A1A! A3A3 A2A2 A4A4 表兄妹婚配基因传递 近婚系数 F =4×(1/2)6 =1/16 A1A2 五级亲属 的近亲系数 A3A4 P1 P2 B1 B2 C1 C2 SC1 SC2 近婚系数 F =4×(1/2)8 =1/64 A1A! A2A2 A3A3 A4A4 从表兄妹婚配基因传递 A1A2 P B2 B1 S A1A! 近婚系数 F =4×(1/2)4 =1/4 A 2A 2 半同胞兄妹婚配基因传递 (2) X连锁基因的近婚系数 特点: ➀ 女性有两条X染色体,可以 形成纯合子;男性是半合子,只有 一条X染色体,不能形成纯合子; 只能计算女儿的F值。 ➁ 计算X连锁基因纯合子形 成 的传递步数时,当男 女 时, 不记入一次“1/2”的传递步数;当 男 男时,传递中断,无 法形 成纯合体。 XX XY XX 女儿 XY 儿子 X1Y X连锁基因 的近婚系数 X2X3 P1 P2 B1 B2 C1 近婚系数 F =(1/2)3+(1/2)5 =3/16 C2 S X1X! X2X2 X3X3 姨表兄妹婚配X连锁基因的传递 X1Y X2X3 P1 P2 B1 B2 C1 近婚系数 F =0+2×(1/2)4 =1/8 C2 S X1X! X2X2 X3X3 舅表兄妹婚配X连锁基因的传递 X1Y X2X3 P1 P2 B1 B2 C1 近婚系数 F =0 C 2 S X1X! X2X2 X3X3 姑表兄妹婚配X连锁基因的传递 X1Y X2X3 P1 P2 B1 B2 C1 近婚系数 F =0 C2 S X1X! X2X2 X3X3 堂兄妹婚配X连锁基因的传递 三级亲属的近婚系数 • 常染色体基因 X连锁基因 1/16 3/16 1/16 1/8 1/16 0 1/16 姨表兄妹 舅表兄妹 姑表兄妹 堂兄妹 (二)平均近婚系数(average inbreeding coefficient,a) a =∑ (Mi Fi/N) Mi —— 某种类型的近亲婚配数。 Fi —— 相应近亲婚配的近婚系数。 N —— 群体中婚配总数。 例题:在某人群中,有1000例婚配对数,其中有1例是半同胞胎 兄妹配偶,有23例是表兄妹配偶,还有30例是从表 兄妹 配偶,其余是随机婚配,求该群体的平均近亲系数a? M半=1, F半 =1/8; M表=23, F表 =1/16; M从=30, F从 =1/64;N =1000 a =1×1/8×1/1000+23×1/16×1/1000+30×1/64×1/1000 =0.002 a> 0.01时,危害严重。 第三节 遗传负荷 遗传负荷(genetic load)—— 有害基因的数量。指在一个群体 中由于致死或有害基因的存在而使群体适合度降低的现象,一 般用群体中平均每个个体携带的有害基因的数量来表示。 一、遗传负荷的来源 (一)突变负荷(mutation load)指基因突变产生有害或致死基 因,使群体适合度下降而给群体带来的负荷。 AD, 显性半致死突变(semilethal mutation) AR,Aa——传递多代;aa——选择不利 (二)分离负荷(segregation load)指适合度较高的杂合子由 于基因分离而产生适合度较低的显性纯合子(AA)与隐性纯合子 (aa),从而降低群体适合度的现象。 AA Aa ✕ Aa aa 二、遗传负荷的估计 (一)携带者理论数据估计法 (二)抽样调查和理论抽样估计法 (三)一级亲属婚配后代发病调查估计法 本章重点