基因组水平的选择信号及其检测方法研究进展

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第40卷第5期2019年5月

家畜生态学报Vol.40No.5 Acta Ecologiae Animalis Domastici May2019

o学科动态氥

因组水平的选择信号及其检测方法研究进展

王宇占,赵毅强

(中国农业大学生物学院,北京100193)

[摘要]在进化过程中,自然或人工选择在基因组上留下了各种选择信号的印迹。探究不同物种或同一物种不同种群之间的选择信号有助于我们研究物种的进化历史,筛选优势等位基因并应用于遗传育种之中。本文详细介绍了各种经典的选择信号检测方法及其适用场景,并讨论了各自的优缺r和未来的发展方向。

[关键词]选择信号;单核{酸多态性;生物进化

[中图分类号]S811.5[文献标识码]A[文章编号]1005-5228(2019)05-0001-06 doi:10.3969/j.issn.1673-1182.2019.05.001

19世纪中叶,英国生物学家达尔文提出了生物进化论学说,认为选择可以改变个体之间的适应性和繁殖力匚1〕,十年后,孟德尔发现了遗传定律,随后摩尔根揭示了染色体的遗传机制,20世纪中叶,沃森和克里克发现了DNA双螺旋结构。基于达尔文等人的进化学、遗传定律等学说,科学家结合数理统计等数学知识提出了现代综合进化论,认为自然选择的作用单位是群体,强调渐进式的进化。

化物化中了、物体自然选择,强烈的人工选择。随着二代测序技术的成熟和快速发展,累积了越来越多的测序数据,可大范围检测基因组上留下的选择印记,这些印记称为选择信号(sig­nature of selection)[2]。通过分析基因组上的选择信号了解种群的进化历史,并对研究生物进化以及遗传育种等问题提供帮助。比如检测选择信号可以帮助我们确定基因组上哪些优势等位基因受到了选择的青睐,哪些在进化过程中被逐渐淘汰,一些研究选择信号知名的例子如人类不同族群的乳糖耐受性变化3、水稻稻芒的选择等⑷。

1选择作用于DNA变异

在DNA序列水平上可检测到的遗传变异主要包括染色体结构变异(structural variants,SVs)、小片段序列的插入缺失(indel)和单核@酸多态(sin­gle nucleotide polymorphism,SNP)[5]。单核@酸多态主要指基因组在单个核昔酸水平上的变异。相比于染色体结构变异,单核@酸多态性在基因组上数量更多,分布更广泛,且易于进行分型,目前分析大多基于单核@酸多态

选择主要包括正选择,负选择,平衡选择几个类型。正选择(positive selection)指适应性高的等位基因受到选择,频率增大[7\负选择(negative se­lection)又称纯化选择,是指突变的等位基因适应性较低,在选择中处于劣势,因此该等位基因在群体中会被淘汰8。平衡选择(balanced selection)是指杂合子相比于纯合子具有更高的适应性,选择压力有助于维持等位基因在群体中的平衡⑼。

研究结果表明,大部分的新发突变是有害的,只有很少一部分是有益的。有害的突变经自然或人工选择下其频率逐渐在群体中降低直到消失,有益的突变频率则会在群体中上升,甚至达到固定。由于 突变位点与周围的位点存在连锁不平衡(linkage disequilibrium,LD),位点被选择后该位点周围多态性下降,这种现象称为选择性清除(selection sweep)10〕。

由于正选择是生物适应性进化的主要机制,且往往在基因组上留下明显的选择信号,目前大多数研究都集中在寻找正选择信号上。故本文主要介绍正选择信号的检测方法。

[收稿日期]2018-07-19修改日期;2019-01-08

[基金项目]国家自然科学基金(U1704233)

[作者简介]王宇占(1994—),男,山西长治人,硕士,主要从事生物信息学研究。E-mail:yuzhanwang@

头[通讯作者]赵毅强(1980—),男,湖南常德人,副教授,博士生导师,主要从事生物信息学研究。E-mail:yiqiangz@

2家畜生态学报第40卷

2正选择信号的检测方法

目前检验正选择信号的方法,大部分通过比较观测到的基因组特征与中性模型下的特征的差异来做出结论。如果差异显著则排除中性,认为可能受到了选择。经典的检测方法可以分为如下几类:2. 1物种间的比较方法

HKA(Hudson-Kreitman Aguade test)检验由Hudson等人于1987年提出,认为在中性进化模型下种内多态性(polymorphism)和种间分歧度(di­vergence)成正相关关系。如果在进化过程中有自然选择发生,则会发生种内多态性小于种间分歧度的情况。HKA检验的应用有许多前提条件,需要比较两个基因(一个为参考基因,另一个为待检验的是否受选择的基因),且至少需要两个群体,并要求几个不同的等位基因需是独立的即不存在连锁关系。HKA检验的统计量构建如下:

—YL-“(SA—宜(SA))2|YL-1)(sf—E(sf))2

V ar(S A)十V ar(S f)十

Y L-1)(D—E(D i))2“、V ar(D)⑴

式中:S A表示A物种的第i个基因座位的多态性位点数目,S f表示B物种的第i个基因座位的多态性位点数目,D表示A、B两物种在第i个基因座位的多态性位点数目。HKA检验本质上是对种内多态性和种间分歧度的卡方检验。

Hudson等利用HKA检验对黑腹果蝇和果

蝇的Adh基因和5,Adh侧翼序列进行了分析,并发现Adh基因受到了选择。Adh基因转录翻译形成,物体

的关键酶。

K a/K s(又称d z/d s或3)是非同义取代率与同

义取代率的比值[12]。非同义取代是指编码区核@酸的改变引起了氨基酸的变化,反之则为同义取彳^0一般认为,同义取代是中性的,其取代率用来反映中性情况下的变化速率。Yang等「13〕提出了利用最大似然法用一个密码子置换的马尔可夫来适配两条序列的数据,然后通过模拟的模型参数计算d N和d S。

—dN—P n/p s3、

cy-d S-p N/p S(2)

式中:P n/P s表示发生的同义和非同义取代数目的比率,p N/p S表示蛋白质上没有发生选择时对应的比率[14]0当3〉1时,非同义取代率高于同义

率,提示同的改变了

境青睐。当3-1时,非同义取代率与同义取代率相同,是中性进化理论的典型特征。当3<1时,非同义取代率低于同义取代率,提示非同义取代受到了负选择,也是大多数情况下能观测到的现象。

Chen等〔15〕利用K a/K s量化八个驯化动物的选择效率,结合历史有效群体大小,验证了在驯化过程中有效群体大小的改变会对选择效率产生重要影响,并强调了维持有效群体大小对提高动物育种效率的重要性。

2.2基于基因频谱的方法

Tajimas D是基于中性突变理论的一种检测方法。该方法首先计算群体多态性位点数S和平均非匹配数兀。多态性位点定义为任一序列任一碱基上和其他序列该位点存在区别,该位点就称为多态性位点。平均非匹配数是指两条序列之间存在的非匹配位点的个数,最后在总体中计算平均值[16\在计算多态性位点数时,只进行位点计数并不考虑不同等位基因频率高低。而在计算平均非匹配数时由于综合了多个两两比较的结果,实际上考虑到了不同等位基因频率高低。将多态性位点数和平均非匹配数两者联系起来,在某种程度上就可以反映不同情况下差异位点数和等位基因频率差的关系。Tajima s D检验的统计量计算公式如下:

(3)

式中:n表示平均非匹配数,S表示多态性位点数,a为Y(n—?1,n表示n个用于分析的DNA序

列。

当Tajimas D-0时,表明群体处于中性进化状态。当Tajimas D<0时,提示低频变异位点多于中性预期,表明群体经历了负选择事件或者群体扩张。当Tajimas D〉0时,提示高频变异位点多于中性预期,表明群体处于平衡选择[17\Tajimas D根据多点基因频率进行检测,但当某一个点因为周围的位点受到选择而出现基因搭车效应时,该点也会表现为负。

灰斑鸠广泛分布于世界各地「18〕,已有人从生态学方面研究了其扩张过程「19〕,但对灰斑鸠的遗传多样性方面知之甚少。Bagi等囱对欧亚大陆的143只灰斑鸠的mtDNA进行了测序,发现了52种不同的单倍型。将单倍群树分为两组分别为A和B,

相关文档
最新文档