作物基因组学前沿与应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

作物基因组学前沿与应用

Crop genomics: advances and applications 摘要:一些重要作物模式基因组测序的完成和进行高通量重测序的能力为提高对植物驯化历史的理解以及加快作物改良提供机遇。而这些数据以及新一代实验和计算方法正在改变作物比较基因组学。作物改良的未来将集中在个体植物基因组的比较,最好的手段可能在于结合运用新的遗传图谱构建策略与进化分析方法来指导和完善遗传变异的发掘与利用。这里我们回顾这些已然出现的策略与深刻见解。

一些重要作物和模式植物模式基因组测序的完成可能有助于实现长期存在的大大加快作物改良的植物基因组学研究要求(fig.1)。早在上世纪60年代末期,就已实现了对一个植物基因组分子标记的开发,但是最近几十年较易检测的分子标记数目存在分辨率较低的限制,而这些问题可以通过实验遗传学方法或者比较遗传学方法解决。仅仅几年前,高密度的遗传图谱需要对几千个标记进行费时费力地检测。实验群体通常会受限于两个亲本间的简单杂交;更详尽的研究设计可能提供对农学上重要突变遗传分布的评定,但相关种质中突变频率受到标记技术和用于区分多亲本分布的分析方法所限制。对群体间分子标记频率的分析,从而鉴定重要功能突变的比对方法已经提出,但是由于群体间预期的等位基因较高变异频率的存在,使得发掘研究的大量位点间重要功能突变显得相当的困难。

目前,已经报道了一些作物的模式基因组,并且在那些具有较大基因组的作物中引用取得进展。此外,已经报道了其他一些模式植物系统的模式基因组,包括拟南芥和短柄草。比较基因组学——传统上被认为是相关物种间同线性(基因顺序)的分析和序列的比对,目前由于报道的模式基因组数目的急速增加,源于高通量重测序的序列多样性的估计,大量缺失插入以及拷贝数变异(CNVs)基因组分布的鉴别,以及新一代实验和比较方法的出现而被重新定义。从遗传图谱的构建到进化分析,作物改良的未来将主要围绕着个体植物基因组间的比较。如果我们要继续提高作物产量,同时最低程度地减少农业生产对环境的影响,以面对不断增长的人口和变化的气候,那么最大限度地利用这些基因组数据对作物改良就显得至关重要了。

在这篇综述里,首先指出作物比较基因组学的挑战,这些挑战包括植物基因组的复杂结构以及在一些作物品种中发现的高水平核苷酸和结构的多样性。然后讨论了解驯化的重要性,因为一个作物的起源和种群分布影响着农艺性状的遗传基础和全基因组核苷酸多样性的方式。我们对农艺性状遗传学的理解由于基因组数据而发生根本性的变化。高密度的遗传标记正在被用于全基因组关联分析(GWASs),也可以应用到基因组选择中。对农艺性状的了解同样因为新一代的多亲本遗传图谱构建群体而得到提高。正如我们所讨论的那样,更高通量的重测序技术和标记基因型分析将会使新的作物改良方法成为可能,比如对有害突变的鉴别与选择性剔除。

植物基因组学的挑战

应用在植物中的基因组学研究工具通常会开发和测试其在哺乳动物或者其他模式生物中数据,比如果蝇和小鼠,但是植物基因组的规模和动态性增加或者加剧在其他模式生物中面临的挑战。相对于哺乳动物来说,植物倾向于拥有大量

的基因家族和更高频率的多倍性。这使得旁系同源成为更加实质性的问题,因为典型的高通量测序的短序列阅读可能不能精确地定位到模式基因组中,并且不能从紧密相关基因家族成员的差异中分辨出等位基因变异(fig.2)。由于存在的大量拷贝数变异,旁系同源的问题甚至出现在那些拥有高质量模式基因组的植物物种中。例如,估计表明,玉米模式基因组只占存在于不同玉米自交系亲本低拷贝数序列的70%,并且这种拷贝数变异导致了高比例的假阳性变异。序列阅读长度的不断改善,连同测定品系间等位基因的分离和利用连锁不平衡的局部模式的方法,都将有助于复杂作物基因组中旁系同源基因的识别阅读。尽管还没有一种简单的方法来应对多倍体植物基因组的复杂性,但是对二倍体近缘种或者双单倍体系的测序可以给未来多倍体作物基因组水平研究提供参照。

一些作物基因组中高水平的核苷酸多态性对比较分析构成挑战,因为大量样本和模式基因组间的错配会导致序列阅读分析(Fig.2)的降低或者寡核苷酸阵列杂交的减少。例如,玉米和人类的基因组大小相似,但是一对普通的玉米个体间差异都是任何两个人位点差异的十倍。尽管许多植物并没有这样高水平的多样性,但是不同基因组的研究难点与远缘杂交物种的玉米是差别的:无性繁殖的葡萄,甚至像大麦这些自交物种,多样性水平也很高。

比较基因组学的另一个挑战就是基因组的大小(Fig.1)。目前特征性植物物种基因组的大小差异超过三个数量级,主要是由于转座子的广泛存在。独特的基因组大小使得基因组分析变得更加困难:鸟枪法测序读取能够对覆盖有四个果蝇基因组大小进行有效的识别——能够对杂合位点的和结构变异的识别——能够识别覆盖大概一个小麦基因组的大小。植物基因组转座子的密度同样意味着很大一部分的鸟枪法测序数据不能在基于模式基因组分析上应用,因为图谱的阅读以相同的概率在模式基因组多位点进行的(Fig.2)。这并不奇怪,所有已经测序得到数据的作物基因组都相对较小——已测序的最大的作物基因组,玉米,其比被子植物基因组平均一半的规模还要小(Fig.1;Table 1)。

尽管植物基因组对基因组分析来说有很多挑战,但是它们确实还是有很多优点的。不像大多数的动物,作物可以进行无性繁殖或者保持自交系,并且许多物种的种子可以无限期的储存,那样就可以有效地保留有利的基因型。这就使得对一个系测序一次但多次鉴定其表现型成为可能,同样可以在不同环境中重复试验。自交系或者专门设计的双单倍体同样避免了对高度杂合的基因组测序的困难。对葡萄基因组的测序为二倍体远缘杂交种或者自交系的测序的优势和困难提供了一个有用的比较。

作物起源与进化

对作物起源与驯化的了解具有重要的进化意义,因为植物驯化为适应性研究提供了模式系统。对作物起源的了解一直是作为鉴定作物改良有利遗传资源的主要手段。驯化造成的遗传变异是现代育种家可利用的资源,因为它能影响核苷酸多样性和全基因组连锁不平衡的方式。驯化的种群历史同样为我们提供对性状遗传结构的期望,因此我们能够辨别作物改良的遗传变异的原因。

种群历史与地理起源。全基因组多态性使得研究作物的种群历史和地理起源成为可能。驯化是一种当代的进化现象,并且驯化种和其野生祖先间任何位点都有相同的系谱学历史。驯化的和野生的种群间和种群内的等位基因的比对会反映大大早于栽培种起源的分化时代,反映了品种最近共同祖先的时间,而不是驯化种分化的时间。对驯化历史的详尽的研究需要大量的位点与种群统计模型的结

相关文档
最新文档