水稻基因组进化的研究进展
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
水稻基因组进化的研究进展
水稻是世界上重要的粮食作物之一,养活着全世界近一半的人口。同时南于水稻基冈组较小、易于转化及与其他禾本科植物基因组的同线性和共线性等特点,一直被作为禾本科植物基因组研究的模式作物。水稻是第一个被全基因组测序的作物,目前栽培稻2个亚种全基因组测序工作已经完成:粳稻品种日本晴(Nipponbare)通过全基因组鸟枪法和逐步克隆法被测序,籼稻品种扬稻6号(9311)通过全基因组鸟枪法被测序。除核基因组外,水稻叶绿体和线粒体基因组也于1989年和2002年分别被测序。水稻2个亚种的全基因组测序完成,一方面开启了植物比较基因组学的大门,另一方面为人们在基冈组水平上鉴定出所有水稻基因并分析其功能奠定了基础,同时也使得人们对植物进化的认识,尤其是对禾本科植物进化的了解,逐步从系统分类和分子标记水平进入到了基因组序列水平。许多研究者通过对水稻基因组序列的分析,利用生物信息学工具,对水稻在基因组水平上的进化进行了大量研究。
1 水稻及其他禾本科植物基因组的古多倍体化过程
水稻是典型的二倍体植物,其核基因组中共有12条染色体。在水稻基因组被完整测序之前,人们就已经采用分子标记、DNA重复元件等方法探究水稻基因组的古多倍体化(polyploidization)过程,并发现了一些重复的染色体片段。随着水稻基因组测序计划的完成,越来越多的证据表明水稻基因组曾发生过全基因组复制(whole genome duplication),即古多倍体化过程。
Golf等利用鸟枪法完成了粳稻品种日本晴全基因组的测序工作,并利用同义替换率分布方法(Ks- based age distribution)提出水稻基因组可能发生过一次全基因组复制过程。此后多家研究机构和一些研究者对水稻基因组中的重复片段进行了研究,虽然得出的结论不尽相同,但均发现水稻基因组中存在大量的重复片段。根据所采用方法和参数的不同,这些重复片段占整个水稻基因组的15%~62%。Yu 等在水稻基因组中发现了18对大的重复片段,大约占整个基因组的65.7%。其中17对重复片段形成的时间很相近,发生在禾本科物种分化之前;最近的一次片段复制事件发生在水稻11和12号染色体之间,在禾本科物种分化之后。
水稻基因组被测序之后,许多科研机构对基因组数据进行了详尽的注释。其中应用比较广泛的是美国基因组研究院(the institute for genome research,TIGR)和日本农业生物科学研究所(national in- stitute of agrobiological sciences,NIAS)的水稻基因组注释信息。TIGR根据其注释的结果和基因相似性矩阵(gene homology matrix,GHM)方法,检测到大量染色体间的重复片段,这些重复片段几乎覆盖了整个水稻基因组。TIGR水稻基因组注释数据库从第4版开始便增加了对片段重复的注释,该分析是利用DAGChainer程序进行的,重复片段采用100 kb和500 kb 2种参数模型进行了染色体片段的基因共线性分析(图1),这是全基因组复制的有力证据。根据复制片段上同源基因的分子进化分析,估计全基因组复制发生在大约7 000万年前,在禾本科物种分化之前。此外,Zhang等利用TIGR更新的数据进行分析,采用同义替换率分布方法检测到另一次更古老的(单、双子叶植物分化前)基因组复制事件,说明水稻基因组至少经历了2次全基因组复制过程。
全基因组复制或多倍体化是植物尤其是禾本科作物物种形成和进化过程中非常重要的事件,大部分开花植物在进化过程中均经历了多倍体化过程。基因组加倍后,再经历所谓的二倍体化过程(diploidization),进化成当代的二倍体物种,并造成大量重复片段中基因的重排和丢失。Salse等研究发现基因组复制事件对禾本科植物的物种形成和演变具有重要作用。他们认为禾本科植物的祖先物种是一个基因组内包含5条染色体的物种,在进化过程中,首先在距今5 000~7 000万年前经基因组复制产生了10条染色体;此后,在基因组内发生了2次染色体置换和融合而形成了12条中间态染色体。以这12条中间态染色体为基础,逐渐分化出水稻、小麦、玉米和高粱的基因组,其中水稻基因组保留了原有的12条中间态染色体,而小麦、玉米和高粱均又发生了染色体丢失和融合才形成了现有的基因组。水稻全基因组复制片段是至今为止在动、植物基因组中发现的最为清晰、完整的基因组复制的遗迹。水稻之所以保存这么完整,一方面是水稻基因组保持了12条中间态染色体的基本形态,另一方面可能与水稻基因组相对较稳定有关。
2水稻籼粳2个亚种的分化
水稻是世界上最重要的粮食作物之一,在其11 500多年的栽培历史中,因适应不同的农业生态环境而产生了丰富的遗传多样性和明显的遗传分化。长期以来,基于形态性状、同工酶以及对一些化合物不同反应的研究,把亚洲栽培稻(Oryza sativa L.)分为籼稻(indica)和粳稻(japonica)2个亚种。其中籼亚种耐湿耐热,主要适应于热带和亚热带等低纬度地区,而粳亚种则耐寒耐弱光,适应于高纬度和高海拔地区种植。这2个亚种间不仅产生了生殖隔离的基因库,还在形态特征、农艺性状和生理生化反应等方面存在明显的差异。近期群体
遗传结构的分析进一步显示籼、粳亚种中还可以细分成少数几个亚群。随着水稻细胞器与核基因组测序计划的完成,人们可以通过序列比对、逆转录转座元件多态性分析以及核基因组中叶绿体DNA插入时间的估计来研究籼粳亚种的差异、追踪亚种的起源以及推断2个亚种的分化时间。
在水稻基因组序列释放以后,人们通过分析籼粳2个亚种间的单核苷酸多态序列(single nucleotide pol- ymorphisms,SNPs)和插入缺失差异片段(insertion/deletions,InDels)来挖掘籼稻或粳稻特有的分子标记,显著提高了水稻的遗传分化研究的精确度和可信度。Shen等通过生物信息学方法比较了日本晴和扬稻6号的全基因组序列的差异,构建了一个日本晴和扬稻6号全基因组DNA序列多态性数据库,该数据库包含了1 703 176个SNPs和479 406个InDels。由于日本晴和扬稻6号代表了典型的粳稻和籼稻,因而两者基因组序列上的InDel片段差异可能反映了籼稻和粳稻这2种生态型基因组序列差异。除水稻2个亚种的基因组被测序外,水稻的叶绿体和线粒体基因组也已经被测序。Tang和Tian等分别在对籼稻品种扬稻6号和粳稻品种培矮64S(PA64S)的叶绿体和线粒体基因组进行测序的基础上,对2种细胞器基因组序列亚种间的差异进行了比较,发现水稻叶绿体亚种间差异位点上存在72个SNPs和27个InDels,而线粒体基因组之间则存在96个SNPs、25个InDels以及3个片段序列变异。以上研究的结果总结于表1。由表1可知,叶绿体和线粒体基因组亚种间多态率远低于核基因组,而线粒体又较叶绿体低。这种多态率的差异可能反映了核、叶绿体和线粒体DNA进化速率上的差异。
遗传学和考古学的研究虽然已为玉米(Zeamays ssp.mays)及小麦(Triticum aestivum L.)的驯化、传播提供了较为全面的说明,但相比之下,水稻的驯化过程在很多方面还存在争议。比如,亚洲栽培稻是一次起源还是两(多)次起源、野生祖先是普通野生稻(Oryza rufipogon)还是尼瓦拉野生稻(Oryza nivara)以及驯化地点等等。目前,关于栽培稻籼粳亚种起源的假说主要有2种,即一源论和二(多)源论,其中又以二(多)源论占据主要地位。一源论认为亚洲栽培稻只起源了一次,而粳稻是从籼稻中分化而来的高海拔和高纬度的适应类型。这一观点得到部分研究的支持。蔡星星等采用45对InDel引物对来自亚洲10个国家的49份籼稻、43份粳稻品种和24份野生稻进行了检验,发现籼稻与粳稻存在明显的遗传分化,含AA基因组的野生稻与籼稻品种存在较近的亲缘关系,从而较好地支持了籼稻是由含AA基因组的野生稻直接驯化而来,而粳稻由籼稻分化而来的假说。另一方面,也有研究者认为籼粳亚种的分化在它们驯化之前的野生祖先中就已经完成,随后,籼型的野生祖先驯化为籼稻,粳型的野生祖先则驯化为粳稻,二者独立起源,即二(多)源论。近年来基于多个座位DNA序列的核苷酸多态性及系统发生分析越来越明显地支持二(多)源论假说。这些研究发现,籼粳亚种属于独立的进化分枝,而籼稻的遗传多样性比粳稻高且与野生祖先亲缘关系更为接近的原因可能是由于较大的建立群体(founding population)和较小的瓶颈效应等缘故。
关于籼粳亚种分化时间的推断,人们最初利用2个亚种基因组序列的差异来进行。Bennetzen等对2个亚种的29 kh同源片段进行了分析,认为这2个亚种是距今100万年前开始分化的,但该研究未给出这一估计的详细信息。Ma等以非洲栽培稻(Oryza glaberrima)的核DNA作为参照,通过对籼稻和粳稻超过1 Mb的基因组DNA序列变异的分析,推断籼粳亚种的分化发生在大约44万年前。Zhu等对A基因组的稻属物种中4个核基因的内含子进行了系统发生分析,并通过分子钟方法估计2个亚种的分化时间大约在40万年前,与Ma等结果非常接近。此外,植物基因组中普遍存在的逆转录转座子(retrotransposon)也已广泛应用于籼粳亚种分化的研究中。逆转录转座子是一类通过RNA反转录进行转座的可移动遗传元件,根据其末端长末端重复序列(10ng terminal repeat,LTR)的有无又可分为LTR逆转录转座子和non- LTR逆转录转座子2类。通过比较籼粳亚种基因组同源区域特定逆转录转座元件的有无,可以区分出亚种间共同的插入事件(发生在亚种分化前)和亚种特异的插入事件(发生在亚种分化之后)。进一步通过对这2类插入事件中逆转录转座子5'和3'
端LTRs分化率的计算可以推断出插入的时间,从而了解亚种的分化时间。Vitte等比较了110个逆转录转座元件在籼粳亚种基因组间的差异,发现有82个在籼稻基因组中不存在。结合LTRs分化率的计算,估计这2个亚种是在大约20万年前分开的。根据以上研究结果,利用核基因组序列推断的籼粳亚种的分化时间在大约20~40万年前。这一时间远早于水稻被驯化的时间(大约1万年前),说明籼粳分化在驯化前的野生祖先中早已完成,很好地支持了籼粳亚种起源的二(多)源假说。
除核基因组外,细胞器基因组也已广泛用于籼粳亚种分化时间的估计。Tang和Tian等分别利用叶绿体和线粒体基因组在籼粳2个亚种之间SNPs的频率,估计出2个亚种叶绿体基因组分化的时间在大约8.6~20万年前,而线粒体基因组分化的时间在4.5~25万年前。此外,由于植物中常见细胞器DNA向核中转移,通过2个亚种核基因组中叶绿体插入事件的分析也可以推断亚种的分化时间。Guo等[44j 利用粳稻日本晴中8个叶绿体插入片段及其侧翼的核序列在籼稻基因组中进行搜索,找到了6个直系同源片段,代表了亚种分化以前的共同插入事件,而另外2个在籼稻基因组中不存在,代表了亚种分化以后发生在粳稻中的特异插入事件。进一步对核基因组中这些插入片段