进化基因组学研究进展
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
进化基因组学研究进展
刘超
(山东大学生命科学学院济南250100)
摘要:进化基因组学是利用基因组数据研究差异基因功能、生物系统演化、从基因在水平探索生物进化的学科。随着近年来基因组数据的不断增加,进化基因组学得到了长足的发展。进化基因组学主要包括从基因组水平理解和诠释生物进化和新基因分析研究探索两方面的内容。本文介绍了进化基因组学研究的主要内容和较为常用的方法,以及近年来在细菌、酵母、果蝇进化基因组学方面的研究进展。
关键词:进化基因组学系统进化比较基因组学新基因
前言
随着基因测序技术的不断进步以及基因组学的飞速的发展,人们积累了大量的基因组学数据,利用所得的大量的基因组数据与进化生物学相结合,在基因组水平研究生物进化机制,随即产生了进化基因组学(Evolutional Genomics)。
近年来进化基因组学取得了长足的进展,在研究差异基因功能、生物系统演化、从基因在水平探索生物进化的终极方式等方面有重大突破,对人类理解生命现象和过程有重要作用。
1进化基因组学研究内容
研究系统进化学通常包括两个关键步骤:一方面,在不同物种中鉴定同源性特佂,另一方面利用构建系统进化树的方法比较这些特征,进而重新构建这些物种的进化历史[1]。针对这两个关键步骤,传统系统进化学,常采用基于形态学数据和单个基因研究的同源性状鉴定和重建系统进化树(常包括距离法、最大简约法、概率法)[1]的方法来研究。在目前拥有丰富基因组数据的条件下,我们可以分析基因组数据,利用进化基因组学研究系统进化。
目前进化基因组学的研究内容主要集中于两个方面:(1)在比较不同生物的基因数据的基础上,从基因组水平理解和诠释生物进化;(2)通过对新基因的分析研究探索基因进化过程的规律两个方面[2](如图1)。在进行全基因组进化分析方面,进化基因组学主要集中于构建系统进化树、研究基因组进化策略、研究生物功能变化和进化机制、进化和生态功能基因组学[2]、基因注释的等方面;在新基因方面主要分析基因产生机制和新基因固定及其动力学研究。
图1 进化基因组学主要研究内容
目前进化基因组学的研究有力的解决了一些基础性的进化问题,但也出现了一些未来需要急需解决的挑战。例如生物进化的本质和目前重建系统进化树方法的限制[1]。
2研究进化基因组学的方法
研究进化基因组学的方法主要包括利用基因组数据分析和研究新基因的产生和演化两种。
2.1利用基因组数据进行系统进化分析
利用基因组数据进行系统进化分析,常有基于基因序列的方法和基于全基因特征的方法。(如图2)
图2 利用基因组数据进行系统进化分析[1]
基于基因序列的方法需要利用ClustalW等工具将直向同源基因对齐并进行多样基因序列的校直,并对直向同源基因明显校直位点进行分析(如利用Gblocks)。一旦这个关键步骤实现,能够从不同基因(经常是不同长度或包含不同的物种集合)的校直中利用两种不同的方法继续进行系统进化的推测:一是超矩阵法,倾向于分析成串的个体基因;另一个是超树分析,倾向于从个体基因的分析中结合所得的最优化的进化树。
基于全基因特征的方法是通过对全基因组进行分析并预测系统进化树,如分析基因含量、基因序列等。
2.2进化基因组学与比较基因组学
进化基因组学中对于基因组数据的分析主要利用了比较基因组学的方法。比较基因组学(comparative genomics)是在基因组图谱和测序的基础上, 利用某个基因组研究获得的信息推测其他原核生物、真核生物类群中的基因数目、位置、功能、表达机制和物种进化的学科[4]。
在基因组间进行比较可以了解不同基因组在核苷酸组成、同线性关系和基因顺序方面的异同,进而可以得到基因分析预测与定位、生物系统发生进化关系等方面的信息。当在两种以上的基因组间进行序列比较时,实质上就得到了序列在系统发生树中的进化关系[4]。基因组信息的增多使得在基因组水平上研究分子进化、基因功能成为可能。
2.3新基因的产生与演化
新基因指在基因组中新近形成的基因,在研究基因组中基因最初产生的分子机制和基因在群体中扩散并最终固定下来的群体动力学过程有重要意义[5]。
新基因产生的机制主要:基因重复(fgene duplication)、外显子重(exon shuffling)、逆转座(retrotransposition)、可移动元件(mobile elements)、基因水平转移(fgene lateral transfer)和基因分裂与融合(gene fission and fusion)等[5]。
对于新基因在群体中的固定,目前研究的一些模型在一定程度上了描述了中性选择、正选择在进化过程中的作用。Walsh和Ohta认为中性选择与正选择两者都会在新基因形成过程中起作用,特别在一个大群体中,选择将大大增加形成新基因的概率[5]。但对于新基因产生中的实际群体动力学仍不得而知。
2.3.1利用生物信息学鉴定新基因
随着生物信息学的快速发展,产生了大量可利用的基因组信息和分析软件,充分这些数据和工具在鉴定新基因有重要作用。
目前克隆新基因的主要方法基于有EST的电子克隆和定位克隆[6]。其中电子克隆技术是加速基因克隆的一条有效途径。
电子克隆或称cDNA文库筛选,主要采用生物信息学方法延伸EST序列,获得基因的部分乃至全长cDNA序列。定位候选克隆策略是利用细胞生物学、分子遗传学以及人类基因组计研究的最新结果,分离鉴定染色体特定位置上功能基因的方法。目前充分利用整个基因组数库,EST数据库等资源可以进行网上克隆,进而分析和鉴定新基因。
3进化基因组学研究进展
截止2008年,全球已有将近730种物种的完全基因组被测定(82种真核生物,597种细菌和51种古细菌),而且超过2759个基因组计划提上议程。[7]这些基因组数据为进化基因组的发展提供了大量的材料,近年来进化基因组学取得了飞速的发展。
3.1细菌进化基因组学
细菌在三域生物界中独占一域,在了解生命起源、系统进化等方面有重要意义。另外其基因组小,已知数据充足的特点,使细菌在进化基因组学方面的研究提供了可能。通过对细菌进化基因组的研究,对于研究细菌生境适应、毒力进化、