基因组共线性原理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基因组共线性原理
1. 共线性。所谓的共线性主要是用来描述同一染色体上基因的位置关系,也就是指由同一祖先型分化而来的不同物种间基因的类型以及相对顺序的保守性(即基因的同源性+基因的排列顺序)。共线性片段的大小与物种之间的分化时间有很大关系:分化时间较短的物种间,积累的变异较少,会保留更多从祖先遗传下来的特征;相反的,分化时间较长的物种间由于变异积累而导致共有的特征变少,反而获得较短的共线性片段。此外,基因同源又可以分为直系同源和旁系同源。直系同源基因指存在于祖先基因组中,随后因为物种分化,分别遗传给不同的后代,这些基因在结构和功能上有很高的相似性。旁系同源基因指同一基因组中由于基因复制而产生的的同源基因,这些基因往往变异较大,从而可能出现功能变异。
2.共线性分析的应用。测序发展初期,人们只能测得部分序列,但这些数据量少,不利于全面分析基因功能。另外,单个物种基因组序列也无法完整的描述该物种的全面信息,而且也无法挖掘真正的进化事件,比如基因丢失、基因获得等。近几年,随着测序技术的快速发展,为大规模的全基因组测序创造了很好的条件。而比较基因组的出现,更是进一步推动了近缘物种或个体的全基因组测序,其中比较基因组中很大的一部分工作就是集中在全基因组比对上。
共线性分析是比较基因组中必不可少的分析策略,因为它允许分析物种间大尺度和小尺度的分子进化事件。大尺度进化事件主要包括对基因组内重排和复制事件的估计,例如,可以使用人与小鼠之间的全基因组比对来识别共线性同源区块,然后确定重排事件,从而解释两个基因组结构差异。小尺度进化事件则是针对基因组水平的碱基替换速率以及插入、缺失事件。从共线性片段中可以识别出
的物种间小尺度和大尺度突变事件,这些都可以作为物种树推断数据。此外,结合构建的两个尺度的基因组进化模型,共线性比对还能够完成祖先基因组重建的任务。
由于基因组共线性通常可以预测同源序列,并且同源序列可能具有相似的功能,因此全基因组共线性分析对于功能预测是十分有价值的。可以通过在整个基因组的核苷酸水平上对齐,从而可以帮助预测编码和非编码区域的功能。例如,如果我们对人类基因组中特定的疾病相关区域感兴趣,我们可能会使用对齐来识别其小鼠同源基因的位置。通过对小鼠同源片段的了解将使我们能够更好地了解这个基因组区域的进化历史,并可能进行遗传操作实验。