分子进化与系统发育

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 最理想的方法:化石?— —然而…零散,不完整
2. 比较形态学和比较生理学:确定大致的进化框架。 — —然而,细节存在巨多的争议
2014-6-8
4
第三种方案:分子进化
1. 1964年,Linus Pauling提出分子进化理论; 2. DNA&RNA:4种碱基;蛋白质分子:20种氨基酸;
3. 发生在分子层面的进化过程:DNA,RNA和蛋白质
2014-6-8
12
核苷酸替代:转换 & 颠换
1. 转换: 嘌呤被嘌呤 替代;或者嘧啶被嘧 啶替代; 2. 颠换: 嘌呤被嘧啶 替代,或者嘧啶被嘌 呤替代
A
C
G
T
2014-6-8
13
基因复制:单个基因复制
2014-6-8
14
基因复制:染色体片段复制
2014-6-8
15
基因复制:基因组复制
研究结果: 克鲁雄酵母 中的同源基 因数量与酿 酒酵母相比 为1:2
2014-6-8
39
序列比对的应用价值
1. 观察序列的同源性
2. 观察序列保守区和多变区,确定功能区
3. 设计PCR引物
4. 发现突变位点 5. 系统发育分析
2014-6-8 40
一、序列相似性比较 1、序列相似性比较:
就是将待研究序列与DNA或蛋白质序列库进行比较, 用于确定该序列的生物属性,也就是找出与此序列相似
异同源物(xenolog):由某一个水平基因转移事 件而得到的同源序列。
17

2014-6-8
paralogs
orthologs
直系同源
2014-6-8 18
paralogs
orthologs
Erik L.L. Sonnhammer Orthology, paralogy and proposed classification for paralog subtypes TRENDS in Genetics Vol.18 No.12 December 2002
中间节点 中间枝条 节点

2014-6-8
25
系统发生树性质:

理论上,一个DNA序列在物种形成或 基因复制时,分裂成两个子序列,因
末端分支 末端物种

此系统发育树一般是二歧的;
如果是一棵有根树,则树根代表在进 化历史上是最早的、并且与其它所有
中间枝条 节点 根

分类单元都有联系的分类单元,反映
时间顺序; 如果找不到可以作为树根的单元,则
2014-6-8 30
系统发生学的应用
可应用于各种生物的进化分析: 1. 基因鉴别分型,提供生物分类依据。如,新发传
染病病原体的确定。
2. 发现新的基因进化现象,发现新的病原体,帮助
预防和控制疾病。
3. 通过揭示基因进化规律,预测未来基因进化趋势。 4. 考古学研究。
2014-6-8
31
构建进化树的方法
可以用写字板/Word编写。 文件扩展名为fasta, fst
2014-6-8
37
序列名称要求
1. 应简短, 2. 没有重复的名称, 3. 没有软件所不认可的符号,如“-”,“?”, 等。
2014-6-8
38
序列比对(multiple alignment)

常用软件:
ClustalW
Mega BioEdit DNAStar中的MegAlign GeneDoc
外围群
Monophyletic group(单源群)
有根树
2014-6-8
eukaryote eukaryote
root
eukaryote eukaryote
Monophyletic group
29
基因树,物种树
a A B
Gene tree
Species tree
b
D c We often assume that gene trees give us species trees
2014-6-8
43
3、Blast简介
BLAST 是由美国国立生物技术信息中心 (NCBI)开发的一个基于序列相似性的数据
库搜索程序。
BLAST是“局部相似性基本查询工 具”(Basic Local Alignment Search Tool)的 缩写。
2014-6-8
44
Blast简介
Blast 是一个序列相似性搜索的程序包,其 中包含了很多个独立的程序,这些程序是根 据查询的对象和数据库的不同来定义的。比 如说查询的序列为核酸,查询数据库亦为核 酸序列数据库,那么就应该选择blastn程序。
下表列出了主要的blast程序。
2014-6-8
45
主要的blast程序
程序名 Blastn Blastp 查询序列 核酸 蛋白质 数据库 核酸 蛋白质 搜索方法 核酸序列搜索逐一核酸数据库中的序列 蛋白质序列搜索逐一蛋白质数据库中的序列
2014-6-8
16
同源性分析——功能相似性

直系同源(ortholog):两个基因通过物种形成 的事件而产生,或,源于不同物种的最近的共同 祖先的两个基因,或者两个物种中的同一基因, 一般具有系统的功能。同源的基因是由于共同的 祖先基因进化而产生的。

旁系同源(paralog):两个基因在同一物种中, 通过至少一次基因复制的事件而发生。同源的基 因是由于基因复制产生的。
是指生物形成或进化的历史。

系统发生学(phylogenetics): 研究物种之间的
进化关系,其基本思想是比较物种的特征,并认
为特征相似的物种在遗传学上接近。

结果往往以系统发生树(phylogenetic tree)表示, 用它描述物种之间的进化关系。
2014-6-8
24
一个系统发育树
末端分支 末端 物种 顶端 叶子
2014-6-8
5
分子进化研究的目的
从物种的一些分子特性出发,构建系统发育树,从而了
解物种之间的生物系统发生的关系— —tree of life;物种分
类。 蛋白和核酸序列 通过序列同源性的比较进而了解基因的进化以及生物系 统发生的内在规律。
进化速率分析:例如,HIV的高突变性,哪些位点易发
生突变?
的已知序列是什么。完成这一工作只需要使用两两序列
比较算法。常用的程序包有BLAST、FASTA等.
2014-6-8
41
1、相似性
相似性: 是指一种很直接的数量关系,比如部分 相同或相似的百分比或其它一些合适的度 量。比如说,A序列和B序列的相似性是80 %,或者4/5。这是个量化的关系。
2014-6-8
42
2、相似性和同源性关系
序列的相似性和序列的同源性有一定的关系, 一般来说序列间的相似性越高的话,它们是同源 序列的可能性就更高,所以经常可以通过序列的 相似性来推测序列是否同源。
正因为存在这样的关系,很多时候对序列的 相似性和同源性就没有做很明显的区分,造成经 常等价混用两个名词。所以有出现A序列和B序列 的同源性为80%一说。
一类是序列类似性比较,主要是基于氨基酸相对
突变率矩阵(常用PAM250)计算不同序列差异性积 分作为它们的差异性量度(序列进化树); 另一类在难以通过序列比较构建序列进化树的情 况下,通过蛋白质结构比较包括刚体结构叠合和多结
构特征比较等方法建立结构进化树。
2014-6-8 32
序列进化树
原理:

根据序列同源性来分析物种/基因之间的进 化关系。 同源性的判断往往根据BLAST,或者多重 比对(multiple alignment)。 根据一定的理论来计算进化关系 结果用系统发育树(进化树)表示。
2014-6-8
19
基因的趋同进化
(genes have converged function by separate evolutionary paths)
基因通过
不同的进
化过程获 得保守的 功能.
2014-6-8
20
异同源物(Xenolog)
由某一个水平基因转移事件而得到的同源序列。
异源基因或水平转移基因
Cladograms show branching order branch lengths are meaningless 进化分支图,只用分支 信息,无支长信息。
Phylograms show branch order and branch lengths 进化树,有分支和支长 信息
2014-6-8
研究基因序列与功能的关系。
2014-6-8 9
分子进化研究的基础(实际)

虽然很多时候仍然存在争议,但是分子进
化确实能阐述一些生物系统发生的内在规
律。
局限:即系统发育的发生过程都是己经完成的历 史,只能在拥有大量 序列信息的基础上去推断过去曾经发生过什么,而不能再现。
2014-6-8
10
分子进化的模式
系统发生树是无根树,反映距离;

从根节点出发到任何一个节点的路径 指明进化时间或者进化距离。
26
2014-6-8
树只代表分支的拓扑结构
A BC D F E† G
D
C
F
G A
B
E†
2014-6-8
27
进化分支图,进化树
Bacterium 1 Bacterium 2 Bacterium 3 Eukaryote 1 Eukaryote 2 Eukaryote 3 Eukaryote 4 Bacterium 1 Bacterium 2 Bacterium 3 Eukaryote 1
1. DNA突变的模式;替代,插入,缺失,倒位; 2. 核苷酸替代:转换(Transition) & 颠换(Transversion); 3. 基因复制:多基因家族的产生以及伪基因的产生: A 单个基因复制、重组或者逆转录; B 染色体片段复制; C 基因组复制。
2014-6-8 11
DNA突变的模式
Eukaryote 2 Eukaryote 3 Eukaryote 4
28
有根树,无根树,外围群
archaea archaea archaea
eukaryote
无根树
eukaryote
eukaryote eukaryote
Rooted by outgroupபைடு நூலகம்
bacteria outgroup
archaea archaea archaea
b. 做实验,获得PCR产物/质粒,测序,获得
基因序列。
② 序列的格式:最基本的格式为FASTA。 ③ 把参考同源序列和你自己的序列全部做成 一个FASTA文件。
2014-6-8 35
在GenBank可以选择序列格式
2014-6-8
36
Fasta format
> 序列名称 ATGGAAAGAATAAAAGAATTAAGAGATCTAATGTCAC AGTCCCGCACTCGCGAGATACTAACAAAAACCA > 序列名称 ATGGAAAGAATAAAAGAATTAAGAGATCTAATGTCAC AGTCCCGCACTCGCGAGATACTAACAAAAACCA
7

2014-6-8
分子钟理论
从一个分歧数据可以推测其他
y 序列分歧度
x
2014-6-8
分歧时间
8
分子钟理论意义
分子钟的发现与中性理论的提出,极大地推动了 进化尤其是分子进化研究,填补了人们对分子进化即 微观进化认识上的空白,推动进化论的研究进入分子 水平,并建立了一套依赖于核酸、蛋白质序列信息的 理论方法。分子进化研究有助于进一步阐明物种进化 的分子基础,探索基因起源机制,从基因进化的角度
分子进化与系统发育
蔡国斌
2010年11月7日
内容提要

分子进化分析介绍
系统发育树重建方法 Phylip软件包在分子进化分析中的应用


2014-6-8
2
生物学家:We have a dream……
Tree of Life:重建所有生物进化历史并以 系统树的形式加以描述
2014-6-8
3
梦想走进现实:How ?
2014-6-8
(xenologous or horizontally transferred genes)
21
2014-6-8
22
系统发育树
——对一组实际对象的世系关系的 描述(如基因,物种等)。
2014-6-8
23
概念(Definitions)

系统发生(种系发生、系统发育)(phylogeny):
2014-6-8 6
分子进化研究的基础(假设)

核苷酸和氨基酸序列中含有生物进化历史的全部信息。
分子进化研究的基础(理论)

在各种不同的发育谱系及足够大的进化时间尺度中,许 多序列的进化速率几乎是恒定不变的。(分子钟理论, 1965 ) 某一蛋白在不同物种间的取代数与所研究物种间的分歧 时间接近正线性关系,进而将分子水平的这种恒速变异 称为“分子钟”。
33


2014-6-8
基本操作步骤
序列的准备 序列的多重比对(自动或手动比对) 建立取代模型(建树方法) 系统发育分析,建立进化树 进化树检验、评估 进化树的编辑加工
2014-6-8 34
序列的准备
① 根据研究目的,确定目的基因,全序列或 者部分序列。
a. 从网上下载目的基因的参考同源序列。
相关文档
最新文档