第七章分子系统发育分析 进化树
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大分子功能与结构的分析:同一家族的大分子, 具有相似的三级结构及生化功能,通过序列同源 性分析,构建系统发育树,进行相关分析;功能 预测
进化速率分析:例如,HIV的高突变性;哪些位 点易发生突变?
研究分子进化的作用
Tree of Life: 16S rRNA
研究分子进化的作用
Out of Africa
分子途径研究生物进化的可行性
普适性
由4种核酸组成
分子水平的进化表现为:DNA序列的演化、氨基酸序列演化、 蛋白质结构及功能的演化
可比较性
比较不同物种的有关DNA序列
建立DNA序列的演化模型、氨基酸序列的演化模型
蛋白质结构的演化模型
基因组包含丰富的编码信息
与形态、性状包含的信息相比,基因组序列、蛋白质序 列包含更多、更复杂的信息结构
在分析的序列位点上没有回复突变或平行突变,且被检验 的序列位点数很大的时候,最大简约法能够推导获得一个 很好的进化树
旁系同源(paralogs): 同源的基因是由于基因复制产生的。 用于分子进化分析中的序列必须是直系同源的,才能真实
反映进化过程。
旁系同源
直系同源
系统进化树的种类
拓扑结构:
有根树: 反映时间顺序
——有根树、无根树
bacteria outgroup外围支
root
archaea archaea archaea
2. 颠换:嘌呤被嘧啶 替代,或者嘧啶被嘌 呤替代
(2)基因复制:单个基因复制
重组 逆转录
(2)基因复制:染色体片段复制
狒狒 人
(2)基因复制:基因组复制
S. Cerevisiae (酿酒酵母) K. Waltii (克鲁雄酵母)
研究结果: 克鲁雄酵母 中的同源基 因数量与酿 酒酵母相比 为1:2
a bc
de f
系统进化树的构建
构建系统进化树的步骤 构建系统进化树的方法 构建进化树的一般原则
构建系统进化树的步骤
多序列比对(自动比对,手工校正) 选择建树方法以及替代模型 建立进化树 进化树评估
构建系统进化树的方法
1. 最大简约法 (maximum parsimony, MP)
适用序列有很高相似性时
2、许多不同物种的多种同源大分子在相当长时间内的 平均进化速率近似恒定。
建立分子钟的大致步骤
1、选择所要比较的生物大分子种类
根据具体研究目标和已掌握的资料,选择进化速率相对恒定、速率 大小合适、分布范围能涵盖各待比较物种的生物大分子。
2、选择所要比较的物种,确定各比较组合及其所代表的进 化事件
3、获得生物大分子一级结构的资料
Eukaryote 4
系统进化树的种类
——物种树、基因树
物种树:代表一个物种或 群体进化历史的系统进化 树,两个物种分歧的时间 为两个物种发生生殖隔离 的时间
基因树:由来自各个物种 的一个基因构建的系统进 化树(不完全等同于物种 树),表示基因分离的时 间。
基因分裂
基因分裂 基因分裂 物种分裂
ACC TAT TGC TGThr Tyr Cys -
ACC TAC TTT GCT G Thr Tyr Phe Ala
倒位 Thr Tyr Leu Leu ACC TAT TTG CTG
ACC TTT ATG CTG Thr Phe Met Leu
核苷酸替代:转换 & 颠换
1. 转换:嘌呤被嘌呤 替代,或者嘧啶被嘧 啶替代
第七章 分子系统发育分析
姚正培 yao_zp@163.com
本章内容
引言 生物进化的分子机制 系统进化树及其构建 分子系统发育分析软件及应用
引言
生物学家:We have a dream…
Tree of Life: 重建所有生物的进化历史并以系统树的形 式加以描述
引言
梦想走进现实:How?
核苷酸
例:DNA密码子的同义替代频率高于非同义替代频率;内含子上的核 苷酸替代频率较高。
脯氨酸P
组氨酸H
TGG
色氨酸W
GTT GTC GTA GTG
CGT CGC
TGC
半胱氨酸C
研究分子进化的作用
从物种的一些分子特性出发,构建系统发育树, 进而了解物种之间的生物系统发生的关系 —— tree of life; 物种分类
2. 距离法 (distance)
适用序列有较高相似性时
3. 最大似然法 (maximum likelihood, ML)
可用于任何相关序列集合
计算速度:
距离法 >最大简约法 >最大似然法
构建系统进化树的方法 ——最大简约法(MP)
理论基础为奥卡姆 (Ockham)原则:计算所需替代数最小 的那个拓扑结构,作为最优树
4、获得有关的代表性进化事件发生的地质时间数据
5、通过比较大分子一级结构,选择合适的数学模型,计算 得到进化产生的分子差异d,通过回归分析等统计方法得到 大分子的进化速率r(t)
6、由此可以推断未知进化事件的发生时间
Example: Molecular clock for 17 mammal species
A. 单个基因复制 – 重组或者逆转录 B. 染色体片断复制 C. 基因组复制
(1) DNA突变
替代
插入
Thr Tyr Leu Leu
Thr Tyr Leu Leu
ACC TAT TTG CTG
ACC TAT TTG CTG
ACC TCT TTG CTG Thr Ser Leu Leu
缺失 Thr Tyr Leu Leu ACC TAT TTG CTG
基本假设 核酸和蛋白质序列中含有生物进化历史的全部信息
理论 分子进化速率恒定。 分子钟:物种的同源基因之间的差异程度与它们的共同祖先 的存在时间(即两者的分歧时间)有一定的数量关系。
发生在分子层面的进化过程:DNA, RNA和蛋白质分子
引言
分子钟成立的证据:
1、至少某些生物大分子(如珠蛋白)的进化速率在相 当长的地质时间内的相对稳定、均匀;
A
B
C
D 祖先节点/树根
内部节点/分歧点,该
E
分支可能的祖先节点
系统进化树的概念
进化树分支的图像称为进化的拓扑结构 理论上,一个DNA序列在物种形成或基因复制时,
分裂成两个子序列,因此系统进化树一般是二歧 的。
A BC D F G E†
D C F GA B E†
系统进化树的概念
直系同源(orthologs): 同源的基因是由于共同的祖先基因 进化而产生的。
最理想的方法:化石!—— 零散、不完整
引言
梦想走进现实:How?
比较形态学和比较生理学:确定大致的进化框架 —— 细节存很多的争议
引言
梦想走进现实:How?
第三种方案:分子进化
1964年,美国进化生物学家 E. Zuckerkandl和 量子化学家 Linus Pauling提出分子进化理论
phylogenetic tree/evolutionary tree 系统进化树/生物进化树/系统发育树/系统发生树/系统
树/进化树/演化树 是表明被认为具有共同祖先的各物种相互间进化关系的
树形图。
系统进化树的概念——术语
分支/世系:长度对应 演化距离(如估计的 演化时间)
末端节点:代表最终分类, 可以是物种,群体,或者蛋 白质、DNA、RNA分子等
关于分子钟的讨论和争议
1、对长期进化而言,不存在以恒定速率替换的生物大分子 一级结构;(基因功能的改变、基因数目的增加)
2、不存在通用的分子钟;
3、争议: 分子钟的准确性 中性理论(分子钟成立的基础)
第一节 生物进化的分子机制
分子途经研究生物进化的可行性 分子进化的模式 分子进化的特点 研究分子进化的作用
eukaryote eukaryote
eukaryote eukaryote
无根树: 反映距离
archaea
archaea
archaea
eukaryote
eukaryote eukaryote
eukaryote
a b c da c b da d b c a b c da c b d a d b c b a c db c a d b a a c c a b dc b a d c d a b d a b cd b a c d c a b
分子进化速率远远比表型进化速率稳定
生物大分子进化的保守性
保守性
功能上重要的大分子或大分子的局部在进化速率上明显低于那些在功 能上不重要的大分子或者大分子局部。
(引起表型发生显著改变的突变发生的频率要低于无明显表型发生显 著改变得突变发生的频率。)
氨基酸
例:血红蛋白分子的外区的功能要次于内区的功能,外区的进化速率 是内区进化速率的10倍。
Inferred pairwise nucleotide substitutions among 17 mammal species from seven gene products, as estimated from protein studies, plotted against date of divergence, as estimated from the fossil record. The line is drawn from the origin through the oldest point (marsupial / placental divergence at 125 MYBP). The strong linear relationship suggests that molecular differences between pairs of species are proportional to the time of their separation, rather than the degree of organismal difference. Therefore, measures of genetic divergence can be used to date the time of divergence for species pairs for which no fossil data are available: genes function as Molecular Clocks. (from A. C. Wilson 1976)
分子进化的特点
生物大分子进化速率相对恒定
分子进化速率 生物大分子随时间的改变而变化,主要表现为核苷酸、蛋
白质的一级结构的改变,即分子序列中核苷酸、氨基酸的替换
不同物种同源大分子的分子进化速率大体相同 例子:比较不同物种血红蛋白氨基酸序列差异
人、马——0.810-9/AA.a 人、鲤鱼——0.610-9/AA.a
系统进化树的种类
——标度树、非标度树
标度树:分支的 长度表示变化的 程度
Bacterium 1
Bacterium 2
一个单位
Bacterium 3
Eukaryote 1
Eukaryote 2
Eukaryote 3
Eukaryote 4
非标度树:分支 只表示进化关系, 支长无意义
Bacterium 1 Bacterium 2 Bacterium 3 Eukaryote 1 Eukaryote 2 Eukaryote 3
分子进化的模式
1、核苷酸替代、插 入/缺失、重组 2、基因复制
基因变异
遗传漂变 自然选择
固定在生物个体 以及物种内
产生新的形态、性状
传递给后代
分子进化的模式
1. DNA突变:替代,插入,缺失,倒位
核苷酸替代:转换 (Transition) & 颠换 (Transversion)
2. 基因复制:多基因家族的产生以及伪基因的产生
考虑4个分类群时,共有15种可能的有根树
a
ca
b
b
dc
d
a
b
d
c
考虑4个分类群时,共有3种可能的无根树
系统进化树的种类
——有根树、无根树
#Taxa
3 4 5 6 7 … 30
无根树
1 3 15 105 945
有根树
3 15Байду номын сангаас105 945 10,395
~3.58X1036 ~2.04X1038
Taxa增多,计算量急剧增加,选出真实树的拓扑结构十分困 难,因此,目前算法都为优化算法,不能保证最优解。
53个人的线粒体基因组(16,587bp)
人类迁移的路线
第二节 系统进化树及其构建
系统进化树的概念 系统进化树的种类 系统进化树的构建
系统进化树的概念
所有生物都可以追溯 到共同的祖先,生物 的产生和分化就像树 一样生长、分叉,以 树的形式来表示生物 之间的进化关系是非 常自然的事。
系统进化树的概念
进化速率分析:例如,HIV的高突变性;哪些位 点易发生突变?
研究分子进化的作用
Tree of Life: 16S rRNA
研究分子进化的作用
Out of Africa
分子途径研究生物进化的可行性
普适性
由4种核酸组成
分子水平的进化表现为:DNA序列的演化、氨基酸序列演化、 蛋白质结构及功能的演化
可比较性
比较不同物种的有关DNA序列
建立DNA序列的演化模型、氨基酸序列的演化模型
蛋白质结构的演化模型
基因组包含丰富的编码信息
与形态、性状包含的信息相比,基因组序列、蛋白质序 列包含更多、更复杂的信息结构
在分析的序列位点上没有回复突变或平行突变,且被检验 的序列位点数很大的时候,最大简约法能够推导获得一个 很好的进化树
旁系同源(paralogs): 同源的基因是由于基因复制产生的。 用于分子进化分析中的序列必须是直系同源的,才能真实
反映进化过程。
旁系同源
直系同源
系统进化树的种类
拓扑结构:
有根树: 反映时间顺序
——有根树、无根树
bacteria outgroup外围支
root
archaea archaea archaea
2. 颠换:嘌呤被嘧啶 替代,或者嘧啶被嘌 呤替代
(2)基因复制:单个基因复制
重组 逆转录
(2)基因复制:染色体片段复制
狒狒 人
(2)基因复制:基因组复制
S. Cerevisiae (酿酒酵母) K. Waltii (克鲁雄酵母)
研究结果: 克鲁雄酵母 中的同源基 因数量与酿 酒酵母相比 为1:2
a bc
de f
系统进化树的构建
构建系统进化树的步骤 构建系统进化树的方法 构建进化树的一般原则
构建系统进化树的步骤
多序列比对(自动比对,手工校正) 选择建树方法以及替代模型 建立进化树 进化树评估
构建系统进化树的方法
1. 最大简约法 (maximum parsimony, MP)
适用序列有很高相似性时
2、许多不同物种的多种同源大分子在相当长时间内的 平均进化速率近似恒定。
建立分子钟的大致步骤
1、选择所要比较的生物大分子种类
根据具体研究目标和已掌握的资料,选择进化速率相对恒定、速率 大小合适、分布范围能涵盖各待比较物种的生物大分子。
2、选择所要比较的物种,确定各比较组合及其所代表的进 化事件
3、获得生物大分子一级结构的资料
Eukaryote 4
系统进化树的种类
——物种树、基因树
物种树:代表一个物种或 群体进化历史的系统进化 树,两个物种分歧的时间 为两个物种发生生殖隔离 的时间
基因树:由来自各个物种 的一个基因构建的系统进 化树(不完全等同于物种 树),表示基因分离的时 间。
基因分裂
基因分裂 基因分裂 物种分裂
ACC TAT TGC TGThr Tyr Cys -
ACC TAC TTT GCT G Thr Tyr Phe Ala
倒位 Thr Tyr Leu Leu ACC TAT TTG CTG
ACC TTT ATG CTG Thr Phe Met Leu
核苷酸替代:转换 & 颠换
1. 转换:嘌呤被嘌呤 替代,或者嘧啶被嘧 啶替代
第七章 分子系统发育分析
姚正培 yao_zp@163.com
本章内容
引言 生物进化的分子机制 系统进化树及其构建 分子系统发育分析软件及应用
引言
生物学家:We have a dream…
Tree of Life: 重建所有生物的进化历史并以系统树的形 式加以描述
引言
梦想走进现实:How?
核苷酸
例:DNA密码子的同义替代频率高于非同义替代频率;内含子上的核 苷酸替代频率较高。
脯氨酸P
组氨酸H
TGG
色氨酸W
GTT GTC GTA GTG
CGT CGC
TGC
半胱氨酸C
研究分子进化的作用
从物种的一些分子特性出发,构建系统发育树, 进而了解物种之间的生物系统发生的关系 —— tree of life; 物种分类
2. 距离法 (distance)
适用序列有较高相似性时
3. 最大似然法 (maximum likelihood, ML)
可用于任何相关序列集合
计算速度:
距离法 >最大简约法 >最大似然法
构建系统进化树的方法 ——最大简约法(MP)
理论基础为奥卡姆 (Ockham)原则:计算所需替代数最小 的那个拓扑结构,作为最优树
4、获得有关的代表性进化事件发生的地质时间数据
5、通过比较大分子一级结构,选择合适的数学模型,计算 得到进化产生的分子差异d,通过回归分析等统计方法得到 大分子的进化速率r(t)
6、由此可以推断未知进化事件的发生时间
Example: Molecular clock for 17 mammal species
A. 单个基因复制 – 重组或者逆转录 B. 染色体片断复制 C. 基因组复制
(1) DNA突变
替代
插入
Thr Tyr Leu Leu
Thr Tyr Leu Leu
ACC TAT TTG CTG
ACC TAT TTG CTG
ACC TCT TTG CTG Thr Ser Leu Leu
缺失 Thr Tyr Leu Leu ACC TAT TTG CTG
基本假设 核酸和蛋白质序列中含有生物进化历史的全部信息
理论 分子进化速率恒定。 分子钟:物种的同源基因之间的差异程度与它们的共同祖先 的存在时间(即两者的分歧时间)有一定的数量关系。
发生在分子层面的进化过程:DNA, RNA和蛋白质分子
引言
分子钟成立的证据:
1、至少某些生物大分子(如珠蛋白)的进化速率在相 当长的地质时间内的相对稳定、均匀;
A
B
C
D 祖先节点/树根
内部节点/分歧点,该
E
分支可能的祖先节点
系统进化树的概念
进化树分支的图像称为进化的拓扑结构 理论上,一个DNA序列在物种形成或基因复制时,
分裂成两个子序列,因此系统进化树一般是二歧 的。
A BC D F G E†
D C F GA B E†
系统进化树的概念
直系同源(orthologs): 同源的基因是由于共同的祖先基因 进化而产生的。
最理想的方法:化石!—— 零散、不完整
引言
梦想走进现实:How?
比较形态学和比较生理学:确定大致的进化框架 —— 细节存很多的争议
引言
梦想走进现实:How?
第三种方案:分子进化
1964年,美国进化生物学家 E. Zuckerkandl和 量子化学家 Linus Pauling提出分子进化理论
phylogenetic tree/evolutionary tree 系统进化树/生物进化树/系统发育树/系统发生树/系统
树/进化树/演化树 是表明被认为具有共同祖先的各物种相互间进化关系的
树形图。
系统进化树的概念——术语
分支/世系:长度对应 演化距离(如估计的 演化时间)
末端节点:代表最终分类, 可以是物种,群体,或者蛋 白质、DNA、RNA分子等
关于分子钟的讨论和争议
1、对长期进化而言,不存在以恒定速率替换的生物大分子 一级结构;(基因功能的改变、基因数目的增加)
2、不存在通用的分子钟;
3、争议: 分子钟的准确性 中性理论(分子钟成立的基础)
第一节 生物进化的分子机制
分子途经研究生物进化的可行性 分子进化的模式 分子进化的特点 研究分子进化的作用
eukaryote eukaryote
eukaryote eukaryote
无根树: 反映距离
archaea
archaea
archaea
eukaryote
eukaryote eukaryote
eukaryote
a b c da c b da d b c a b c da c b d a d b c b a c db c a d b a a c c a b dc b a d c d a b d a b cd b a c d c a b
分子进化速率远远比表型进化速率稳定
生物大分子进化的保守性
保守性
功能上重要的大分子或大分子的局部在进化速率上明显低于那些在功 能上不重要的大分子或者大分子局部。
(引起表型发生显著改变的突变发生的频率要低于无明显表型发生显 著改变得突变发生的频率。)
氨基酸
例:血红蛋白分子的外区的功能要次于内区的功能,外区的进化速率 是内区进化速率的10倍。
Inferred pairwise nucleotide substitutions among 17 mammal species from seven gene products, as estimated from protein studies, plotted against date of divergence, as estimated from the fossil record. The line is drawn from the origin through the oldest point (marsupial / placental divergence at 125 MYBP). The strong linear relationship suggests that molecular differences between pairs of species are proportional to the time of their separation, rather than the degree of organismal difference. Therefore, measures of genetic divergence can be used to date the time of divergence for species pairs for which no fossil data are available: genes function as Molecular Clocks. (from A. C. Wilson 1976)
分子进化的特点
生物大分子进化速率相对恒定
分子进化速率 生物大分子随时间的改变而变化,主要表现为核苷酸、蛋
白质的一级结构的改变,即分子序列中核苷酸、氨基酸的替换
不同物种同源大分子的分子进化速率大体相同 例子:比较不同物种血红蛋白氨基酸序列差异
人、马——0.810-9/AA.a 人、鲤鱼——0.610-9/AA.a
系统进化树的种类
——标度树、非标度树
标度树:分支的 长度表示变化的 程度
Bacterium 1
Bacterium 2
一个单位
Bacterium 3
Eukaryote 1
Eukaryote 2
Eukaryote 3
Eukaryote 4
非标度树:分支 只表示进化关系, 支长无意义
Bacterium 1 Bacterium 2 Bacterium 3 Eukaryote 1 Eukaryote 2 Eukaryote 3
分子进化的模式
1、核苷酸替代、插 入/缺失、重组 2、基因复制
基因变异
遗传漂变 自然选择
固定在生物个体 以及物种内
产生新的形态、性状
传递给后代
分子进化的模式
1. DNA突变:替代,插入,缺失,倒位
核苷酸替代:转换 (Transition) & 颠换 (Transversion)
2. 基因复制:多基因家族的产生以及伪基因的产生
考虑4个分类群时,共有15种可能的有根树
a
ca
b
b
dc
d
a
b
d
c
考虑4个分类群时,共有3种可能的无根树
系统进化树的种类
——有根树、无根树
#Taxa
3 4 5 6 7 … 30
无根树
1 3 15 105 945
有根树
3 15Байду номын сангаас105 945 10,395
~3.58X1036 ~2.04X1038
Taxa增多,计算量急剧增加,选出真实树的拓扑结构十分困 难,因此,目前算法都为优化算法,不能保证最优解。
53个人的线粒体基因组(16,587bp)
人类迁移的路线
第二节 系统进化树及其构建
系统进化树的概念 系统进化树的种类 系统进化树的构建
系统进化树的概念
所有生物都可以追溯 到共同的祖先,生物 的产生和分化就像树 一样生长、分叉,以 树的形式来表示生物 之间的进化关系是非 常自然的事。
系统进化树的概念