进化树(精美自制)PPT
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
始树是否有差异,以此评价建树的可靠性。 一般Bootstrap重复取样次数要大于100,根据
每个分支在不同此取样时出现的频率赋予该分 支一个百分比。 如果严格根据统计学概念,该百分比要大于95 %才认为该分支可信。在实际应用中该值大于 75%就认为可信。
A.重新取样(100-1000 time).
近邻归并法是由非加权分 组平均法(UPGMA)法 演变出的另一种常用的方 法,强调配对物种,由此 构造一棵分支长度总和最 小的树。
邻位归并法构建的进化树 相对准确,计算快捷。其 缺点是序列上的所有位点 都被同等对待,而且,所 分析的序列的进化距离不 能太大。
NJ-邻位归并法
从星状开始,首先连接两个相 邻的序列,并筛选出分支总长 最短的树,直到最后。
分子进化与系统发育分析软件
3.发生树构建演示
MEGA软件——系统发育树构建方法
然后,导入需要构建系统进化树的序列:
பைடு நூலகம்
点击OK:
如果是 DNA 序列,点击 DNA,如果是蛋白序列, 点击 Protein。
出现新的对话框,创建新的数据文件
如果是 DNA 序列,点击 DNA,如果是蛋白序列, 点击 Protein。
基因进化树的定义
基因进化树是基于核酸或蛋白序列构建 的进化树——分子进化树。 绘制基因进化树,对病毒的全长或部分 基因序列进行同源性比较与分型,有助探讨 病毒的分型,不同地方株的亲缘关系,传染 的来源与流行关系等方面的问题。
边 节点
进化树的基本概念
分类单位 (基因、蛋 白、形态等) 用于进化树 的构建
分枝
末端节点
代表分类单位 (基因、蛋白、 形态等)用于 进化树的构建
外部节点或树根
(代表此树的同 一祖先)
内部节点或分枝点
(代表分类单位的假 设祖先)
系统发生树可分为有根树和无根树
Ⅰ
ⅡⅢ ⅣⅤ
Ⅰ
Ⅱ
Ⅴ
Ⅲ
根
时间
Ⅳ
⑴ 有根树
⑵ 无根树
有根树种,单一的节点指派为共同的祖先,从祖先节点只有唯一的路 径进化到达其他任何节点。
导入成功
点击W,进行比对
比对完成后删除序列两端不能完全对齐的碱基。
点击系统发生分析。
然后,关闭该窗口,在弹出的对话框中选择保存 文件。
Bootstrap 选择 1000,点 Computer,开始计算
计算完毕后,生成系统发生树。
4.系统发生树应用
指导疾病的预防与治疗
指导疾病的临床治疗(HCV)
12345 100 1 : ATCTG…A 2 : ATCTG…C 3 : ACTTA…C 4 : ACCTA…T
12345 100 1 : AATTT…T 2 : AATTT…G 3 : AACTT…T 4 : AACTT…T
11244 x
12345 100 1 : TTTAT…T 2 : TAACC…G 3 : TAACC…T 4 : TGGGA…T
由于HCV基因1型用干扰素治疗的效果不佳。
病毒基因型分型对预防策略的影响(HEV)
净化环境,保 持水源清洁
给易感者接种 HEV疫苗
免食生肉
给猪接种HEV 疫苗,切断传 染源头。
净化环境,保 持水源清洁
给易感者接种 HEV疫苗
传染的来源
利用构建系统发生树的方法,可揭示时间 和地点相距较远的病毒分离株之间的同源 性,从而发现某一流行事件是过去流行株 复发还是从外界传入,对控制病毒的流行 具有重要意义。
指导疾病的预防(HEV genotype Ⅰ Ⅳ)
有助研究病毒的分子流行病学意义
揭示传染的来源
监控和预测
为疫苗的选定提供依据
基因分型对HCV临床治疗的指导意义
HCV(丙型肝炎病毒)基因分型及血清HCV RNA定量测定对于预治疗疗效及决定治疗方案有重 要意义。 非基因1型(2、3型)感染者用干扰素加小剂量 利巴韦林800mg/d治疗24周即可获得较好的疗效。 而基因1型者疗效较差(特别是病毒负荷较高者 ),应给予更长的疗程(48周),并需更大剂量的 利巴韦林(1000~1200mg/d)。
WHO每年根据系统发生树推荐流 感疫苗
WHO在全球有6个人流感参比 实验室( reference Lab ),2个 动物流感参比实验室。
对当年流行的毒株进行序列分 析(人流感/动物流感)。
选定当年主要流行分支的数种 根部毒株为预选疫苗。
评价预选疫苗的免疫原性和免 疫保护性——确定推荐疫苗株 。
Sp4
C. 计算各分支出现的可信度
Sp1 Sp2
Sp3 Sp4
Sp1 Sp2
Sp3 Sp4
Sp1
Sp2 Sp3
Sp4
67% 100%
Sp1 Sp2
Sp3 Sp4
In 67% of the data sets, the split between SP1+SP2 and the rest of the tree was found.
系统发生树的分析与应用
专业:流行病与卫生统计 方向:分子流行病学
主要内容
1
系统发生树的相关概念
2
发生树的构造与评价方法
3
发生树构建演示
4
系统发生树的应用
1.系统发生树的相关概念
系统发生树(Phylogenetic tree)又称为系统进化树,是 表明被认为具有共同祖先的各 物种间演化关系的树。用来描 述物种之间的进化关系。
Neighbor joining(NJ)邻位归并法
Character-based methods 基于特征的方法
Maximum parsimony(MP)最大简约法
Maximum likelihood method(ML)最大似然法
1/29/2020
7
基于距离的建树法
首先通过各个物种之间的比较,根据一定的假设 (进化距离模型)推导得出分类群之间的进化距 离,构建一个进化距离矩阵。进化树的构建则是 基于这个矩阵中的进化距离关系。
无根树只表明了节点之间的关系,而没有关于进化发生方向的信息。
2.系统发生树的构建方法
Distance-based methods 基于距离的方法
Unweightedpair group method using arithmetic average (UPGMA) 非加权分组平均法
Minimum evolution(ME)最小进化法
基于特征的建树方法
不计算序列间的距离,而是将序列中有差异的位 点作为单独的特征,并根据这些特征来建树。
ML-最大似然法
选取一个特定的替代模型来分析给定的一 组序列数据,使得获得的每一个拓扑结构 的似然率都为最大值,然后再挑出其中似 然率最大的拓扑结构作为最优树。
最大似然法的建树过程是个很费时的过程 ,因为在分析过程中有很大的计算量,每 个步骤都要考虑内部节点的所有可能性。
47789…x
12345 100 1 : AGGTA…T 2 : AGGAC…G 3 : AAAAC…A 4 : AAAGG…C
15578… x
B. 每组取样重建发生树。
12345 100
12345 100
1 : AATTT…T
1 : TTTAT…T
2 : AATTT…G
2 : TAACC…G
3 : AACTT…T
系统发生树构建方法的选择
系统发生树的可靠性
用截然不同的距离矩阵法与简约法分析一 个数据集,如果能够产生相似的系统发生 树,这样的树可以认为是可靠的
用Bootstrap(自展法)检验
Bootstrap-自展法
从排列的多序列中随机有放回的抽取某一列, 构成相同长度的新的排列序列。
重复上面的过程,得到多组新的序列。 对这些新的序列进行建树,再观察这些树与原
3 : TAACC…T
4 : AACTT…T
4 : TGGGA…T
11244 x
47789…x
12345 100 1 : AGGTA…T 2 : AGGAC…G 3 : AAAAC…A 4 : AAAGG…C
15578… x
Sp1 Sp2
Sp3 Sp4
Sp1 Sp2
Sp3 Sp4
Sp1
Sp2 Sp3
每个分支在不同此取样时出现的频率赋予该分 支一个百分比。 如果严格根据统计学概念,该百分比要大于95 %才认为该分支可信。在实际应用中该值大于 75%就认为可信。
A.重新取样(100-1000 time).
近邻归并法是由非加权分 组平均法(UPGMA)法 演变出的另一种常用的方 法,强调配对物种,由此 构造一棵分支长度总和最 小的树。
邻位归并法构建的进化树 相对准确,计算快捷。其 缺点是序列上的所有位点 都被同等对待,而且,所 分析的序列的进化距离不 能太大。
NJ-邻位归并法
从星状开始,首先连接两个相 邻的序列,并筛选出分支总长 最短的树,直到最后。
分子进化与系统发育分析软件
3.发生树构建演示
MEGA软件——系统发育树构建方法
然后,导入需要构建系统进化树的序列:
பைடு நூலகம்
点击OK:
如果是 DNA 序列,点击 DNA,如果是蛋白序列, 点击 Protein。
出现新的对话框,创建新的数据文件
如果是 DNA 序列,点击 DNA,如果是蛋白序列, 点击 Protein。
基因进化树的定义
基因进化树是基于核酸或蛋白序列构建 的进化树——分子进化树。 绘制基因进化树,对病毒的全长或部分 基因序列进行同源性比较与分型,有助探讨 病毒的分型,不同地方株的亲缘关系,传染 的来源与流行关系等方面的问题。
边 节点
进化树的基本概念
分类单位 (基因、蛋 白、形态等) 用于进化树 的构建
分枝
末端节点
代表分类单位 (基因、蛋白、 形态等)用于 进化树的构建
外部节点或树根
(代表此树的同 一祖先)
内部节点或分枝点
(代表分类单位的假 设祖先)
系统发生树可分为有根树和无根树
Ⅰ
ⅡⅢ ⅣⅤ
Ⅰ
Ⅱ
Ⅴ
Ⅲ
根
时间
Ⅳ
⑴ 有根树
⑵ 无根树
有根树种,单一的节点指派为共同的祖先,从祖先节点只有唯一的路 径进化到达其他任何节点。
导入成功
点击W,进行比对
比对完成后删除序列两端不能完全对齐的碱基。
点击系统发生分析。
然后,关闭该窗口,在弹出的对话框中选择保存 文件。
Bootstrap 选择 1000,点 Computer,开始计算
计算完毕后,生成系统发生树。
4.系统发生树应用
指导疾病的预防与治疗
指导疾病的临床治疗(HCV)
12345 100 1 : ATCTG…A 2 : ATCTG…C 3 : ACTTA…C 4 : ACCTA…T
12345 100 1 : AATTT…T 2 : AATTT…G 3 : AACTT…T 4 : AACTT…T
11244 x
12345 100 1 : TTTAT…T 2 : TAACC…G 3 : TAACC…T 4 : TGGGA…T
由于HCV基因1型用干扰素治疗的效果不佳。
病毒基因型分型对预防策略的影响(HEV)
净化环境,保 持水源清洁
给易感者接种 HEV疫苗
免食生肉
给猪接种HEV 疫苗,切断传 染源头。
净化环境,保 持水源清洁
给易感者接种 HEV疫苗
传染的来源
利用构建系统发生树的方法,可揭示时间 和地点相距较远的病毒分离株之间的同源 性,从而发现某一流行事件是过去流行株 复发还是从外界传入,对控制病毒的流行 具有重要意义。
指导疾病的预防(HEV genotype Ⅰ Ⅳ)
有助研究病毒的分子流行病学意义
揭示传染的来源
监控和预测
为疫苗的选定提供依据
基因分型对HCV临床治疗的指导意义
HCV(丙型肝炎病毒)基因分型及血清HCV RNA定量测定对于预治疗疗效及决定治疗方案有重 要意义。 非基因1型(2、3型)感染者用干扰素加小剂量 利巴韦林800mg/d治疗24周即可获得较好的疗效。 而基因1型者疗效较差(特别是病毒负荷较高者 ),应给予更长的疗程(48周),并需更大剂量的 利巴韦林(1000~1200mg/d)。
WHO每年根据系统发生树推荐流 感疫苗
WHO在全球有6个人流感参比 实验室( reference Lab ),2个 动物流感参比实验室。
对当年流行的毒株进行序列分 析(人流感/动物流感)。
选定当年主要流行分支的数种 根部毒株为预选疫苗。
评价预选疫苗的免疫原性和免 疫保护性——确定推荐疫苗株 。
Sp4
C. 计算各分支出现的可信度
Sp1 Sp2
Sp3 Sp4
Sp1 Sp2
Sp3 Sp4
Sp1
Sp2 Sp3
Sp4
67% 100%
Sp1 Sp2
Sp3 Sp4
In 67% of the data sets, the split between SP1+SP2 and the rest of the tree was found.
系统发生树的分析与应用
专业:流行病与卫生统计 方向:分子流行病学
主要内容
1
系统发生树的相关概念
2
发生树的构造与评价方法
3
发生树构建演示
4
系统发生树的应用
1.系统发生树的相关概念
系统发生树(Phylogenetic tree)又称为系统进化树,是 表明被认为具有共同祖先的各 物种间演化关系的树。用来描 述物种之间的进化关系。
Neighbor joining(NJ)邻位归并法
Character-based methods 基于特征的方法
Maximum parsimony(MP)最大简约法
Maximum likelihood method(ML)最大似然法
1/29/2020
7
基于距离的建树法
首先通过各个物种之间的比较,根据一定的假设 (进化距离模型)推导得出分类群之间的进化距 离,构建一个进化距离矩阵。进化树的构建则是 基于这个矩阵中的进化距离关系。
无根树只表明了节点之间的关系,而没有关于进化发生方向的信息。
2.系统发生树的构建方法
Distance-based methods 基于距离的方法
Unweightedpair group method using arithmetic average (UPGMA) 非加权分组平均法
Minimum evolution(ME)最小进化法
基于特征的建树方法
不计算序列间的距离,而是将序列中有差异的位 点作为单独的特征,并根据这些特征来建树。
ML-最大似然法
选取一个特定的替代模型来分析给定的一 组序列数据,使得获得的每一个拓扑结构 的似然率都为最大值,然后再挑出其中似 然率最大的拓扑结构作为最优树。
最大似然法的建树过程是个很费时的过程 ,因为在分析过程中有很大的计算量,每 个步骤都要考虑内部节点的所有可能性。
47789…x
12345 100 1 : AGGTA…T 2 : AGGAC…G 3 : AAAAC…A 4 : AAAGG…C
15578… x
B. 每组取样重建发生树。
12345 100
12345 100
1 : AATTT…T
1 : TTTAT…T
2 : AATTT…G
2 : TAACC…G
3 : AACTT…T
系统发生树构建方法的选择
系统发生树的可靠性
用截然不同的距离矩阵法与简约法分析一 个数据集,如果能够产生相似的系统发生 树,这样的树可以认为是可靠的
用Bootstrap(自展法)检验
Bootstrap-自展法
从排列的多序列中随机有放回的抽取某一列, 构成相同长度的新的排列序列。
重复上面的过程,得到多组新的序列。 对这些新的序列进行建树,再观察这些树与原
3 : TAACC…T
4 : AACTT…T
4 : TGGGA…T
11244 x
47789…x
12345 100 1 : AGGTA…T 2 : AGGAC…G 3 : AAAAC…A 4 : AAAGG…C
15578… x
Sp1 Sp2
Sp3 Sp4
Sp1 Sp2
Sp3 Sp4
Sp1
Sp2 Sp3