系统进化树的构建_图文PPT精品文档36页
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
进化拓扑结构: 进化树中不同枝的拓扑图形。
根:所有分类的共同祖先。 结点:表示一个分类单元。
进化支:两种以上生物(DNA序 列)及其祖先组成的树枝。
结点
结点
人
进化支
猩 猩
进化分支:进化关系的图形表示 进化分支长度:
用数值表示的进化枝的变化程度 (遗传距离) 距离标尺:
生物体或序列之间差异的的 数字 尺度。 外群:
分子系统发育分析
• 系统发育分析研究是研究物种进化和系统 分类的一种方法,研究对象为携带遗传信 息的生物大分子序列,采用特定的数理统 计算法来计算生物间的进化关系。并用系 统进化树,即一种类似树枝状得图形来概 括生物间的这种亲缘关系。
分子系统发育分析
• 系统发育进化树( Phylogenetic tree)
用一种类似树状分支的图形来概括各种生物之间的亲缘关系。
• 系统进化树的主要构成:
结点(node):每个结点表示一个分类单元(属、种群)。 进化分枝(Clade): 是指由同一生物进化而来的单一系统群。 实体抽象为节点,实体间的进化关系抽象为连接
分子系统发育的核心为构建系统发育进化树
系统进化树(1)
在生物信息学中,FASTA格式(又称为Pearson格式),是一种基于文本 用于表示核苷酸序列或氨基酸序列的格式。在这种格式中碱基对或氨基 酸用单个字母来编码,且允许在序列前添加序列名及注释。序列文件的 第一行是由大于号“>”或分号“;”打头的任意文字说明(习惯常用“>” 作为起始),用于序列标记。从第二行开始为序列本身,只允许使用既 定的核苷酸或氨基酸编码符号。
与分析序列相关的生物序列且具 有较远的亲缘关系
根
分支 长度 狒
狒
一个单位
距离标尺
外群
系统发育进化树示例
系统发育树重建分析步骤
多序列比对(自动比对,手工校正) 选择建树方法 建立进化树 进化树评估
系统发育树重建的基本方法
• 1. 距离法 (distance)
适用序列有较高相似性时
• 2. 最大简约法 (maximum parsimony, MP)
•实例讲解
点击 Do Complete Alignment,选择保存路径之后点击ALIGN,。
•实例讲解
序列比对结束后,比对结果自动跳出。在保存的路径,获取 预设的保存格式。Bannavirus.FASTA Bannavirus.phy
•实例讲解_MEGA软件构建系统进化树
• MEGA (Molecular Evolutionary Genetics Analysis) 该软件是由Kumar等编写的进行分子进化遗传分析的免 费软件包,Βιβλιοθήκη Baidu对DNA、mRNA、氨基酸序列及遗传距离进 行系统发生分析。在建树方法上,提供了目前最常用的 UPGMA,ML,NJ及MP法,对所获得树也可进自举值检验 及标准误估计可靠性检验。
• 构建MP树,可以使用PHYLIP或者MEGA
• 构建ML树可以使用PHYML,速度快,同时构建ML树还可以用 PHYLIP,
• 贝叶斯的算法以MrBayes为代表,不过速度比较慢
关于系统发育分析的更多知识请参阅: bioon/biology/bioinfo2/78842.shtml
•实例讲解
下面的内容将教大家如何来构建自己的系统进化树。 首先我们需要回忆一个很重要的问题,什么是Fasta 格式?
•实例讲解
文件下载完之后,这里我们采用事先准备好的序列。 将Fasta 文件直接用 ClustalX 1.83打开
•实例讲解
在进行多序列比对之前我们需要对软件进行一些设置
1.选择Alignment标签 2.选择Output format options
PHYLIP软件:PHYLIP MEGA软件:FASTA
优点为:简单易用
最新版本下载/地址为:http:/megasoftware
•实例讲解
下一步我们将介绍如何用MEGA构建我们的进化树,首先请大 家用MEGA软件将我们之前保留的Fasta文件打开这时候会有 两个窗口,选择File标签-->Convert file format to Mega.
工具条
• ClustalX (序列比对软件)
• Modeltest&MrModeltest(碱基替换模型筛选软件)
• PHYLIP
• MEGA
• PHYML
系统发育树构建软件
• PAUP
• BEAST
• Figtree (树形显示软件)
• TreeView (树形显示软件)
• 构建NJ树,可以用PHYLIP或者MEGA
菜单栏
•实例讲解
选择File标签-->Convert file format to Mega.
当给出相应的文件路径之后点击ok
显示文件已经转化为MEGA Format, 点击OK. 将文件保存,牢记路径
•实例讲解
点击,载入MEGA格式的分析序列
•实例讲解
选择数据类型,在本次测试中我们 用的是核苷酸序列。
适用序列有很高相似性时
• 3. 最大似然法 (maximum likelihood, ML)
– 可用于任何相关序列集合
1. 基于序列距离特征
2+3基于序列离散特征
• 计算速度:
– 距离法 >最大简约法 >最大似然法
系统发育树重建分析过程
直系同源序列 合理的外群
点阵法
动态规划法
字串法
系统发育树构建的相关软件
• 构建我们自己的Fasta 文件
Fasta文件是直接可以从数 据库中下载得到的,但是 根据实际要求的不同,有 时候我们需要自己构建 Fasta文件。 如果您已近有了想用来构 建进化树的序列,您可以 如右图所示构建自己的文 件,文件的保存格式是: 文件名.txt
•实例讲解
下面我们以版纳病毒为例,构建系统进化树。 首先我们要下载我们所需的序列。 ncbi.nlm.nih.gov/
根据实际的情况我 们这里选择YES选项
•实例讲解
下一步进入建树的最后阶段
参数设置好之后点 击compute.
在Plylogeny中选择建树方 法,这里我们选择NJ法。
蛋白质序列一般选择Poisson Correction(泊松校正),对 于核苷酸序列一般采用Pdistance模型
•实例讲解
根据Mega的计算最终我们得到了序列中的进化关系。
99 BANNAch 68 BJ9575 100 YN6