系统进化树的构建_图文
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 第一步:双击打开PART 2,SEQBOOT , • SEQBOOT生产随机样本的程序。
• 按路径输入刚才生成的 *.PHY文件;为了避免输入路径的繁 琐,可以直接将文件COPY至PART2文件夹中。
• 第二步:点击回车,出现参数设置页面。设定适当参 数;输出outfile文件。
• 第二步:设置参数后,输入Y。出现Random number seed 设置提示行。
•实例讲解
点击 Do Complete Alignment,选择保存路径之后点击ALIGN,。
•实例讲解
序列比对结束后,比对结果自动跳出。在保存的路径,获取 预设的保存格式。Bannavirus.FASTA Bannavirus.phy
•实例讲解_MEGA软件构建系统进化树
• MEGA (Molecular Evolutionary Genetics Analysis) 该软件是由 Kumar 等编写的进行分子进化遗传分析的免 费软件包,能对 DNA 、 mRNA 、氨基酸序列及遗传距离进 行系统发生分析。在建树方法上,提供了目前最常用的 UPGMA , ML , NJ 及 MP 法,对所获得树也可进自举值检验 及标准误估计可靠性检验。
优点为:简单易用
最新版本下载/地址为:http:/www.megasoftware.net
•实例讲解
下一步我们将介绍如何用MEGA构建我们的进化树,首先请大 家用MEGA软件将我们之前保留的Fasta文件打开这时候会有 两个窗口,选择File标签-->Convert file format to Mega.
进化拓扑结构: 进化树中不同枝的拓扑图形。 根:所有分类的共同祖先。 结点:表示一个分类单元。 进化支:两种以上生物(DNA序 列)及其祖先组成的树枝。 进化分支:进化关系的图形表示 进化分支长度: 用数值表示的进化枝的变化程度 (遗传距离) 距离标尺: 生物体或序列之间差异的的 数字 尺度。 外群: 与分析序列相关的生物序列且具 有较远的亲缘关系 结 点
用一种类似树状分支的图形来概括各种生物之间的亲缘关系。
• 系统进化树的主要构成:
结点(node):每个结点表示一个分类单元(属、种群)。 进化分枝(Clade): 是指由同一生物进化而来的单一系统群。 实体抽象为节点,实体间的进化关系抽象为连接
分子系统发育的核心为构建系统发育进化树
系统进化树(1)
人
进化支
结点
猩 猩
根
一个单位
分支 长度
狒 狒
距离标尺
外 群
系统发育进化树示例
系统发育树重建分析步骤
多序列比对(自动比对,手工校正)
选择建树方法
建立进化树
进化树评估
系统发育树重建的基本方法
• 1. 距离法 (distance)
适用序列有较高相似性时
• 2. 最大简约法 (maximum parsimony, MP)
ห้องสมุดไป่ตู้
Random number seed :进化树进行抽样时从第几棵树开始。
将抽样过得序列转换
• DNADIST
超级神相 http://www.38660.com/
獿溄攡
菜单栏
工具条
•实例讲解
选择File标签-->Convert file format to Mega.
当给出相应的文件路径之后点击ok
显示文件已经转化为MEGA Format, 点击OK. 将文件保存,牢记路径
•实例讲解
点击,载入MEGA格式的分析序列
•实例讲解
选择数据类型,在本次测试中我们 用的是核苷酸序列。
• 贝叶斯的算法以MrBayes为代表,不过速度比较慢
关于系统发育分析的更多知识请参阅: http://www.bioon.com/biology/bioinfo2/78842.shtml
•实例讲解
下面的内容将教大家如何来构建自己的系统进化树。 首先我们需要回忆一个很重要的问题,什么是Fasta 格式? 在生物信息学中, FASTA 格式(又称为 Pearson 格式),是一种基于文本 用于表示核苷酸序列或氨基酸序列的格式。在这种格式中碱基对或氨基 酸用单个字母来编码,且允许在序列前添加序列名及注释。序列文件的 第一行是由大于号“>”或分号“;”打头的任意文字说明(习惯常用“>” 作为起始),用于序列标记。从第二行开始为序列本身,只允许使用既 定的核苷酸或氨基酸编码符号。
99 BANNAch 68 100 88
BJ9575 YN6 YN0556 LN0684
100 LN0688 81 LN0689
JKT6969
100 94
JKT6423 JKT7043 LNVNE9712
0.05
如果结点的Bootstrap Value >70我们认为 这个分支是可靠的
优化图标
优化选项栏
•实例讲解
文件下载完之后,这里我们采用事先准备好的序列。 将Fasta 文件直接用 ClustalX 1.83打开
•实例讲解
在进行多序列比对之前我们需要对软件进行一些设置 1.选择Alignment标签 2.选择Output format options PHYLIP软件:PHYLIP MEGA软件:FASTA
• • • • • • • • • ClustalX (序列比对软件) Modeltest&MrModeltest(碱基替换模型筛选软件) PHYLIP MEGA PHYML 系统发育树构建软件 PAUP BEAST Figtree (树形显示软件) TreeView (树形显示软件)
• 构建NJ树,可以用PHYLIP或者MEGA • 构建MP树,可以使用PHYLIP或者MEGA • 构建ML树可以使用PHYML,速度快,同时构建ML树还可以用 PHYLIP,
• 构建我们自己的Fasta 文件
Fasta文件是直接可以从数 据库中下载得到的,但是 根据实际要求的不同,有 时候我们需要自己构建 Fasta文件。 如果您已近有了想用来构 建进化树的序列,您可以 如右图所示构建自己的文 件,文件的保存格式是: 文件名.txt
•实例讲解
下面我们以版纳病毒为例,构建系统进化树。 首先我们要下载我们所需的序列。 http://www.ncbi.nlm.nih.gov/
实验三.系统发育分析软件的使用
分子系统发育分析
• 系统发育分析研究是研究物种进化和系统 分类的一种方法,研究对象为携带遗传信 息的生物大分子序列,采用特定的数理统 计算法来计算生物间的进化关系。并用系 统进化树,即一种类似树枝状得图形来概 括生物间的这种亲缘关系。
分子系统发育分析
• 系统发育进化树( Phylogenetic tree)
根据实际的情况我 们这里选择YES选项
•实例讲解
下一步进入建树的最后阶段
参数设置好之后点 击compute.
在Plylogeny中选择建树方 法,这里我们选择NJ法。 蛋白质序列一般选择Poisson Correction(泊松校正),对 于核苷酸序列一般采用Pdistance模型
•实例讲解
根据Mega的计算最终我们得到了序列中的进化关系。
适用序列有很高相似性时
• 3. 最大似然法 (maximum likelihood, ML)
– 可用于任何相关序列集合
1. 基于序列距离特征 2+3基于序列离散特征
• 计算速度:
– 距离法 >最大简约法 >最大似然法
系统发育树重建分析过程
直系同源序列 合理的外群
点阵法
动态规划法
字串法
系统发育树构建的相关软件