系统进化树的构建
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
什么是Fasta 格式?
在生物信息学中, FASTA 格式(又称为 Pearson 格式),是一种基于文本 用于表示核苷酸序列或氨基酸序列的格式。在这种格式中碱基对或氨基 酸用单个字母来编码,且允许在序列前添加序列名及注释。序列文件的 第一行是由大于号“>”或分号“;”打头的任意文字说明(习惯常用“>” 作为起始),用于序列标记。从第二行开始为序列本身,只允许使用既 定的核苷酸或氨基酸编码符号。
分子系统发育的核心为构建系统发育进化树
系统进化树
进化拓扑结构: 进化树中不同枝的拓扑图形。 根:所有分类的共同祖先。 结点:表示一个分类单元。
结 点
人
进化支
结点
猩 猩
进化支:两种以上生物(DNA序列)及 其祖先组成的树枝。
进化分支长度: 用数值表示的进化枝的变化程度(遗 传距离) 根 距离标尺: 生物体或序列之间差异的 数字 尺度。 一个单位 外群: 与分析序列相关的生物序列且具有较远的 亲缘关系
3、比对序列,在Alignment中点击Align by ClustalW
4、输出数据:Data中点击Export Alignment→MAGE Form,命名保存
保存
打开比对结果
5、建树:Phylogeny中点击Construct Phylogeny
适用序列有很高相似性时
• 3. 最大似然法 (maximum likelihood, ML)
– 可用于任何相关序列集合
1. 基于序列距离特征 2+3基于序列离散特征
• 计算速度:
– 距离法 >最大简约法 >最大似然法
系统发育树构建的相关软件
ClustalX
(序列比对软件) Modeltest&MrModeltest(碱基替换模型筛选软件) PHYLIP MEGA PHYML 系统发育树构建软件 PAUP BEAST Figtree (树形显示软件) TreeView (树形显示软件)
分支 长度
狒 狒
距离标尺
外 群
系统发育进化树示例
同时,可构建同一物种的内部进化树,来比对 分析同一蛋白家族中不同蛋白紧密关系。
系统发育树重建分析步骤
多序列比对
选择建树方法
建立进化树
进化树评估
ห้องสมุดไป่ตู้
系统发育树重建的基本方法
• 1. 距离法 (distance)
适用序列有较高相似性时
• 2. 最大简约法 (maximum parsimony, MP)
系统进化树的构建
制作:刘玉咏 2013-12-25
分子系统发育分析
系统发育分析研究是研究物种进化和系统分类的一 种方法,研究对象为携带遗传信息的生物大分子序 列,采用特定的数理统计算法来计算生物间的进化 关系。并用系统进化树,即一种类似树枝状的图形 来概括生物间的这种亲缘关系。
分子系统发育分析
• 系统发育进化树( Phylogenetic tree)
用一种类似树状分支的图形来概括各种生物之间的亲缘关系。
• 系统进化树的主要构成:
结点(node):每个结点表示一个分类单元(属、种群)。 进化分枝(Clade): 是指由同一生物进化而来的单一系统群。 实体抽象为节点,实体间的进化关系抽象为连接
•实例讲解
下面我们以XK为例 1、下载所需的各个氨基酸序列,序列以Fasta格式保存于txt文本中。 序列下 载完之后,汇总到一个txt文本中。
2、在MAGE4中打开序列
打开MAGE4→Alignment→ Alignment Explorer
Edit框点击Inter Sequence From File打开 汇总序列