Phylip中文使用说明

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Phylip中文使用说

Introduction

PHYLIP程序的运行

这些程序要按照一定的顺序来运行。前一个程序的输出作为下一个程序的输入。如何合理的组合这些程序也很关键。

在windows中,PHYLIP程序可通过双击程序的图标来启动,或是在命令行中输入程序的名称来启动。我们建议使用命令行方式,因为你也许能看到一些错误提示。它启动的方是:开始->所有程序->附件->命令提示符。

大部分PHYLIP程序运行方法相同。程序把infile作为默认输入文件,如果没有找到它将要求用户输入数据文件的名称。输出结果写在 outfile文件中。有些则写在outfile和outtree或plotfile中。

因为大部分程序使用默认的输入和输出文件名,所以在下一步的分析前,要重命名你想保存的文件。比如,你用Dnadist得到了距离矩阵(outfile),你还想试试不同的设置,那么再做矩阵计算前,你可以把outfile重命名为dnadist_outfile,或其它名称,这样你就能区别两次的结果了。

程序

重抽样工具

该程序生成一系列的特殊的随机样本,保存在outfile中。这些样本在后继的分

析中作为一个序列对文件,要设置选项M(use multiple datasets)。

Seqboot 生成随机样本,用bootstrap和jack-knife方法。

距离方法:

顺序使用这些程序。首先,用dandist或protdist程序计算序列比对结果的距离矩阵。接着这个矩阵被fitch、kitsch或 neighbor程序转换为树。Dandist 和protdist程序的输出文件是outfile。在运行fitch、kitsch或neighbor 前,outfile应该重命名为infile或另外的名字。fitch、kitsch和neighbor的输出文件是outfile和outtree。

Dnadist DNA距离矩阵计算器

Protdist 蛋白质距离矩阵计算器

Fitch 没有分子时钟的Fitch-Margoliash树

Kitsch 有分子时钟的Fitch-Margoliash树

Neighbor Neighbor-Joining和UPGMA树

基于字符的方法

这些程序读入一个序列对,它们的输出文件是outfile和outtree。

Dnapars DNA简约法

Dnapenny DNA简约法using branch-and-bound Dnaml DNA最大似然,无分子时钟

Dnamlk DNA最大似然,有分子时钟Protpars 蛋白质简约法

Proml 蛋白质最大似然法

画树

这些程序可画newick格式的树。如,danml程序生成的树。Drawgram和drawtree 生成文件为plotfile,而retree 生成outtree。

Drawgram 画有根树

Drawtree 画无根树

Retree interactive tree-rearrangement

一致树

用多重树构建一致树。如,dnapars可生成多重树,可用consense程序来汇总。Bootstrap的结果也由它来汇总为一棵 majority rule tree。

Consense draws consensus trees from multiple trees

树的距离

计算多个树间的基于拓朴结构的距离。该方法可用来比较不同分析方法的结果。Treedist 计算树拓朴结构间的距离

Example 距离法

一.获取序列

一般自己通过测序得到一段序列(已知或未知的都可以),通过NCBI的BLAST获取相似性较高的一组序列,下载保存为FASTA格式。用BIOEDIT等软件编辑序列

名称,注意PHYLIP在DOS

二、多序列比对

目前一般应用CLASTAL X进行,注意输出格式选用PHY格式。生成的指导树文件(DND文件)可以直接用TREEVIEW打开编辑,形式上和最终生成的进化树类似,

三、构建进化树

N-J法建树

依次应用PHYLIP软件中的SEQBOOT.EXE、DNADIST.EXE、NEIGHBOR.EXE和CONSENSE.EXE打开。具体步骤如下:

(1)打开seqboot.exe

Seqboot首先检查该程序所在文件夹中是否有infile文件。如果没有找到

infile,它就会提示你输入序列比对文件。

输入文件名:输入你用CLASTAL X生成的PHY文件(*.phy)。

J选项有三种条件可以选择,分别是 Bootstrap、Jackknife和Permute。在此选择BootStrap

R为bootstrap的次数,R选项让使用者输入重复的replicate数目。所谓replicate就是用Bootstrap法生成的一个多序列组。根据多序列中所含的序列的数目的不同可以选取不同的,常用100或者1000。(设你输入的值为M,即下两步DNADIST.EXE、NEIGHBOR.EXE中的M值也为100或者1000)

当我们设置好条件后,键入Y按回车。得到一个文件 outfile,这个文件包括了1000个replicate。

输入Random number seed odd number: (4N+1)(eg: 1、5、9…)

改好了y

得到outfile(在phylip文件夹内)

改名为seqbootoutfile

(2)打开Dnadist.EXE

输入seqbootoutfile

得到dnadist的菜单

Nucleic acid sequence Distance Matrix program, version 3.66

Settings for this run:

相关文档
最新文档