Phylip中文使用说明 - 360文档中心

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

Phylip中文使用说

Introduction

PHYLIP程序的运行

这些程序要按照一定的顺序来运行。前一个程序的输出作为下一个程序的输入。如何合理的组合这些程序也很关键。

在windows中，PHYLIP程序可通过双击程序的图标来启动，或是在命令行中输入程序的名称来启动。我们建议使用命令行方式，因为你也许能看到一些错误提示。它启动的方是：开始->所有程序->附件->命令提示符。

大部分PHYLIP程序运行方法相同。程序把infile作为默认输入文件，如果没有找到它将要求用户输入数据文件的名称。输出结果写在 outfile文件中。有些则写在outfile和outtree或plotfile中。

因为大部分程序使用默认的输入和输出文件名，所以在下一步的分析前，要重命名你想保存的文件。比如，你用Dnadist得到了距离矩阵（outfile），你还想试试不同的设置，那么再做矩阵计算前，你可以把outfile重命名为dnadist_outfile，或其它名称，这样你就能区别两次的结果了。

程序

重抽样工具

该程序生成一系列的特殊的随机样本，保存在outfile中。这些样本在后继的分

析中作为一个序列对文件，要设置选项M（use multiple datasets）。

Seqboot 生成随机样本，用bootstrap和jack-knife方法。

距离方法：

顺序使用这些程序。首先，用dandist或protdist程序计算序列比对结果的距离矩阵。接着这个矩阵被fitch、kitsch或 neighbor程序转换为树。Dandist 和protdist程序的输出文件是outfile。在运行fitch、kitsch或neighbor 前，outfile应该重命名为infile或另外的名字。fitch、kitsch和neighbor的输出文件是outfile和outtree。

Dnadist DNA距离矩阵计算器

Protdist 蛋白质距离矩阵计算器

Fitch 没有分子时钟的Fitch-Margoliash树

Kitsch 有分子时钟的Fitch-Margoliash树

Neighbor Neighbor-Joining和UPGMA树

基于字符的方法

这些程序读入一个序列对，它们的输出文件是outfile和outtree。

Dnapars DNA简约法

Dnapenny DNA简约法using branch-and-bound Dnaml DNA最大似然，无分子时钟

Dnamlk DNA最大似然，有分子时钟Protpars 蛋白质简约法

Proml 蛋白质最大似然法

画树

这些程序可画newick格式的树。如，danml程序生成的树。Drawgram和drawtree 生成文件为plotfile，而retree 生成outtree。

Drawgram 画有根树

Drawtree 画无根树

Retree interactive tree-rearrangement

一致树

用多重树构建一致树。如，dnapars可生成多重树，可用consense程序来汇总。Bootstrap的结果也由它来汇总为一棵 majority rule tree。

Consense draws consensus trees from multiple trees

树的距离

计算多个树间的基于拓朴结构的距离。该方法可用来比较不同分析方法的结果。Treedist 计算树拓朴结构间的距离

Example 距离法

一．获取序列

一般自己通过测序得到一段序列（已知或未知的都可以），通过NCBI的BLAST获取相似性较高的一组序列，下载保存为FASTA格式。用BIOEDIT等软件编辑序列

名称，注意PHYLIP在DOS

二、多序列比对

目前一般应用CLASTAL X进行，注意输出格式选用PHY格式。生成的指导树文件（DND文件）可以直接用TREEVIEW打开编辑，形式上和最终生成的进化树类似，

三、构建进化树

N-J法建树

依次应用PHYLIP软件中的SEQBOOT.EXE、DNADIST.EXE、NEIGHBOR.EXE和CONSENSE.EXE打开。具体步骤如下：

（1）打开seqboot.exe

Seqboot首先检查该程序所在文件夹中是否有infile文件。如果没有找到

infile，它就会提示你输入序列比对文件。

输入文件名：输入你用CLASTAL X生成的PHY文件（*.phy）。

J选项有三种条件可以选择，分别是 Bootstrap、Jackknife和Permute。在此选择BootStrap

R为bootstrap的次数，R选项让使用者输入重复的replicate数目。所谓replicate就是用Bootstrap法生成的一个多序列组。根据多序列中所含的序列的数目的不同可以选取不同的，常用100或者1000。（设你输入的值为M，即下两步DNADIST.EXE、NEIGHBOR.EXE中的M值也为100或者1000）

当我们设置好条件后，键入Y按回车。得到一个文件 outfile，这个文件包括了1000个replicate。

输入Random number seed odd number: (4N+1)(eg: 1、5、9…)

改好了y

得到outfile（在phylip文件夹内）

改名为seqbootoutfile

（2）打开Dnadist.EXE

输入seqbootoutfile

得到dnadist的菜单

Nucleic acid sequence Distance Matrix program, version 3.66

Settings for this run: