Phylip中文使用说明
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Phylip中文使用说
Introduction
PHYLIP程序的运行
这些程序要按照一定的顺序来运行。前一个程序的输出作为下一个程序的输入。如何合理的组合这些程序也很关键。
在windows中,PHYLIP程序可通过双击程序的图标来启动,或是在命令行中输入程序的名称来启动。我们建议使用命令行方式,因为你也许能看到一些错误提示。它启动的方是:开始->所有程序->附件->命令提示符。
大部分PHYLIP程序运行方法相同。程序把infile作为默认输入文件,如果没有找到它将要求用户输入数据文件的名称。输出结果写在 outfile文件中。有些则写在outfile和outtree或plotfile中。
因为大部分程序使用默认的输入和输出文件名,所以在下一步的分析前,要重命名你想保存的文件。比如,你用Dnadist得到了距离矩阵(outfile),你还想试试不同的设置,那么再做矩阵计算前,你可以把outfile重命名为dnadist_outfile,或其它名称,这样你就能区别两次的结果了。
程序
重抽样工具
该程序生成一系列的特殊的随机样本,保存在outfile中。这些样本在后继的分
析中作为一个序列对文件,要设置选项M(use multiple datasets)。
Seqboot 生成随机样本,用bootstrap和jack-knife方法。
距离方法:
顺序使用这些程序。首先,用dandist或protdist程序计算序列比对结果的距离矩阵。接着这个矩阵被fitch、kitsch或 neighbor程序转换为树。Dandist 和protdist程序的输出文件是outfile。在运行fitch、kitsch或neighbor 前,outfile应该重命名为infile或另外的名字。fitch、kitsch和neighbor的输出文件是outfile和outtree。
Dnadist DNA距离矩阵计算器
Protdist 蛋白质距离矩阵计算器
Fitch 没有分子时钟的Fitch-Margoliash树
Kitsch 有分子时钟的Fitch-Margoliash树
Neighbor Neighbor-Joining和UPGMA树
基于字符的方法
这些程序读入一个序列对,它们的输出文件是outfile和outtree。
Dnapars DNA简约法
Dnapenny DNA简约法using branch-and-bound Dnaml DNA最大似然,无分子时钟
Dnamlk DNA最大似然,有分子时钟Protpars 蛋白质简约法
Proml 蛋白质最大似然法
画树
这些程序可画newick格式的树。如,danml程序生成的树。Drawgram和drawtree 生成文件为plotfile,而retree 生成outtree。
Drawgram 画有根树
Drawtree 画无根树
Retree interactive tree-rearrangement
一致树
用多重树构建一致树。如,dnapars可生成多重树,可用consense程序来汇总。Bootstrap的结果也由它来汇总为一棵 majority rule tree。
Consense draws consensus trees from multiple trees
树的距离
计算多个树间的基于拓朴结构的距离。该方法可用来比较不同分析方法的结果。Treedist 计算树拓朴结构间的距离
Example 距离法
一.获取序列
一般自己通过测序得到一段序列(已知或未知的都可以),通过NCBI的BLAST获取相似性较高的一组序列,下载保存为FASTA格式。用BIOEDIT等软件编辑序列
名称,注意PHYLIP在DOS
二、多序列比对
目前一般应用CLASTAL X进行,注意输出格式选用PHY格式。生成的指导树文件(DND文件)可以直接用TREEVIEW打开编辑,形式上和最终生成的进化树类似,
三、构建进化树
N-J法建树
依次应用PHYLIP软件中的SEQBOOT.EXE、DNADIST.EXE、NEIGHBOR.EXE和CONSENSE.EXE打开。具体步骤如下:
(1)打开seqboot.exe
Seqboot首先检查该程序所在文件夹中是否有infile文件。如果没有找到
infile,它就会提示你输入序列比对文件。
输入文件名:输入你用CLASTAL X生成的PHY文件(*.phy)。
J选项有三种条件可以选择,分别是 Bootstrap、Jackknife和Permute。在此选择BootStrap
R为bootstrap的次数,R选项让使用者输入重复的replicate数目。所谓replicate就是用Bootstrap法生成的一个多序列组。根据多序列中所含的序列的数目的不同可以选取不同的,常用100或者1000。(设你输入的值为M,即下两步DNADIST.EXE、NEIGHBOR.EXE中的M值也为100或者1000)
当我们设置好条件后,键入Y按回车。得到一个文件 outfile,这个文件包括了1000个replicate。
输入Random number seed odd number: (4N+1)(eg: 1、5、9…)
改好了y
得到outfile(在phylip文件夹内)
改名为seqbootoutfile
(2)打开Dnadist.EXE
输入seqbootoutfile
得到dnadist的菜单
Nucleic acid sequence Distance Matrix program, version 3.66
Settings for this run: