PAUP使用及Model Test

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

PAUP简单使用过程

作者:admin 文章来源: 点击数: 666 更新时间:2010-11-30 10:45:00

这个主要是我根据以往师兄的毕业论文,文献中的,软件说明书,在网上搜索得到的以及我自己在使用中的一些注意事项,总结汇编了一下,如有雷同,请诸位高抬贵手哦,不要追究版权责任!

软件自带的“快速开始指南(Quick Start Tutorial)”只提供了简单的进化树构建程序。本文根据附带的命令帮助文件,对软件的使用方法进行了摸索,总结出一套简便可靠的处理步骤:

1. 软件启动和数据执行:PAUP*软件启动后即弹出一个对话框要求输入一个比对后*.nex文件,并且可以让用户选择“Edit”和“Execute”两种不同的模式。前者是对比对序列矩阵进行修改,后者则直接将矩阵调入内存待处理,并且显示这个数据设置的一些信息,如这个矩阵的维数和数据类型、数据来源等。

执行命令:选择File > Execute “文件名.nex”

2. 开始日志记录:在PAUP*决议的任何时候都可以开始和停止日志记录。

开始记录:选择File >Log Output to Disk……

如果要停止日志记录,则可以再次执行这个命令。

3. 显示数据详细信息:PAUP*的cstatus命令将显示关于当前元素状态的总结(如类型,权重等等)。如果打开记录,显示在屏幕上的总结信息也会被保存在日志文件中。如果仅仅显示简明信息,也可以选择去显示分类(tstatus命令)和全部数据矩阵,即使用showmatrix命令。

4. 定义树根:可以在最后用TreeView软件显示的时候再定义树根,也可以在数据读

入后即设置树根,命令为:

Outgroup 序列名1 序列名2序列名3……

其中的“序列名”是指FASTA文件打开后开头部分“>”之后的序列代号。

5. 设定查找树的标准:PAUP*具有不同的最佳标准来分析数据的优点。这些标准由最大简约法、最大似然法和距离法等,相应的命令为:

set criterion = parsimony/likrlihood/distance

每个标准都有自己的长处和限制,其中的最大简约法和距离法是两种常用的方法。

6. 定义查找策略:PAUP*提供了两个基本类方法来查找最优树。它们是精确查找方法和启发式方法,前者保证找到最优树,但是却可能需要大量的计算时间来分析大批量的数据设置,后者不一定找到最优树,但是一般需要较少的计算时间,是比较实用的系统树的搜索方法,本研究根据计算机内存大小设定每轮搜索的最大尝试次数是1000次,相应命令为:hsearch addseq = random nreps ="1000;

该命令执行以后,程序将占用计算机的资源开始搜索,其间不要执行其他任何命令,以免造成内存冲突或程序自动关闭。

7. 显示和描述树:根据屏幕上的输出结果,有一个单树正在内存中,可以通过showtrees显示出来,但只显示分类次序的一个简图,其中可以显示分支长度等有关信息,相应命令为:

Showtree;

Describetrees 1/plot ="phylogram" brlens="yes

8. 保存结果:PAUP*能够用几种不同的格式来保存树,这些格式有PICT(只适用于Mac),Nexus,Freqpars,Phylip和Hennig86等,一般把树的格式保存为Nexus格式,操作命令为

savetrees file="文件名.tre root="yes" brlens="yes" savebootp="brlens" from="1"

to="搜索得到的树的最大数目;

最大简约树的构建方法:

作者构建的是葡柄霉属分子进化树,使用的是最大简约法。这颗树分别通过TBR(tree bisection-reconnection)交换算法的启发式搜索(heuristic search)得到,multitrees 参数选用(默认),同时进行1000次Bootstrap自举法检验。相等简约树的非强制性拓扑结构树形用PAUP*软件中的Kishino-Hasegawa似然性检测来进行比较,最佳拓扑结构(最小-nl)被选用,批处理命令如下:

Begin paup;

Execute stem.nex; (打开比对文件stem.nex)

Outgroup Alternaria_tenuissima Alternaria_alternata Alternaria_longipes

Lewia_infectoria Ulocladium_atrum Ulocladium_botrytis Ulocladium_alternariae Bipolaris_sorghicola Pyrenophora japonica Cochliobolus sativus Setosphaeria minor;(设立外群)

Cstatus;

Set criterion="parsimony;

Hsearch addseq="random" nreps="1000;

Describetrees 1/plot="phylogram" brlens="yes;

Savetrees file="stem.tre.root=yes" brlens="yes" savebootp="brlens" from="1"

to="1623;(保存所有树)

Pscores all/khtest="yes" single="all" scorefile="pscorefile" ci="yes" ri="yes"

re="yes" hi="yes;(Kishino-Hasegawa似然性检测,选最小-InL)

Savetrees file="stem_best.tre" root="yes" brlens="yes" savebootp="brlens"

from="1" to="1;(保存最小-InL树)

Bootstrap nreps="1000" brlens="yes" treefile="boot_stem.tre

Search=heuristic/addseq=random;(对最短树进行自举法验证,并保存树)

距离树的构建方法:

也可以是使用PAUP*软件中的邻近结合法(neighbor-joining,即NJ)构建距离树。我们的基因序列通过HKY85、JC、K2P和F84等不同碱基替代模型的启发式搜索(heuristic search)得到,multitrees参数选用默认设置,同时进行1000次bootstrap自举法检验。相等简约树的非强制性拓扑树形用PAUP*软件中的Kishino-Hasegawa似然性检测来进行比较,最佳拓扑结构(最小-nl)被选用,批处理命令如下:

Begin paup;

相关文档
最新文档