PAUP使用及Model Test
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
PAUP简单使用过程
作者:admin 文章来源: 点击数: 666 更新时间:2010-11-30 10:45:00
这个主要是我根据以往师兄的毕业论文,文献中的,软件说明书,在网上搜索得到的以及我自己在使用中的一些注意事项,总结汇编了一下,如有雷同,请诸位高抬贵手哦,不要追究版权责任!
软件自带的“快速开始指南(Quick Start Tutorial)”只提供了简单的进化树构建程序。本文根据附带的命令帮助文件,对软件的使用方法进行了摸索,总结出一套简便可靠的处理步骤:
1. 软件启动和数据执行:PAUP*软件启动后即弹出一个对话框要求输入一个比对后*.nex文件,并且可以让用户选择“Edit”和“Execute”两种不同的模式。前者是对比对序列矩阵进行修改,后者则直接将矩阵调入内存待处理,并且显示这个数据设置的一些信息,如这个矩阵的维数和数据类型、数据来源等。
执行命令:选择File > Execute “文件名.nex”
2. 开始日志记录:在PAUP*决议的任何时候都可以开始和停止日志记录。
开始记录:选择File >Log Output to Disk……
如果要停止日志记录,则可以再次执行这个命令。
3. 显示数据详细信息:PAUP*的cstatus命令将显示关于当前元素状态的总结(如类型,权重等等)。如果打开记录,显示在屏幕上的总结信息也会被保存在日志文件中。如果仅仅显示简明信息,也可以选择去显示分类(tstatus命令)和全部数据矩阵,即使用showmatrix命令。
4. 定义树根:可以在最后用TreeView软件显示的时候再定义树根,也可以在数据读
入后即设置树根,命令为:
Outgroup 序列名1 序列名2序列名3……
其中的“序列名”是指FASTA文件打开后开头部分“>”之后的序列代号。
5. 设定查找树的标准:PAUP*具有不同的最佳标准来分析数据的优点。这些标准由最大简约法、最大似然法和距离法等,相应的命令为:
set criterion = parsimony/likrlihood/distance
每个标准都有自己的长处和限制,其中的最大简约法和距离法是两种常用的方法。
6. 定义查找策略:PAUP*提供了两个基本类方法来查找最优树。它们是精确查找方法和启发式方法,前者保证找到最优树,但是却可能需要大量的计算时间来分析大批量的数据设置,后者不一定找到最优树,但是一般需要较少的计算时间,是比较实用的系统树的搜索方法,本研究根据计算机内存大小设定每轮搜索的最大尝试次数是1000次,相应命令为:hsearch addseq = random nreps ="1000;
该命令执行以后,程序将占用计算机的资源开始搜索,其间不要执行其他任何命令,以免造成内存冲突或程序自动关闭。
7. 显示和描述树:根据屏幕上的输出结果,有一个单树正在内存中,可以通过showtrees显示出来,但只显示分类次序的一个简图,其中可以显示分支长度等有关信息,相应命令为:
Showtree;
Describetrees 1/plot ="phylogram" brlens="yes
8. 保存结果:PAUP*能够用几种不同的格式来保存树,这些格式有PICT(只适用于Mac),Nexus,Freqpars,Phylip和Hennig86等,一般把树的格式保存为Nexus格式,操作命令为
savetrees file="文件名.tre root="yes" brlens="yes" savebootp="brlens" from="1"
to="搜索得到的树的最大数目;
最大简约树的构建方法:
作者构建的是葡柄霉属分子进化树,使用的是最大简约法。这颗树分别通过TBR(tree bisection-reconnection)交换算法的启发式搜索(heuristic search)得到,multitrees 参数选用(默认),同时进行1000次Bootstrap自举法检验。相等简约树的非强制性拓扑结构树形用PAUP*软件中的Kishino-Hasegawa似然性检测来进行比较,最佳拓扑结构(最小-nl)被选用,批处理命令如下:
Begin paup;
Execute stem.nex; (打开比对文件stem.nex)
Outgroup Alternaria_tenuissima Alternaria_alternata Alternaria_longipes
Lewia_infectoria Ulocladium_atrum Ulocladium_botrytis Ulocladium_alternariae Bipolaris_sorghicola Pyrenophora japonica Cochliobolus sativus Setosphaeria minor;(设立外群)
Cstatus;
Set criterion="parsimony;
Hsearch addseq="random" nreps="1000;
Describetrees 1/plot="phylogram" brlens="yes;
Savetrees file="stem.tre.root=yes" brlens="yes" savebootp="brlens" from="1"
to="1623;(保存所有树)
Pscores all/khtest="yes" single="all" scorefile="pscorefile" ci="yes" ri="yes"
re="yes" hi="yes;(Kishino-Hasegawa似然性检测,选最小-InL)
Savetrees file="stem_best.tre" root="yes" brlens="yes" savebootp="brlens"
from="1" to="1;(保存最小-InL树)
Bootstrap nreps="1000" brlens="yes" treefile="boot_stem.tre
Search=heuristic/addseq=random;(对最短树进行自举法验证,并保存树)
距离树的构建方法:
也可以是使用PAUP*软件中的邻近结合法(neighbor-joining,即NJ)构建距离树。我们的基因序列通过HKY85、JC、K2P和F84等不同碱基替代模型的启发式搜索(heuristic search)得到,multitrees参数选用默认设置,同时进行1000次bootstrap自举法检验。相等简约树的非强制性拓扑树形用PAUP*软件中的Kishino-Hasegawa似然性检测来进行比较,最佳拓扑结构(最小-nl)被选用,批处理命令如下:
Begin paup;