常见系统发育软件使用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
常见系统发育软件使用方法
Xie Lei BJFU
1 Paup MP流程: Mac
准备nex文件(interleave和noninterleave均可) →存入新建文件夹→拖入paup或用paup打开→ execute → log file → cstatus → tstatus → hsearch → define outgroup →roottrees →savetrees →describetrees →contree(save to file) →save pict→bootstrap(save tree file) →print bootstrap tree→save pict. →stop log.
PC版操作,可将附录批处理文件内容粘贴至nex文件后面,execute即可。
2 Paup ML 流程:Mac
准备nex文件(interleave和noninterleave均可) → 存入新建文件夹→拖入paup或用paup打开→execute→从modeltest软件中打开paupblock运算检测模型→生成score file→打开modeltest中的bin读取score数据→生成结果文档→存档并打开此文档→AIC→将begin paup的运算模块贴至原nex数据文件后面→重新将其拖入paup运行→选择ML运算模式→hsearch→打印树图→save pict. →bootstrap.
PC版操作,可将附录5批处理文件内容粘贴至nex文件后面,execute即可。
3 Garli运算ML流程:
准备nex文件(interleave) → 存入新建文件夹→拖入paup或用paup打开→execute→输出noninterleave文档(若直接是noninterleave上述过程省略,又如果是PC机paup,无菜单操作,可在paup命令行中输入附录1*的命令回车即可生成noninterleave数据)。
使用noninterleave文档(数据中类群名称不得有单引号,空格,所有方括号中内容删除)
→新建文件夹存入→按照流程2进行modeltest→在苹果机上打开Garli→导入数据→把model定好→run(切记此处不要激bootstrap选项)
将上次运算数据拷贝至一新建文件夹→导入苹果版Garli→激活bootstrap选项→定好model→run
所有结果用paup软件打开→save pict→打开bootstrap树→做50% majority rule contree→save pict.
注:Garli苹果和PC版都有,但是操作不同。
数据格式:和算PAUP一样的nexus格式,但是这个格式有很多注意事项,一些常见的小错误会造成软件无法运行。
参见下列常见问题:
1 一定要noninterleave的数据,否则软件无法运算
2 [ ]虽然在mrbayes和paup中不成问题但是在garli中有影响,里面内容在算之前全部删除为好。
3 taxon名称中可以有下划线但是不得有空格,逗号句点等,否则无法运行。
Mac版
GUI的菜单界面,只要有上述正确的nexus格式的数据文件即可运算。
PC版
Nex format plus a command file
每次使用时拷贝一个软件的文件夹,将此文件夹重新命名(尽量清楚易查询)。
将正确的数据文件拷贝到此文件夹下(与garli运行程序在同一目录下)。
编辑命令文档(名称是garli),进行参数设置。
完成后双击garli运行程序图标即可运算。
4 Bayes 流程
Noninterleave 文件→贴运算程序到文件后面(见附录)→将其拷贝至MrBayes 文件夹下→打开运行程序→execute 文件名.扩展名→运算结束后用paup运行源文件→从.t文件中取树→burnin→做50% majority rule contree→save pict.
5 r8s流程
按照流程2进行modeltest→按照流程2进行ML运算→运算结束print tree→检查这棵带枝长的树是否有分支长度为0的分支→如果有在restore和delete taxa中将这些类群去除→存储带枝长的树到file(nex格式) →将树的taxa名称更换为实际类群名称→将树文件贴至运算模版(见附录)→首先进行第一步cross validate→得到smooth值→替换smooth值再算一遍即可。
注:r8s:
该软件与BEAST不同,是对已存在的树进行操作,校订分子钟。
算法为PL法。
先选择模型算出一个ML树(要带枝长),注意如果要用这个树算r8s要保证该树各个分支清晰,有较高的分辨率,没有0枝长分枝和polytomy。
在这个树的tre的nexus文件上面编辑各种命令,然后输入r8s进行运算。
一定要固定root,ingroup最好有一个以上的constraints.
运算两次,第一次为cross-validation得出smooth value,第二次再设置这个值算出最终结果。
6 BEAST流程
Noninterleave 文档→ BEAUTI打开→ 定义节点→基本设置→化石点标定→生成xml文档→BEAST打开运算→运算完成→Tacer打开log文件→TreeAnnotator 打开树文件→生成out文件→Figtree打开out文件。
7 DIV A
在数据文件中确定树形,标注分布区,然后运算
1 open DIV A
2 proc filename.txt;
3 optimize;
Batch: optimize maxareas=8 weight=0.5 bound=200 hold=10000;
8 Haplotype network简明流程:
1、NETWORK 4.5
用DNASP软件打开fas或者nex文件→ 另存为Roehl File Format文件(rdf格式)→ 用NETWORK打开→ 进行编辑(更改名称、连续的gap合并、添加删除序列等)后保存→ 选择Median Joining进行calculate network → 在新出现的窗口中导入rdf文件(也可以在这一步直接导入noninterleave的nex文件而省去以上步骤,但是不能重新编辑)→ 设置参数后进行计算,生成out格式的输出文件→ 选择draw network,在新窗口中导入out文件→ 按照提示就可以生成network图,保存fdi文件或可另存为bmp或者pdf文件。
2、TCS 1.21
准备noninterleave的nex或者phy文件→ 导入TCS → 设置Parsimony Limit 或Fix connection Limit,并定义gap后点击r un → 运行完成后就会自动生成network图,编辑后保存GML文件或可另存为postscript 或者PICT文件。
9.推荐使用:
Mega 5.全能系统发育分析软件,从序列校对到系统发育分析、分子钟、性状演化、居群分析全能做。
Mesquite 2.7也很全能,但是主要还是做性状演化分析。
McClade是其收费版。
TNT是原来的Hennig86,做系统发育分析。
PAST十分强大的统计软件,居群分析,分类学的morphometric分析很好。
S-DIV A川大开发的带统计功能的地理分析软件。
建议访问:/phylip/software.html
附录1.最大简约法分析批处理文件
1.
begin PAUP;
log file=hsearch1.log;
set autoclose=yes;
set maxtrees=100 increase=auto;
hsearch start=stepwise addseq=random nreps=1000 savereps=yes randomize=addseq rstatus=yes hold=1 swap=tbr multrees=yes nchuck=200 chuckscore=1;
savetrees file=hsearch1.all.tre brlens=yes;
filter best=yes permdel=yes;
savetrees file=hsearch1.best.tre;
gettrees file=hsearch1.best.tre;
contree all/majrule=yes treefile=contree.tre;
log stop;
end;
2.
begin PAUP;
log file=hsearch1.log;
set autoclose=yes;
set maxtrees=100 increase=auto;
hsearch start=stepwise addseq=random nreps=1000 savereps=yes randomize=addseq rstatus=yes hold=1 swap=tbr multrees=yes;
savetrees file=hsearch1.all.tre brlens=yes;
filter best=yes permdel=yes;
savetrees file=hsearch1.best.tre;
gettrees file=hsearch1.best.tre;
contree all/majrule=yes treefile=contree.tre;
log stop;
end;
2的策略较好,是hsearch中首选,而如果此程序运算时间太长则用上面一个程序。
本实用方法只提供hsearch,而branch and bound和exhaustive方法省略。
附录1*
export format=nexus interleaved=no file=temp.txt (此为生成noninterleave文件命令)
附录 2. ILD分析
;
endblock;
charpartition dna=ITS:1-848,trnLF:849-3051;
begin paup;
set criterion=parsimony;
log file=iscap.hom;
hompart part=dna nreps=100/addseq=random;
hsearch swap=tbr;
endblock;
附录 3. Bayes分析
1. 单一模型
begin mrbayes;
lset nst=6 rates=gamma;
mcmcp ngen=2000000 printfreq=1000 samplefreq=100 nchains=4 savebrlens=yes filename=P_combined;
mcmc;
sumt filename=P_combined.t burnin=2000;
end;
Begin mrbayes;
2. 多模型
begin mrbayes;
charset its=1-622;
charset trnlf=623-1696;
charset matk=1697-3221;
charset chs=3222-4406;
charset psbm2trnd=4407-5506;
charset psbm=5507-6279;
charset gpd=6280-6972;
charset LFY=6973-8426;
partition Names = 8: its, trnlf, matk, chs, psbm2trnd, psbm, gpd, LFY;
end;
begin mrbayes;
[The following lines set up a model in which all four genes have their unique GTR + gamma
+ propinv model]
set partition=Names;
prset ratepr=variable;
lset applyto=(1,2,3,4,5,6,7) nst=6;
lset applyto=(8) nst=2 rates=gamma;
unlink shape=(all) pinvar=(all);
end;
begin mrbayes;
mcmcp ngen=100000 printfreq=1000 samplefreq=100 nchains=4 savebrlens=yes filename=solms8mys;
mcmc;
sumt filename=solms8.t burnin=3000;
end;
3. 带支长contree的运算batch
begin mrbayes;
log start filename=cp.log;
mcmc filename=cp ngen=2000000 samplefreq=100;
sump burnin=5000 filename=cp printtofile=yes outputname=cp.sump;
sumt burnin=5000 filename=cp contype=allcompat;
log stop;
end;
附录4. bootstrap分析
begin paup;
log file=bootstrap.log;
set maxtrees=100 increase=auto;
set criterion=parsimony;
set root=outgroup;
outgroup 56 57;
bootstrap nreps=1000 conlevel=50 treefile=bootstrap.tre keepall=yes cutoffpct=50/start=stepwise addseq=random nreps=100 savereps=yes nchuck=20 chuckscore=5 dstatus=none;
log stop;
end;
附录 5. Paup运行ML分析
苹果机:
BEGIN PAUP;
Lset Base=(0.3271 0.1847 0.1967) Nst=6 Rmat=(0.9731 1.0473 0.2212 0.4660 1.5241) Rates=gamma Shape=0.8160 Pinvar=0.6410;
END;
PC机:
Begin Paup;
Set criterion=likelihood;
Lset Base=(0.3413 0.2847 0.0895) Nst=6 Rmat=(0.3885 3.5246 0.5305 0.4364 3.2970) Rates=gamma Shape=0.5232 Pinvar=0.2613;
Hsearch start=nj nchuck=2 chuckscore=5 dstatus=none;
savetrees format=nexus brlens=yes append=yes file=likelihood;
lscores 1/scorefile=likelihood.sf append=yes;
set root=outgroup;
outgroup 27 28;
showtrees all;
end;
(注:可编辑下载,若有不当之处,请指正,谢谢!)。