多基因联合建树图解教程(引用高老师)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多基因联合建树图解教程(引高老师原创)
工具】(引用高老师原创)
MAFFT(多序列比对及序列排序)、SequenceMatrix(多源数据合并)、PAUP(同质性检验)、Mrbayes(支持分源数据集建树)
【流程】
1.序列比对及排序
在MEGA中打开序列进行逐一进行多重比对,并对序列名称进行排序。

排序的目的主要是避免后续序列串联拼接时发生错位,如上图所示,点击MEGA比对浏览器界面的左上角"Species/Abbrv"即可进行升序/降序排列,最后导出Fasta格式的多重序列比对文件。

2.序列合并
运行SequenceMatrix,在菜单上依次点击“Import”-“Add Sequence”-选择待目的序列,如下图:
导出过程会提示是否将空位标记为问号,建议选择选择“全否”。

逐一添加不同基因的多重比对序列后,同样点击菜单栏上方的“Export”导出nexus文件的合并序列文件,这里注意不同基因的前后顺序。

导出的nexus带序列长度的标识,建议用PAUP等软件对序列文件进化格式化,建议保存为non-interleaved的nexus文件。

3.同质性检验
同质性检验(Testing for homogeneity)两种方法的参考脚本:
(1)不相合长度差异检验 (Incongruence length difference test ,ILD Test)
------------------------------------------------
begin set;
CHARSET 01P1 = 1-825;
CHARSET 02HC = 826-2220;
CHARSET 03Vpg = 2221-2784;
charpartition genes = gene1:01P1, gene2:02HC, gene3:03VPg;
end;
Begin PAUP;
log file=ildtest.log;
hompart partition=genes nreps=100 / start=stepwise addseq=random nreps=10 savereps=no randomize=addseq rstatus=no hold=1 swap=tbr multrees=yes;
log stop;
End;
-------------------------------------------------------------
(2)同质性检验(Partition homogeneity test, PHT)
--------------------------------------------------
begin sets;
charpartition favored = 1:1-825, 2:826-2220, 3:2221-2784;
end;
begin paup;
hompart partition=favored nreps=100 search=bandb;
end;
-------------------------------------------------
这里仅演示ILD Test 检验,将上述参考文件添加在第2步得到合并的nexus文件尾,如下图
添加脚本完毕,在PAUP中打开添加脚本后的nexus文件,运行如下图所示
当异质性检验完成后,同一目录下会生成一个日志文件(*.log),即为检验结果,如下图所示,p值0.01远小于数据集可联合与不可联合的阈值0.05,表明这些数据集最好不要联合分析。

但后来相关的研究表明,即使p值小于0.01,数据集照样可以联合分析。

4. 联合多基因建树
4.1数据不分区(No partition):即合并后的数据集视为一体,只计算整体的核苷酸替换模型,操作方法如单基因的系统发育重建,此文不再赘述。

4.2 数据分区(Partition):即合并的数据集中,针对每个基因分别对应的核苷酸替换模型。

目前支持分区的软件有RaxML、Mrbayes和BEAST等。

以下为Mrbayes的参考脚本:
begin mrbayes;
CHARSET 01P1 = 1-825;
CHARSET 02HC = 826-2220;
CHARSET 03VPg = 2221-2784;
CHARSET 04CP = 2785-3585;
partition gene=4: 01P1,02HC,03VPg,04CP;
set partition=gene;
lset applyto=(1) nst=6 rates=propinv;
lset applyto=(2) nst=6 rates=invgamma;
lset applyto=(3) nst=6 rates=gamma;
lset applyto=(4) nst=6 rates=propinv;
Prset applyto=(all)statefreqpr=dirichlet(1,1,1,1);
mcmcp savebrlens=yes ngen=2000000 samplefreq=100 nchains=4; mcmc;
sumt contype=allcompat burnin=5000;
end;
欢迎您的下载,
资料仅供参考!
致力为企业和个人提供合同协议,策划案计划书,学习资料等

打造全网一站式需求。

相关文档
最新文档