MEGA_3.1分子进化遗传分析软件
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分子进化分析软件MEGA 3.1的使用操作
作者:Dxyer- lzf战友
(山东大学生命科学学院微生物国家重点实验室)
受益的话,请到下列地址给我投一票,谢谢☺
/bbs/post/view?bid=73&id=5059255&sty=1&tpg=1&ppg=1&age=0#5059255
进化树也称种系树,英文名叫“Phyligenetic tree”,主要通过蛋白质序列/核酸序列的同源性比较进而了解基因或物种进化发生的内在关系和规律。完整的进化分析需要以下几个步骤[1]:A.了解进化树的一些基本的概念和定义;B.集合一个待分析的数据组;C.对数据组进行多重序列比对;D.比对结果的校正;E.进化树的构建:为了说明进化分析结果的真实性,往往需要对校正后的比对结果选择不同的算法、模型和程序进行进化树的构建(必要的话,可利用Gblocks:http://molevol.ibmb.csic.es/Gblocks/Gblocks.html等软件提取数据组中的保守区后再进行进化树构建);F.树枝可信度评估:可利用bootstrap和interior-branch等测试方法;
G.发表数据的优化及展示:可利用MEGA3.1软件打开多种软件所做的进化树并对其进行分枝合并、排序等优化,最后利用Photoshop、Macromedia Fireworks MX 等作图软件对图的清晰度进行优化以获得高质量的发表展示图.
目前树状进化树的分析软件很多,其中MEGA 3.1(/)[2]最大的优点在于易于上手操作并可对图形进行优化展示,是分子进化分析最理想的软件之一。但MEGA软件包中没有目前蛋白序列进化分析中推崇的“最大可能性(maximum likelyhood,ML)”和“贝叶斯推论(bayesian inferences)”这两种算法[3]。ML算法可使用软件phyml(http://atgc.lirmm.fr/phyml/),贝叶斯分析使用软件MrBayes(/)。本文主要介绍分子进化分析软件MEGA 3.1的使用操作。
1.准备要分析的序列数据:
1.1 数据组的多重序列比对:
用clustal软件对序列进行比对分析(因任何软件都不能检测数据本身存在的错误,所以数据质量是进化树构建的关键,需要尽量保证输入数据的可靠性)。
使用2003年新版的clustalx1.83具有以下几个优点[4]:A.可将比对后序列保存为fasta格式;B. 可产生相似性的百分比矩阵;C. 可选定比对结果中需要
的比对序列区域段进行保存;D. 显著提高分析速度。
新旧版本执行时间比较
序列数目原始NJ算法时间完全比对时间新NJ算法时间完全比对时间200 0’6” 0’11” 0.1” 0’5”
500 6’55” 7’27” 1.1” 0’33”
1000 xxx xxx 16” 2’18”
注:若文件中序列名称过长,clustal则不好用。此时,选择用bioedit进行比对分析,则可不更改文件中的序列名称。利用bioedit比对后,将文件保存成fasta格式,则可直接用MEGA打开并对序列进行分析修
改。如此,利用bioedit和MEGA联合使用,则省去了来回更改序列名称的麻烦,且利于序列的修改和
各种格式转换。完整序列名称的*.txt,*.meg,*.mts文件,均可用MEGA软件直接打开,自行挑选序列进
行分析。
1.2 使用Bioedit等软件校对比对结果
可利用Bioedit:/BioEdit/bioedit.html等软件对比对结果进行
校正(尤其注意gap区的校正)并应将所分析序列的区域和长度截取至一致。
2.利用MEGA软件转换文件格式
双击打开MEGA软件,点击file,从下拉菜单中选择convert to mega fomat。
点击convert to mega fomat,弹出选择分析文件的对话框。点击对话框上的文件夹
图标(图1A),从目的文件夹中选中clustalx 比对分析后所产生的*.aln文件,点
击打开。此时即转换到准备分析的目标文件,点击ok,即可将*.aln文件转换成
*.meg文件。转换成*.meg文件后,会弹出转换后的*.meg文件和提示信息(图1B),
点击ok后,查看*.meg序列文件最后行是否正常,若存在clustax 的“.*:”符号行,
删除即可。点击保存即获得*.meg格式文件。
图1.A. 弹出选择分析文件的对话框;B.转换*.meg文件后弹出的提示信息
3.导入*.meg文件准备数据分析
最小化text数据窗口,剩下的界面同刚打开软件时的界面;点击file中的open
data,选则要分析的*.meg文件并打开;弹出对话框,选择目的序列的类型,再点击OK(图2)。以下操作说明以蛋白序列为例。
图2.弹出的数据类型对话框
4.数据选择及名称编辑
导入后,出现数据文件,点击工具栏上的选择和编辑数据/分类的图标(如图3A)即可弹出选择/编辑数据/分类的界面,可对要分析的序列进行选则,并可
进行文件名编辑(图3B)。编辑好后,点close即可。
注:软件还可以用于计算分枝间进化距离,group内的平均进化距离和group间的平均进化距离。
图3.A.选择/编辑数据/分类的图标;B.选择/编辑分类组界面
序列选择编辑好后,可点击保存进行序列输出,此时导出的序列为所选中的带钩的序列,非全部序列。点击OK后出现输出Exported Data文件,保存该文
件。Exported Data可直接用MEGA软件打开,以便今后直接利用。否则完全退出MEGA软件后,下次又需要重新进行序列的选择和编辑。
图4. 数据选择编辑后导出的Exported Data文件
5.进化树构建参数选择
将序列数据最小化后,可从Phylogeny下拉菜单中选择多种方法进行进化树的构建。常用Bootstrap test进行进化树的构建,该选项下又有多种算法可以选择(常用邻位相接法:Neighbor-Joining)。当所分析的数据过多时,使用Bootstrap 测试法,所得分枝的支持率会显著下降,这时可选择Interior Branch test法对进化树分枝的支持率进行评估。Interior Branch test选项下也有两种算法。选择好算法后,弹出分析优选框,可点击绿色图标,选择相应的分析参数和模式。设置好后,点击Compute进行分析(图5)。
图 5.分析参数和模式优选窗口
6.进化树的图形优化
计算好后,软件会自动弹出进化树。点击工具栏上的图标i(图6) ,会出现建树的参数信息;点击工具栏上的优选图标(图6),可进行进化树的各项参数优化。