MEGA5.10构建系统进化树

进化树构建方法-MEGA

利用MEGA 来构建进化树（molecular evolutionary genetics analysis 分子进化遗传分析）打开mega5，选择Align----edit/built alignment----create a new alignment—OK选择DNA/protein出现新的对话框Open------选择已经保存好的用clustalx 经过比对保存的以.aln格式的文件打开之后，出现下面的页面双击文件名可以进行修改的。

我的就是从这里开始修改把A,B,C 都去掉，只留号码就好右键菜单点击delete 删除带※的那一行。

得到下面的图示，点击保存，重新起名字。

之后点击此图内的Alignment 选择Align by clustalW即可。

默认设置即可，点击OK就进行比对了，此后会出现一个过渡对话框，显示的是两两比对和多序列比对的过程之后回到初始页面，就是这个页面之后点File---点开，把刚才保留的文件点开然后出现下面的页面多了几个内容，点击TA的那个框框。

之后出现这样的框框图片然后在主程序中选择phylogeny---construct/test neighbor-joining tree,然后出现下面的页面黄色框框处的的参数是可以改变的，该图为我已经改变好的，把Bootstrap 的值改为1000 Methods根据文献上的参考改为了Kimura2-parameter model.之后点击compute,就出现了，而且还带有必需的支持率即自展值，是用来检验你所计算的进化树分支可信度的。

简单地讲就是把序列的位点都重排，重排后的序列再用相同的办法构树，如果原来树的分枝在重排后构的树中也出现了，就给这个分枝打上一分，如果没出现就给0分，这样经过你给定的repetitions 次（至少1000次）重排构树打分后，每个分枝就都得出分值，计算机会给你换算成bootstrap值。

重排的序列有很多组合，值越小说明分枝的可信度越低，最好根据数据的情况选用不同的构树方法和模型。

系统进化树制作步骤MEGA5.10

系统进化树制作步骤MEGA5.10系统进化树制作步骤MEGA5.1
先要把格式弄成该软件识别的meg格式，fasta格式也⾏，只要能够导⼊1导⼊，点击左上⾓Align，选择创建新的⽐对Alignment，点击OK，
2提⽰创建DNA分析⽂件，进⼊如下右边界⾯
3打开fasta格式的序列⽂件，如下
4选择Alignment中的⽐对选项，使⽤Clastaw⽐对，会有⽐对参数，默认即可，点OK，会⾃⾏完成⽐对。

5⽐对好的⽂件须保存，选Data中的save session，提⽰保存命名
即导⼊数据如右。

7选中带有TA的⽅框，如上图，点击主界⾯上的进化树选项，如下图中间，可选择不同的进化树类型，⼀般⽤NJ树。

8出现提⽰参数，默认即可，点compute执⾏。

会完成进化树
9做好的进化树可以以图⽚⽅式保存。

MEGA5使用说明

MEGA软件——系统发育树构建方法（图文讲解）
2012年12月02日⁄Evolution⁄字号小中大⁄评论 3 条⁄阅读 3,872 次[点击加入在线收藏夹]
一、序列文本的准备
构树之前先将目标基因序列都分别保存为txt文本文件中（或者把所有序列保存在同一个txt文本中,可以用“>基因名称”作为第一行，然后重起一行编辑基因序列），序列只包含序列字母（ATCG或氨基酸简写字母）。

文件名名称可以已经您的想法随意编辑。

二、序列导入到Mega 5软件
（1）打开Mega 5软件，界面如下
（2）导入需要构建系统发育树的目的序列
OK
选择分析序列类型（如果是DNA序列，点击DNA，如果是蛋白序列，点击Protein）
出现新的对话框，创建新的数据文件
选择序列类型
导入序列
导入序列成功。

（3）序列比对分析
点击工具栏中“W”工具，进行比对分析，比对结束后删除两端不能够完全对齐碱基
（4）系统发育分析
关闭窗口，选择保存文件路径，自定义文件名称
三、系统发育树构建
根据不同分析目的，选择相应的分析算法，本例子以N—J算法为例
Bootstrap 选择1000，点击Compute，开始计算
计算完毕后，生成系统发育树。

根据不同目的，导出分析结果，进行简单的修饰，保存
本方法来自网络，经小编microibs编辑，修改补充，如果转载请注明PLoB出处。

MEGA 软件——系统发育树构建方法

• 双击图标
，
• 下载下来的序列片段保存文件为FASTA格式，打开方式为TXT格式。 • 将Blast对比后所Download的序列筛选后，构建系统发育进化树。 • 构建系统发育树需要测序所得序列1个，Blast对比得出序列5-10个，构建出的为单枝系统发育进化树。通过这个对比可以确定出所测定的序列最相似物种，当相似度为99%甚至100%时，基本可以确定所测定的基因序列所属物种。
ME待测PCR产物送测序后，一个星期左右会得到生物公司发的邮件，里面包含测序结果的附件，下载后得到文件压缩包，将文件包解压，可以看到文件夹里有文件
• 测序公司会提供一款解读软件Chromas，免安装类型，能够直接打开测序结果并通过软件直接进入NCBI数据库进行Blast搜索。
• 可培养真菌可以选定对比物种种属后构建大型系统发育进化树，不可培养真菌则可直接构建系统发育进化树。
• 双击
后打开MEGA软件

干货师兄，我想用MEGA建个树，咋整？

干货师兄，我想用MEGA建个树，咋整？作者：解螺旋.冬至转载需授权并注明来源：解螺旋，医生科研助手师妹：师兄，我想建个树。

师兄：啥树啊！你家的family tree啊？师妹：师兄，你不要调戏我，我就建一个简单的进化树！这个怎么做啊？简单呀，你可以用MEGA，先去MEGA官网（/）下载这个软件，免费的啊。

MEGA（Molecular Evolutionary Genetics Analysis ）是一个功能非常强大的分子进化遗传分析软件，可用于序列比对、进化树的推断、估计分子进化速度、验证进化假说等。

下面师兄给你详细介绍如何利用Mega软件构建进化树。

1.首先将需要进行建树的序列保存为fasta格式，并将文件扩展名改为.fasta。

.fasta序列格式以“>”开头。

“>”后面这一行写名称，回车，下一行写序列，氨基酸序列类似，所有序列保存在一个txt文件中。

例如：>gene1/speciesname NCBI accession numberATCGGCGTAGCTAGATGCTAGTATCGTA>gene1/speciesname NCBI accession numberAGTAGCTAGTGATGTA2. 点击Align－－Edit／built Alignment，选择创建一个新的比对，点OK根据要求选择DNA或者蛋白质序列3.打开需要比对的.fasta文件4. 点击Alignment－Align by Clustal W，选择所有序列，出现下图，所有参数为默认，点击OK。

5. 我们看到在未对齐之前，由于序列长度不一样，有些序列长出来很多，而有的序列在这些位点全是gap，为了排除gap位点的干扰。

我们需要将序列两端对齐。

两端以比对上最短的序列为准，删除其他序列5’和3’多余的部分，可以看到在序列比对上的部分，最上面一行软件标记为“*”，我们需要将没有标记“*”的位点删除，可以用shift一起选择没有标记“*”开始和末端的位点，选好后点击鼠标右键，单击delete删除。

使用mega构建进化树的流程

使用mega构建进化树的流程下载温馨提示:该文档是我店铺精心编制而成，希望大家下载以后，能够帮助大家解决实际的问题。

文档下载后可定制随意修改，请根据实际需要进行相应的调整和使用，谢谢!并且，本店铺为大家提供各种各样类型的实用资料，如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等，如想了解不同资料格式和写法，敬请关注!Download tips: This document is carefully compiled by theeditor. I hope that after you download them,they can help yousolve practical problems. The document can be customized andmodified after downloading,please adjust and use it according toactual needs, thank you!In addition, our shop provides you with various types ofpractical materials,such as educational essays, diaryappreciation,sentence excerpts,ancient poems,classic articles,topic composition,work summary,word parsing,copy excerpts,other materials and so on,want to know different data formats andwriting methods,please pay attention!使用 MEGA 构建进化树的流程如下：1. 数据准备：收集需要构建进化树的序列数据，可以是 DNA 序列或蛋白质序列。

MEGA构建系统进化树的步骤(以MEGA7为例)教学文案

M E G A构建系统进化树的步骤(以M E G A7为例)MEGA构建系统进化树的步骤（以MEGA7为例）本文是看中国慕课山东大学生物信息学课程总结出来的分子进化的研究对象是核酸和蛋白质序列。

研究某个基因的进化，是用它的DNA序列，还是翻译后的蛋白质序列呢？序列的选取要遵循以下原则：1）如果DNA序列的两两间的一致度≥70%，选用DNA序列。

因为，如果DNA序列都如此相似，它的蛋白质会相似到看不出区别，这对构建系统发生树是不利的。

所以这种情况下应该选用DNA序列，而不选蛋白质序列。

2）如果DNA 序列的两两间的一致度≤70%，DNA序列和蛋白质序列都可以选用。

1. 将要用于构建系统进化树的所有序列合并到同一个fasta格式文件，注意：所有序列的方向都要保持一致 ( 5’-3’)。

想要做系统发生树先要做多序列比对，然后把多序列比对的结果提交给建树软件进行建树，所以在用MEGA建树时可以输入一个已经比对好的多序列比对，也可以输入一条原始序列，让MEGA先来做多序列比对，再建树（一般我们都是原始序列）。

所以我们以后者为例。

2.打开MEGA软件，选择主窗口的”File”→“Open A File”→找到并打开fasta 文件，这时会询问以何种方式打开，我们是原始序列，需要先进行多序列比对，所以选择“Align”。

如果是比对好的多序列比对可以直接选择“Analyze”。

3.在打开的Alignment Explorer窗口中选择”Alignment”-“Align by ClustalW”进行多序列比对（MEGA提供了ClustalW和Muscle两种多序列比对方法，这里选择熟悉的ClustalW），弹出窗口询问“Nothing selected for alignment，Selectall？”选择“OK”。

4. 之后，弹出多序列比对参数设置窗口。

这个窗口和EMBL在线多序列比对一样，可以设置替换记分矩阵、不同的空位罚分（罚分填写的是正数，计算时按负数计算）等参数。

怎样使用MEGA建立进化树

怎样使用MEGAt 立进化树如何使用MEGA4.0#立进化树 1、首先是双击软件打开如下图所示|M| ijaKMr3 valj 141 Mrhr ArgrwricQt iVvta“qplii ：护忏冲 i 二客H - I 号筍需.廿星"LIF M ■ H 、-| II ■ DKi -Mjrsrze: H r« r-r r ^c>az^ LCS2、现在是处于DNA序列，而我们要做蛋白质的进化树的话，就如下操作M4. Aligmr>&nl Explof頁H L lQnmt*Ftji Editm e祁3、接下来我们要进行序列的输入，点击左边那个红箭头，贝U出现下面的窗口刚M4： Alfgnment Explorer匚;日屯EJrt S«ar di Aflgmnenl Wfrb $e<)□ d| D ◎日「蹇輻酋1 41象Protein S^quer匚弊1|主曲色"匕色丄4、然后右击sequenee 1,修改名字，如改成DPVFrotejn Sequence?5、然后从Word里复制蛋白质序列，然后在下面的位置粘贴G 辱CopfPTCtfiT X CU,書 f sterna6则可出现如下图的序列了□ QCW1C3 iRWfl Wq^ri[ V^i>n irequ^Ki 幷册枷・1話皿讥曲佰i"—喇・ct Mgeirc 惟■ sy7、然后点击窗口上的保存图标保存 8、重复从3开始，直到你的序列输入完9、序列输入元后进行最后的保存，方法如下垂邑trit 5|讨之斗和"1 of op«r * dow亠 P TOUMT 1 <io-jrr<n接下来打开册b M 罗哥 H*lpi t X t tt b要输入ul7两次保存名字一然后关闭这个窗口出现下面这个窗口■■■MM Jfc接下来就可以建立各种样式的进化树〜乜 MdngHie-r jein^ IMJL* &? Wrigym 佔抽杓也山-« UW3ML ■> ■小h,鼻陆01申*貝Trfl 和 Hi^Tgrn^ ，HnNkk T ivn HnM "d i-Oi^4*cflArs R 协 FriWrt '^l^diCNHE軒I 匚 fkrti tiiitanr-ri : hy A 护产就匸沁”-嗯，只是把过程写出来，方便大家建立进化树，不足的地方，大家补充好〜。

用MEGA构建进化树

如何用MEGA构建进化树MEGA3.1是一个关于序列分析以及比较统计的工具包，其中包括有距离建树法和MP 建树法；可自动或手动进行序列比对，推断进化树，估算分子进化率，进行进化假设测验，还能联机的Web数据库检索。

下载后可直接使用，主要包括几个方面的功能软件：i)DNA 和蛋白质序列数据的分析软件。

ii)序列数据转变成距离数据后，对距离数据分析的软件。

iii)对基因频率和连续的元素分析的软件。

iv)把序列的每个碱基/氨基酸独立看待（碱基/氨基酸只有0和1的状态）时，对序列进行分析的软件。

v)绘制和修改进化树的软件，进行网上blast搜索。

用MEGA构建进化树有以下步骤：1. 16S rDNA测序和参考序列选取从环境中分离到单克隆，去重复后扩增16S rDNA序列并测序，然后与数据库比对，找到相似度最高的几个序列，确定一下你分离的细菌大约属于哪个科哪个属，如果相似度达到百分之百那基本可以确定你分离得到的就是Blast到的那个，然后找一到两个同科的，再找一到两个同目的，再找一到两个同纲的细菌，把序列全部下下来，以FSATA形式整合在TXT 文档中，如>TS1GCAGTCGAACGATGAAGCCCAGCTTGCTGGGTGGA TTAGTGGCGAACGGGTGAGTAA CACGTGGGTGATCTGCCCTGCACTTCGGGATAAGCCTGGGAAACTGGGTCTAATACCG GA TAGGACCTCGGGA TGCA TGTTCCGGGGTGGAAAGGTTTTCCGGTGCAGGATGGGCC>gi|117572706|gb|EF028124.1| Rhodococcus sp. Atl25 16S ribosomal RNA gene, partial sequence CGATTAGAGTTTGA TCCTGGCTCAGGACGAACGCTGGCGGCGTGCTTAACACATGCAA GTCGAACGATGAAGCCCAGCTTGCTGGGTGGA TTAGTGGCGAACGGGTGAGTAACAC GTGGGTGATCTGCCCTGCACTTCGGGATAAGCCTGGGAAACTGGGTCTAA TACCGGA T>TS2TGCAAGTCGAGCGAATGGA TTAAGAGCTTGCTCTTA TGAAGTTAGCGGCGGACGGGTG AGTAACACGTGGGTAACCTGCCCA TAAGACTGGGATAACTCCGGGAAACCGGGGCTAA TACCGGATAACA TTTTGAACTGCATGGTTCGAAA TTGAAAGGCGGCTTCGGCTGTCACT>gi|56383044|emb|AJ809498.1| Bacillus cereus partial 16S rRNA gene, strain TMW 2.383GA TGAACGCTGGCGGCGTGCCTAA TACATGCAAGTCGAGCGAA TGGATTAAGAGCTTG CTCTTATGAAGTTAGCGGCGGACGGGTGAGTAACACGTGGGTAACCTGCCCA TAAGAC TGGGATAACTCCGGGAAACCGGGGCTAATACCGGATAACATTTTGAACYGCATGGTTC ………………………….………………………….参考序列选择有几个原则：a，不选非培养(unclutured)微生物为参比；b，所选参考序列要正确，里面无错误碱基；c，在保证同属的前提下，优先选择16S rDNA全长测序或全基因组测序的种；d，每个种属选择一个参考序列，如果自己的序列中同一属的较多，可适当选择两个参考序列。

MEGA构建系统进化树的步骤(以MEGA7为例)教学文案

M E G A构建系统进化树的步骤(以M E G A7为例)MEGA构建系统进化树的步骤（以MEGA7为例）本文是看中国慕课山东大学生物信息学课程总结出来的分子进化的研究对象是核酸和蛋白质序列。

研究某个基因的进化，是用它的DNA序列，还是翻译后的蛋白质序列呢？序列的选取要遵循以下原则：1）如果DNA序列的两两间的一致度≥70%，选用DNA序列。

因为，如果DNA序列都如此相似，它的蛋白质会相似到看不出区别，这对构建系统发生树是不利的。

所以这种情况下应该选用DNA序列，而不选蛋白质序列。

2）如果DNA 序列的两两间的一致度≤70%，DNA序列和蛋白质序列都可以选用。

1. 将要用于构建系统进化树的所有序列合并到同一个fasta格式文件，注意：所有序列的方向都要保持一致 ( 5’-3’)。

想要做系统发生树先要做多序列比对，然后把多序列比对的结果提交给建树软件进行建树，所以在用MEGA建树时可以输入一个已经比对好的多序列比对，也可以输入一条原始序列，让MEGA先来做多序列比对，再建树（一般我们都是原始序列）。

所以我们以后者为例。

2.打开MEGA软件，选择主窗口的”File”→“Open A File”→找到并打开fasta 文件，这时会询问以何种方式打开，我们是原始序列，需要先进行多序列比对，所以选择“Align”。

如果是比对好的多序列比对可以直接选择“Analyze”。

3.在打开的Alignment Explorer窗口中选择”Alignment”-“Align by ClustalW”进行多序列比对（MEGA提供了ClustalW和Muscle两种多序列比对方法，这里选择熟悉的ClustalW），弹出窗口询问“Nothing selected for alignment，Selectall？”选择“OK”。

4. 之后，弹出多序列比对参数设置窗口。

这个窗口和EMBL在线多序列比对一样，可以设置替换记分矩阵、不同的空位罚分（罚分填写的是正数，计算时按负数计算）等参数。

利用mega构建树原理

利用mega构建树原理
Mega构建树的原理主要基于系统发育树（又称分子进化树）的概念。

这是一种描述一群有机体发生或进化顺序的拓扑结构，用于在生物信息学中描述不同生物之间的相关关系。

拓扑结构将讨论范围内的事物之间的相互关系表示出来，将这些事物之间的关系通过图表示出来。

Mega软件可用于序列比对、进化树的推断、估计分子进化速度、验证进化假说等。

在构建系统发育树时，它采用了一系列的算法和模型，如邻接法（NJ）、最大似然法（ML）、最大简约法（MP）和贝叶斯法（Bayes）等。

这些方法和模型的选择取决于具体的数据和研究目标。

构建系统发育树的一般过程包括以下几个步骤：
1. 数据准备：收集需要研究的物种的基因或蛋白序列，并进行比对，以确保它们的同源性。

比对的结果可以保存为特定的格式，如FASTA。

2. 模型选择：根据数据的特性，选择一个合适的进化模型。

例如，对于DNA序列，可以选择GTR、TN93、HKY等模型；对于蛋白序列，可以选择JTT、WAG、LG等模型。

3. 树的构建：使用选择的模型和方法，构建系统发育树。

这个过程可能包括搜索最优的树结构、计算分支长度等。

4. 树的评估和优化：通过一些统计方法，如自展值（Bootstrap）等，对构建的树进行评估和优化，以提高其可靠性。

需要注意的是，构建系统发育树是一个复杂的过程，需要一定的专业知识和经验。

同时，由于生物进化的复杂性，构建的树可能并不完全准确，需要结合其他证据进行解释和验证。

科研快速组图方法介绍利用MEGA构建系统演化树

贴图基本用法及剪贴板贴图
贴图分组保存
比如我当前在为问题 A 查找资料，所以建立了一堆和 A 相关的贴图，但之后我因为各种原因不得不停下问题 A，转去解决问题 B，我不希望问题 A 的贴图继续占用我的屏幕空间，妨碍我对问题 B 的思考，这时候我就新建一个分组，切换过去，就可以开始为问题 B 弄一堆贴图了，而我也可以随时再切换回问题 A 的分组去继续处理它。
使用PPT组图
使用PS组图
1. 整理图片：按顺序分组，重命名 1. 整理图片：按顺序分组，重命名原
原始图片
始图片
2. 将原始图片分组导入到PPT中 2. 根据原始图片的大小和数目，计算
3. 拖动，对齐，平均分布图片，组新建图层大小，在PS中新建图层
合对象
3. 将原始图片导入到PS中，在复制到
4. 添加文字标注
MEGA 的全称是Molecular Evolutionary Genetics Analysis（分子演化遗传分析）。MEGA 主要用于多序列比对、构建系统演化树及评估演化关系可靠性等，是一款免费软件。
构建演化树的一般方法为： 1. 进行多序列比对 (MSA) 2. 选择建树方法：距离法、最大简约法，最大似然法和贝叶斯法 3. 建立演化树及评估可靠性
2018年春季经验交流
1. 科研快速组图方法介绍 2. 利用MEGA构建系统演化树 3. 实用截图工具Snipaste推荐
汇报人：XX 时间：2018-3-27
交流内容
1. 图片类型及格式简介 2. PPT与PS常规组图方法演示 3. Photoshop快速组图动作包SciPicMatrix介绍 4. SciPicMatrix安装及效果演示 5. PPT对图片的压缩 6. MEGA构建演化树 7. 实用截图工具Snipaste推荐

Mega的使用以及进化树的绘制

Mega的使⽤以及进化树的绘制1.MEGA构建系统进化树的步骤2.CLUSTALX进⾏序列⽐对1.MEGA构建系统进化树的步骤1. 将要⽤于构建系统进化树的所有序列合并到同⼀个fasta格式⽂件，注意：所有序列的⽅向都要保持⼀致( 5’-3’)。

如图：2. 打开MEGA软件，选择"Alignment" - "Alignment Explorer/CLUSTAL"，在对话框中选择Retrieve sequences from a file, 然后点OK，找到准备好的序列⽂件并打开，如图：。

3. 在打开的窗⼝中选择”Alignment”-“Align by ClustalX” 进⾏对齐，对齐过程需要⼀段时间，对齐完成后，最好将序列两端切齐，选择两端不齐的部分，单击右键，选择delete即可，如图：。

4. 关闭当前窗⼝，关闭的时候会提⽰两次否保存，第⼀次⽆所谓，保存不保存都可以，第⼆次⼀定要保存，保存的⽂件格式是.meg。

根据提⽰输⼊Title，然后会出现⼀个对话框询问是否是Protein-coding nucleotide sequence data, 根据情况选择Yes或No。

最后出现⼀个对话框询问是否打开，选择Yes，如图：。

5. 回到MEGA主窗⼝，在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” -“Neighbor-joining”，打开⼀个窗⼝，⾥⾯有很多参数可以设置，如何设置这些参数请参考详细的MEGA说明书，不会设置就暂且使⽤默认值，不要修改，点击下⾯的Compute按钮，系统进化树就画出来了，如图：在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Minimun-evolution”,如图：在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Maximun-parsimony”,如图：在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“UPGMA”，如图：6. 最后，使⽤TreeExplorer窗⼝中提供的⼀些功能可以对⽣成的系统进化树进⾏调整和美化。

构建系统进化树的详细步骤

构建系统进化树的详细步骤1. 建树前的准备工作相似序列的获得——BLASTBLAST是目前常用的数据库搜索程序,它是Basic Local Alignment Search Tool 的缩写,意为“基本局部相似性比对搜索工具”Altschul et al.,199062;199763;国际著名生物信息中心都提供基于Web的BLAST服务器;BLAST算法的基本思路是首先找出检测序列和目标序列之间相似性程度最高的片段,并作为内核向两端延伸,以找出尽可能长的相似序列片段;首先登录到提供BLAST服务的常用网站,比如国内的CBI、美国的NCBI、欧洲的EBI和日本的DDBJ;这些网站提供的BLAST服务在界面上差不多,但所用的程序有所差异;它们都有一个大的文本框,用于粘贴需要搜索的序列;把序列以FASTA格式即第一行为说明行,以“>”符号开始,后面是序列的名称、说明等,其中“>”是必需的,名称及说明等可以是任意形式,换行之后是序列粘贴到那个大的文本框,选择合适的BLAST程序和数据库,就可以开始搜索了;如果是DNA序列,一般选择BLASTN搜索DNA数据库;这里以NCBI为例;登录NCBI主页-点击BLAST-点击Nucleotide-nucleotide BLAST blastn-在Search文本框中粘贴检测序列-点击BLAST-点击Format-得到result of BLAST;BLASTN结果如何分析参数意义:>gi||gb|| Nocardia sp. ATCC 49872 16S ribosomal RNA gene, completesequenceScore = 2020 bits 1019, Expect =Identities = 1382/1497 92%, Gaps = 8/1497 0% Strand = Plus / PlusQuery: 1 gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggaaaggccctttcgggggt 60|||||||||||||||||||||||||||||||||||||||||| ||||||||| ||||| Sbjct: 1 gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggtaaggcccttc--ggggt 58Query: 61 actcgagcggcgaacgggtgagtaacacgtgggtaacctgccttcagctctgggataagc 120|| ||||||||||||||||||||||||||||||| | |||||| ||||||||||||| Sbjct: 59 acacgagcggcgaacgggtgagtaacacgtgggtgatctgcctcgtactctgggataagc 118Score :指的是提交的序列和搜索出的序列之间的分值,越高说明越相似; Expect:比对的期望值;比对越好,expect越小,一般在核酸层次的比对,expect小于1e-10,就比对很好了,多数情况下为0;Identities:提交的序列和参比序列的相似性,如上所指为1497个核苷酸中二者有1382个相同;Gaps:一般翻译成空位,指的是对不上的碱基数目;Strand:链的方向,Plus / Minus意味着提交的序列和参比序列是反向互补的,如果是Plus /Plus则二者皆为正向;序列格式:FASTA格式由于EMBL和GenBank数据格式较为复杂,所以为了分析方便也出现了十分简单的FASTA数据格式;FASTA格式又称为Pearson格式,该种序列格式要求序列的标题行以大于号“>”开头,下一行起为具体的序列;一般建议每行的字符数不超过60或80个,以方便程序处理;多条核酸和蛋白质序列格式即将该格式连续列出即可,如下所示:>1 aaattgaaga gtttgatcat ggctcagatt gaacgctggc ggcaggccta acacatgcaa61 gtcgaacggt aacaggaaga agcttgcttc tttgctgacg agtggcggac ……>AY631071 Jiangella gansuensis YIM 002 1 gacgaacgct ggcggcgtgc ttaacacatg caagtcgagc ggaaaggccc tttcgggggt61 actcgagcgg cgaacgggtg agtaacacgt gggtaacctg ccttcagctc tgggataagc……其中的…>‟为Clustal X默认的序列输入格式,必不可少;其后可以是种属名称,也可以是序列在Genbank中的登录号Accession No.,自编号也可以,不过需要注意名字不能太长,一般由英文字母和数字组成,开首几个字母最好不要相同,因为有时Clustal X程序只默认前几位为该序列名称;回车换行后是序列;将检测序列和搜索到的同源序列以FASTA格式编辑成为一个文本文件例:C:\temp\,即可导入Clustal X 等程序进行比对建树; 2. 构建系统树的相关软件和操作步骤构建进化树的主要步骤是比对,建立取代模型,建立进化树以及进化树评估;鉴于以上对于构建系统树的评价,结合本实验室实际情况,以下主要介绍N-J Tree构建的相关软件和操作步骤;用Clustal X构建N-J系统树的过程1 打开Clustal X程序,载入源文件.File-Load sequences- C:\temp\. 2 序列比对Alignment - Output format options - Clustal format; CLUSTALW sequence numbers: ONAlignment - Do complete alignment Output Guide Tree file,C:\temp\;Output Alignment file, C:\temp\; Alignwaiting……等待时间与序列长度、数量以及计算机配置有关;3 掐头去尾File-Save Sequence as…Format: CLUSTALGDE output case: LowerCLUSTALW sequence numbers: ONSave from residue: 39 to 1504 以前后最短序列为准Save sequence as: C:\temp\ OK将开始和末尾处长短不同的序列剪切整齐;这里,因为测序引物不尽相同,所以比对后序列参差不齐;一般来说,要“掐头去尾”,以避免因序列前后参差不齐而增加序列间的差异;剪切后的文件存为ALN格式;4 File-Load sequences-Replace existing sequences-Yes- C:\temp\重新载入剪切后的序列;5 Trees-Output Format Options Output Files : CLUSTAL format tree Phylip format tree Phylip distance matrix Bootstrap labels on: NODECLOSETrees-Exclude positions with gaps Trees-Bootstrap N-J Tree :Random number generator seed1-1000 : 111 Number of bootstrap trails1-1000: 1000 SAVE CLUSTAL TREE AS: C:\temp\ SAVE PHYLIP TREE AS: C:\temp\ OKwaiting……等待时间与序列长度、数量以及计算机配置有关;在此过程中,生成进化树文件.njbphb,可以用TreeView打开查看;6 Trees-Draw N-J TreesSAVE CLUSTAL TREE AS: C:\temp\ SAVE PHYLIP TREE AS: C:\temp\ SAVE DISTANCE MATRIX AS: C:\temp\ OK此过程中生成的报告文件.nj比较有用,里面列出了比对序列两两之间的相似度,以及转换和颠换分别各占多少;7 TreeViewFile-Open-C:\temp\Tree- phylogramunrooted, slanted cladogram,Rectangular cladogram多种树型 Tree- Show internal edge labels Bootstrap value显示数值Tree- Define outgroup… ingroup >> outgroup OK定义外群Tree- Root with outgroup通常需要对进化树进行编辑,这时首先要Edit-Copy至PowerPoint上,然后Copy 至Word上,再进行图片编辑;如果直接Copy至Word则显示乱码,而进化树不能正确显示; Mega建树虽然Clustal X可以构建系统树,但是结果比较粗放,现在一般很少用它构树,Mega因为操作简单,结果美观,很多研究者选择用它来建树;1 首先用Clustal X进行序列比对,剪切后生成C:\temp\文件;同上2 打开BioEdit 程序,将目标文件格式转化为FASTA格式,File-Open- C:\temp\,File-Save As- C:\temp\ ;3 打开Mega程序,转化为mega格式并激活目标文件,File-Convert To MEGA Format- C:\temp\C:\temp\ ,关闭Text Editor窗口-Do you want to save your changes before closing-Yes; Click me to activate a data file- C:\temp\Protein-coding nucleotide sequence data-No;Phylogeny-Neighbor-JoiningNJDistance Options-Models-Nucleotide: Kimura 2-parameter;d: Transitions+Transversions;Include Sites-Pairwise DeletionTest of Phylogeny-Bootstrap; Replications 1000; Random Seed 64238OK;开始计算,得到结果;4 Image-Copy to Clipboard-粘贴至Word文档进行编辑;此外,Subtree中提供了多个命令可以对生成的进化树进行编辑,Mega窗口左侧提供了很多快捷键方便使用;View中则给出了多个树型的模式;下面只介绍几种最常用的: Subtree-Swap:任意相邻两个分支互换位置;-Flip:所选分支翻转180度;-Compress/Expand:合并/展开多个分支;-Root:定义外群;View-Topology:只显示树的拓扑结构;-Tree/Branch Style:多种树型转换;-Options:关于树的诸多方面的改动;TREECON打开Clustal X,File-Load ,File-Save Sequence as…Format-PHYLIP;Save from residue-1 to 末尾;Save sequence as : C:\temp\;打开TREECON程序,1 Distance estimation点击Distance estimation-Start distance estimation,打开上面保存的文件,Sequence Type-Nuleic Acid Sequence,Sequence format-PHYLIP interleaved,Select ALL,OK; Distance Estimation-Jukes&Cantoror Kimura,Alignment positions-All,Bootstrap analysis-Yes,Insertions&Deletions-Not taken into account,OK;Bootstrap samples-1000,OK;运算,等待……Finished-OK;2 Infer tree topology点击Infer tree topology-Start inferring tree topology,Method-Neighbor-joining, Bootstrapanalysis-Yes,OK.;运算,等待……Finished-OK;3 Root unrooted trees点击Root unrooted trees-Start rooting unrooted trees,Outgroup opition-single sequenceforced,Bootstrap analysis-Yes,OK;Select Root-X89947,OK;运算,等待……Finished-OK;4 Draw phylogenetic tree点击Draw phylogenetic tree,File-Open-new tree,Show-Bootstrap values/ Distance scale; File-Copy,粘贴至Word文档,编辑;TREECON的操作过程看起来似乎较MEGA烦琐,且运算速度明显不及MEGA,如果参数选择一样,用它构建出来的系统树几乎和MEGA构建的完全一样,只在细节上,比如Bootstrap值二者在某些分支稍有不同;在参数选择方面,TREECON和MEGA 也有些不同,但总体上相差不大;PHYLIPPHYLIP是多个软件的压缩包,下载后双击则自动解压;当你解压后就会发现PHYLIP 的功能极其强大,主要包括五个方面的功能软件:i,DNA和蛋白质序列数据的分析软件;ii,序列数据转变成距离数据后,对距离数据分析的软件; iii,对基因频率和连续的元素分析的软件;iv,把序列的每个碱基/氨基酸独立看待碱基/氨基酸只有0和1的状态时,对序列进行分析的软件;v,按照DOLLO简约性算法对序列进行分析的软件;vi,绘制和修改进化树的软件;在此,主要对DNA序列分析和构建系统树的功能软件进行说明; 1 生成PHY格式文件首先用Clustal X等软件打开剪切后的序列文件C:\temp\另存为C:\temp\使用File-Save Sequences As命令,Format项选“PHY”;用BioEdit或记事本打开2 打开Phylip软件包里的SEQBOOT: can't find input file "infile" Please enter a new file name> C:\temp\ 按路径输入刚才生成的 .PHY文件,显示如下:Bootstrapping algorithm, versionSettings for this run:D Sequence, Morph, Rest., Gene Freqs Molecular sequences J Bootstrap, Jackknife, Permute, Rewrite Bootstrap B Block size for block-bootstrapping 1 R How many replicates 100W Read weights of characters NoC Read categories of sites NoF Write out data sets or just weights Data sets I Input sequences interleaved Yes0 Terminal type none1 Print out the data at start of run No2 Print indications of progress of run YesY to accept these of type the letter for one to changeRNumber of replicates1000Settings for this run:D Sequence, Morph, Rest., Gene Freqs Molecular sequences J Bootstrap, Jackknife, Permute, Rewrite Bootstrap B Block size for block-bootstrapping 1 R How many replicates 1000W Read weights of characters NoC Read categories of sites NoF Write out data sets or just weights Data sets I Input sequences interleaved Yes0 Terminal type IBM PC 1 Print out the data at start of run No2 Print indications of progress of run YesY to accept these of type the letter for one to changeYRandom number seed must be odd5any odd numbercompleted replicate number 100completed replicate number 200completed replicate number 300completed replicate number 400completed replicate number 500completed replicate number 600completed replicate number 700completed replicate number 800completed replicate number 900completed replicate number 1000上面的D、J、R、I、O、1、2代表可选择的选项,键入这些字母后敲回车键,程序的条件就会发生改变;D选项无须改变;J选项有三种条件可以选择,分别是Bootstrap、Jackknife和Permute;R选项让使用者输入republicate的数目;所谓republicate就是用Bootstrap法生成的一个多序列组;根据多序列中所含的序列的数目的不同可以选取不同的republicate;当我们设置好条件后,键入Y按回车;得到一个文件outfile:C:\Program Files\Phylip\exe\ outfile.重命名outfile infile;3 打开Nucleic acid sequence Distance Matrix program, versionSettings for this run:D Distance F84 G Gamma distributed rates across sites No T Transition/transversion ratio C One category of substitution rates Yes W Use weights for sites NoF Use emperical base frequencies Yes L Form of distance matrix SquareM Analyze multiple data sets NoI Input sequences interleaved Yes0 Terminal type 1 Print out the data at start of run No 2 Print indications of progress of run YesY to accept these of type the letter for one to changedD Distance Kimura 2-parametermMultiple data sets or multiple weighs type D or W dHow many data sets1000Settings for this run:D Distance Kimura 2-parameterG Gamma distributed rates across sites No T Transition/transversion ratio C One category of substitution rates Yes W Use weights for sites NoF Use emperical base frequencies YesL Form of distance matrix SquareM Analyze multiple data sets Yes, 1000 data sets I Input sequences interleaved Yes0 Terminal type IBM PC 1 Print out the data at start of run No 2 Print indications of progress of run YesY to accept these of type the letter for one to changeY选项D有四种距离模式可以选择,分别是Kimura 2-parameter、Jin/Nei、Maximum-likelihood和Jukes-Cantor;选项T一般键入一个之间的数字;选项M 键入1000;运行后生成文件C:\Program Files\Phylip\exe\ outfile;重命名outfile infile;4 打开Neighbor-Joining/UPGMA method versionSettings for this run:N Neighbor-Joining or UPGMA tree Neighbor-Joining O Outgroup root No, Use as outgroup species 1 L Lower-triangular data metrix NoR Upper-triangular data metrix NoS Subreplication NoJ Randomize input order of species No, Use input order M Analyze multiple data sets No0 Terminal type 1 Print out the data at start of run No 2 Print indications of progress of run Yes 3 Print out tree Yes4 Write out trees onto tree file YesY to accept these of type the letter for one to changemHow many data sets1000Random number seed must be odd5Settings for this run:N Neighbor-Joining or UPGMA tree Neighbor-Joining O Outgroup root No, Use as outgroup species 1 L Lower-triangular data metrix NoR Upper-triangular data metrix NoS Subreplication NoJ Randomize input order of species YesM Analyze multiple data sets Yes, 1000 sets 0 Terminal type IBM PC 1 Print out the data at start of run No 2 Print indications of progress of run Yes 3 Print out tree Yes4 Write out trees onto tree file YesY to accept these of type the letter for one to changeY生成文件C:\Program Files\Phylip\exe\ outtree&outfile;重命名outtreeintree;outfileinfile;打开Consensus tree program, versionSettings for this run:C Consensus type Majority rule extendedO Outgroop root No, use as outgroup species 1R Trees to be treated as Rooted NoT Terminal type 1 Print out the sets of the species Yes 2 Print indications of progress of run Yes 3 Print out tree Yes4 Write out trees onto tree file YesAre these settings correctRTSettings for this run:C Consensus type Majority rule extendedR Trees to be treated as Rooted YesT Terminal type IBM PC 1 Print out the sets of the species Yes 2 Print indications of progress of run Yes3 Print out tree Yes4 Write out trees onto tree file Yes Y生成文件C:\Program Files\Phylip\exe\ outtree;重命名outtree ;打开TreeView打开C:\Program Files\Phylip\exe\ ;以下操作参照前述详细说明即可;。