Mega的使用以及进化树的绘制
系统进化树制作步骤MEGA5.10
系统进化树制作步骤MEGA5.10系统进化树制作步骤MEGA5.1
先要把格式弄成该软件识别的meg格式,fasta格式也⾏,只要能够导⼊1导⼊,点击左上⾓Align,选择创建新的⽐对Alignment,点击OK,
2提⽰创建DNA分析⽂件,进⼊如下右边界⾯
3打开fasta格式的序列⽂件,如下
4选择Alignment中的⽐对选项,使⽤Clastaw⽐对,会有⽐对参数,默认即可,点OK,会⾃⾏完成⽐对。
5⽐对好的⽂件须保存,选Data中的save session,提⽰保存命名
即导⼊数据如右。
7选中带有TA的⽅框,如上图,点击主界⾯上的进化树选项,如下图中间,可选择不同的进化树类型,⼀般⽤NJ树。
8出现提⽰参数,默认即可,点compute执⾏。
会完成进化树
9做好的进化树可以以图⽚⽅式保存。
系统进化树绘制
MEGA:系统进化树绘制1.从测序公司获取可以用TXT格式打开的菌株16SrDNA序列文本信息;2.打开NCBI网站(https:///),依次点击BlAST—>Microbes,进入最下图所示界面。
3.将序列信息粘贴到黄色文本框内,点击BLAST按钮,进入比对结果页面,根据所需选择20条(参考)相似序列信息,点击Download,下载FASTA(aligned sequences)格式序列信息到电脑;4.将测序所得序列信息与Blast所得序列信息合并到同一个Text文件中;5.打开MEGA软件(以MEGA6.06为例),点击Align—>Edit/Build Alignment,选择Creat a new alignment并点击OK,点击DNA,进入最下图界面,最大化子界面;6.点击下图红线圈出的图标或通过Edit—>Insert Sequence From File Ctrl+I,进入第二个图所示界面,将文件格式由ABI改为Text,选择所选序列信息文件,点击打开;7.按住Shift,鼠标点击首条和最后一条多余的序列信息,即可选择某一需要删除的序列信息区域,点击Delete删除多余序列信息,并编辑各序列名称,点击保存编辑好的序列信息;8.点击Data—>Phylogenetic Analysis(系统进化分析),点击“Yes”完成系统进化分析;9.回到MEGA主页面,依次点击Analysis—>Phylogeny—>Construct/Test Neighbor-Joining Tree...,在跳出的界面中点击“Yes”,接着将跳出页面中的Test of Phylogeny项的None改为Bootstrap method,点击Compute,系统完成运算,生成系统进化树;10.依次点击Image—>Save as PDF file,保存成PDF格式系统发育树图谱。
用MEGA构建进化树
如何用MEGA构建进化树MEGA3.1是一个关于序列分析以及比较统计的工具包,其中包括有距离建树法和MP 建树法;可自动或手动进行序列比对,推断进化树,估算分子进化率,进行进化假设测验,还能联机的Web数据库检索。
下载后可直接使用,主要包括几个方面的功能软件:i)DNA 和蛋白质序列数据的分析软件。
ii)序列数据转变成距离数据后,对距离数据分析的软件。
iii)对基因频率和连续的元素分析的软件。
iv)把序列的每个碱基/氨基酸独立看待(碱基/氨基酸只有0和1的状态)时,对序列进行分析的软件。
v)绘制和修改进化树的软件,进行网上blast搜索。
用MEGA构建进化树有以下步骤:1. 16S rDNA测序和参考序列选取从环境中分离到单克隆,去重复后扩增16S rDNA序列并测序,然后与数据库/blast/Blast.cgi比对,找到相似度最高的几个序列,确定一下你分离的细菌大约属于哪个科哪个属,如果相似度达到百分之百那基本可以确定你分离得到的就是Blast到的那个,然后找一到两个同科的,再找一到两个同目的,再找一到两个同纲的细菌,把序列全部下下来,以FSATA形式整合在TXT文档中,如>TS1GCAGTCGAACGATGAAGCCCAGCTTGCTGGGTGGA TTAGTGGCGAACGGGTGAGTAA CACGTGGGTGATCTGCCCTGCACTTCGGGATAAGCCTGGGAAACTGGGTCTAATACCG GA TAGGACCTCGGGA TGCA TGTTCCGGGGTGGAAAGGTTTTCCGGTGCAGGATGGGCC>gi|117572706|gb|EF028124.1| Rhodococcus sp. Atl25 16S ribosomal RNA gene, partial sequence CGATTAGAGTTTGA TCCTGGCTCAGGACGAACGCTGGCGGCGTGCTTAACACATGCAA GTCGAACGATGAAGCCCAGCTTGCTGGGTGGA TTAGTGGCGAACGGGTGAGTAACAC GTGGGTGATCTGCCCTGCACTTCGGGATAAGCCTGGGAAACTGGGTCTAA TACCGGA T>TS2TGCAAGTCGAGCGAATGGA TTAAGAGCTTGCTCTTA TGAAGTTAGCGGCGGACGGGTG AGTAACACGTGGGTAACCTGCCCA TAAGACTGGGATAACTCCGGGAAACCGGGGCTAA TACCGGATAACA TTTTGAACTGCATGGTTCGAAA TTGAAAGGCGGCTTCGGCTGTCACT>gi|56383044|emb|AJ809498.1| Bacillus cereus partial 16S rRNA gene, strain TMW 2.383GA TGAACGCTGGCGGCGTGCCTAA TACATGCAAGTCGAGCGAA TGGATTAAGAGCTTG CTCTTA TGAAGTTAGCGGCGGACGGGTGAGTAACACGTGGGTAACCTGCCCATAAGAC TGGGATAACTCCGGGAAACCGGGGCTAATACCGGATAACATTTTGAACYGCATGGTTC ………………………….………………………….参考序列选择有几个原则:a,不选非培养(unclutured)微生物为参比;b,所选参考序列要正确,里面无错误碱基;c,在保证同属的前提下,优先选择16S rDNA全长测序或全基因组测序的种;d,每个种属选择一个参考序列,如果自己的序列中同一属的较多,可适当选择两个参考序列。
mega操作过程-多序列比对、进化树、
启发式算法
启发式算法(heuristic algorithms):
1 2 3 4 5 6 7 8 91 ⅠY D G G A V - E AL ⅡY D G G - - - E AL ⅢF E G G I L V E AL
ⅣF D - G I L V Q AV ⅤY E G G A V V Q AL
表1 多序列比对的定义 表示五个短序列(I-V)的比对结果。通过插入空位,使5个序列中 大多数相同或相似残基放入同一列,并保持每个序列残基顺序不变
为了便于描述,对多序列比对过程可以给出下面的定义:把多序 列比对看作一张二维表,表中每一行代表一个序列,每一列代表 一个残基的位置。将序列依照下列规则填入表中:
(a)一个序列所有残基的相对位置保持不变; (b)将不同序列间相同或相似的残基放入同一列,即尽可能将序列
间相同或相似残基上下对齐(下表)。
ClustalW(Thompson等,1994)是目前使用最广泛的多序列 比对程序
它的PC版本是ClustalX
作为程序的一部分,Clustal 可以输出用于构建进化 树的数据。
Progressive Alignment Method
ClustalW 程序:ClustalW 程序可以自由使用
Outperforms Clustal when aligning moderately divergent sequences
Slower than Clustal
进化树构建方法-MEGA
利用MEGA 来构建进化树(molecular evolutionary genetics analysis 分子进化遗传分析)打开mega5,选择Align----edit/built alignment----create a new alignment—OK选择DNA/protein出现新的对话框Open------选择已经保存好的用clustalx 经过比对保存的以.aln格式的文件打开之后,出现下面的页面双击文件名可以进行修改的。
我的就是从这里开始修改把A,B,C 都去掉,只留号码就好右键菜单点击delete 删除带※的那一行。
得到下面的图示,点击保存,重新起名字。
之后点击此图内的Alignment 选择Align by clustalW即可。
默认设置即可,点击OK就进行比对了,此后会出现一个过渡对话框,显示的是两两比对和多序列比对的过程之后回到初始页面,就是这个页面之后点File---点开,把刚才保留的文件点开然后出现下面的页面多了几个内容,点击TA的那个框框。
之后出现这样的框框图片然后在主程序中选择phylogeny---construct/test neighbor-joining tree,然后出现下面的页面黄色框框处的的参数是可以改变的,该图为我已经改变好的,把Bootstrap 的值改为1000 Methods根据文献上的参考改为了Kimura2-parameter model.之后点击compute,就出现了,而且还带有必需的支持率即自展值,是用来检验你所计算的进化树分支可信度的。
简单地讲就是把序列的位点都重排,重排后的序列再用相同的办法构树,如果原来树的分枝在重排后构的树中也出现了,就给这个分枝打上一分,如果没出现就给0分,这样经过你给定的repetitions 次(至少1000次)重排构树打分后,每个分枝就都得出分值,计算机会给你换算成bootstrap值。
重排的序列有很多组合,值越小说明分枝的可信度越低,最好根据数据的情况选用不同的构树方法和模型。
MEGA使用图解
用MEGA2做进化树的步骤(图示)1、打开程序如下图所示:2、MEGA2只能打开meg格式的文件,但是它可以把其他格式的多序列比对文件转换过来,我们在这里用aln格式(Clustal的输出文件)转换meg文件。
点File:Convert to MEGA Format...打开转换文件对话框如下图所示:3、选择文件和转换文件对话框,选择aln文件,点OK如下图所示:4、转换好的meg文件,点存盘保存meg文件,meg文件会和aln文件保存在同一个目录如下图所示:5、关闭转换窗口,回到主窗口,现在点面板上的“Click me to activate a data file”打开刚才的meg 文件如下图所示:6、选择meg文件,点“打开”如下图所示:7、程序会自动识别序列的类型,如果识别错误,请手工选择数据类型。
然后点OK就行了如下图所示:8、数据输入之后的样子,窗口下面有序列文件名和类型如下图所示:9、现在终于可以开始做Bootstrap验证和进化树了,MEGA的主要功能就是做Bootstrap验证的进化树分析,Bootstrap验证是对进化树进行统计验证的一种方法,可以作为进化树可靠性的一个度量。
各种算法虽然不同,但是操作方法基本一致,我们在此以UPGMA方法为例进行演示。
点下图所示的菜单项。
如下图所示:10、...会弹出如下的对话框,在此你可以选择计算参数。
如下图所示:11、Distance Options标签页中的Models可以下拉,其中有若干个计算距离的方法可以选择,在此默认泊松校验(Poisson Correction)作为计算距离的方法。
如下图所示:12、Include sites标签页中可以选择处理空缺或者缺失数据的方法,在此也用默认方法如下图所示:13、系统进化树的测试方法,可以选择用Bootstrap,也可以选择不进行测试。
重复次数(Replications)通常设定至少要大于100比较好,随机数种子可以自己随意设定,不会影响计算结果。
怎样使用MEGA建立进化树
怎样使用MEGAt 立进化树如何使用MEGA4.0#立进化树 1、首先是双击软件打开如下图所示|M| ijaKMr3 valj 141 Mrhr ArgrwricQt iVvta“qplii :护 忏冲 i 二客H - I 号筍需.廿星"LIF M ■ H 、-| II ■ DKi -Mjrsrze: H r« r-r r ^c>az^ LCS2、现在是处于DNA序列,而我们要做蛋白质的进化树的话,就如下操作M4. Aligmr>&nl Explof頁H L lQnmt*Ftji Editm e祁3、接下来我们要进行序列的输入,点击左边那个红箭头,贝U出现下面的窗口刚M4: Alfgnment Explorer匚;日屯EJrt S«ar di Aflgmnenl Wfrb $e<)□ d| D ◎日「蹇輻酋1 41象Protein S^quer匚弊1|主曲色"匕色丄4、然后右击sequenee 1,修改名字,如改成DPVFrotejn Sequence?5、然后从Word里复制蛋白质序列,然后在下面的位置粘贴G 辱CopfPTCtfiT X CU,書 f sterna6则可出现如下图的序列了□ QCW1C3 iRWfl Wq^ri[ V^i>n irequ^Ki 幷册枷・1話皿讥曲佰i"—喇・ct Mgeirc 惟■ sy7、然后点击窗口上的保存图标保存 8、重复从3开始,直到你的序列输入完9、序列输入元后进行最后的保存,方法如下垂邑trit 5|讨之斗和"1 of op«r * dow亠 P TOUMT 1 <io-jrr<n接下来打开册b M 罗哥 H*lpi t X t tt b要输入ul7两次保存名字一然后关闭这个窗口出现下面这个窗口■■■MM Jfc接下来就可以建立各种样式的进化树〜乜 MdngHie-r jein^ IMJL* &? Wrigym 佔抽杓也山-« UW3ML ■> ■小h,鼻 陆01申*貝Trfl 和 Hi^Tgrn^ ,HnNkk T ivn HnM "d i-Oi^4*cflArs R 协 FriWrt '^l^diCNHE軒I 匚 fkrti tiiitanr-ri : hy A 护产就 匸沁”-嗯,只是把过程写出来,方便大家建立进化树,不足的地方,大家补充好〜。
MEGA4.0构树步骤
MEGA构建系统进化树的步骤1. 将要用于构建系统进化树的所有序列合并到同一个fasta格式文件,注意:所有序列的方向都要保持一致( 5’-3’)。
2. 打开MEGA软件,选择”Alignment” –“Alignment Explorer/CLUSTAL”,在对话框中选择Retrieve sequences from a file, 然后点OK,找到准备好的序列文件并打开。
3. 在打开的窗口中选择”Alignment”-“Align by ClustalX” 进行对齐,对齐过程需要一段时间,对齐完成后,最好将序列两端切齐,选择两端不齐的部分,单击右键,选择delete即可。
4. 关闭当前窗口,关闭的时候会提示两次否保存,第一次无所谓,保存不保存都可以,第二次一定要保存,保存的文件格式是.meg。
根据提示输入Title,然后会出现一个对话框询问是否是Protein-coding nucleotide sequence data, 根据情况选择Yes或No。
最后出现一个对话框询问是否打开,选择Yes。
5. 回到MEGA主窗口,在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny”-“Neighbor-joining”,打开一个窗口,里面有很多参数可以设置,如何设置这些参数请参考详细的MEGA说明书,不会设置就暂且使用默认值,不要修改,点击下面的Compute按钮,系统进化树就画出来了。
6. 最后,使用TreeExplorer窗口中提供的一些功能可以对生成的系统进化树进行调整和美化。
另外,还可以用Word进一步编辑MEGA构建的进化树。
一般说来,MEGA适用于对少量的序列进行比对和画Tree,如需处理大量或海量的序列数据,建议使用ARB。
用BioEdit合并序列:1、打开BioEdit,点击“File”->”New Alignment”;2、“File”->”import”->”Sequence Alignment file”,将全部要合并的序列导入;3、”File“->”Save“ or “Save as”,保存为.fas格式文件。
MEGA构建系统进化树的步骤(以MEGA7为例)
MEGA构建系统进化树的步骤(以MEGA7为例)本文是看中国慕课山东大学生物信息学课程总结出来的分子进化的研究对象是核酸和蛋白质序列。
研究某个基因的进化,是用它的DNA序列,还是翻译后的蛋白质序列呢?序列的选取要遵循以下原则:1)如果DNA序列的两两间的一致度≥70%,选用DNA 序列。
因为,如果DNA序列都如此相似,它的蛋白质会相似到看不出区别,这对构建系统发生树是不利的。
所以这种情况下应该选用DNA序列,而不选蛋白质序列。
2)如果DNA序列的两两间的一致度≤70%,DNA序列和蛋白质序列都可以选用。
1. 将要用于构建系统进化树的所有序列合并到同一个fasta格式文件,注意:所有序列的方向都要保持一致( 5’-3’)。
想要做系统发生树先要做多序列比对,然后把多序列比对的结果提交给建树软件进行建树,所以在用MEGA建树时可以输入一个已经比对好的多序列比对,也可以输入一条原始序列,让MEGA先来做多序列比对,再建树(一般我们都是原始序列)。
所以我们以后者为例。
2.打开MEGA软件,选择主窗口的”File”→“Open A File”→找到并打开fasta文件,这时会询问以何种方式打开,我们是原始序列,需要先进行多序列比对,所以选择“Align”。
如果是比对好的多序列比对可以直接选择“Analyze”。
3.在打开的Alignment Explorer窗口中选择”Alignment”-“Align by ClustalW”进行多序列比对(MEGA提供了ClustalW和Muscle两种多序列比对方法,这里选择熟悉的ClustalW),弹出窗口询问“Nothing selected for alignment,Select all?”选择“OK”。
4. 之后,弹出多序列比对参数设置窗口。
这个窗口和EMBL在线多序列比对一样,可以设置替换记分矩阵、不同的空位罚分(罚分填写的是正数,计算时按负数计算)等参数。
怎样使用MEGA建立进化树
怎样使用MEGA建立进化树在进行生物信息学研究中,建立进化树是一项非常重要的任务。
MEGA (分子进化遗传学分析)是一款常用的软件,专门用于进行进化树和多序列分析。
下面将详细介绍如何使用MEGA建立进化树。
安装完成后,打开MEGA软件。
在MEGA的主界面上,有几个常用的功能选项,包括「File」、「Edit」、「View」、「Tools」、「Align」、「Phylogeny」和「Help」。
我们主要关注「Phylogeny」(进化树)选项。
在新窗口中,我们需要选择构建进化树的方法。
MEGA支持多种构建进化树的方法,包括Neighbor Joining、Maximum Parsimony、Maximum Likelihood和Bayesian等。
在这里,我们以Neighbor Joining方法为例进行演示。
在Neighbor Joining方法中,我们需要先选择计算进化距离的方法。
MEGA支持许多计算进化距离的方法,如P-distance、Kimura 2-parameter、Tamura 3-parameter等。
在这里,我们选择P-distance方法。
在选择了计算进化距离的方法后,我们还需要选择树的标准。
MEGA支持Bootstrap(Bootstrap方法是统计学中一种用于评估统计性信号和树的可靠性的方法)和Nearest-Neighbor Interchange等标准。
在这里,我们选择Bootstrap标准。
在选择了进化距离的方法和树的标准后,我们需要选择输入序列数据的文件格式。
MEGA支持多种格式的序列文件,如FASTA、PHYLIP和MEGA 等。
选择相应的格式后,我们需要导入序列数据。
可以通过从文件中导入或从剪贴板中粘贴来导入序列数据。
MEGA是一款非常强大的进化树分析软件,但对于初学者来说,可能需要一些时间去了解其中的各种选项和功能。
因此,建议在使用MEGA之前,先阅读相关文档和教程,以便更好地使用MEGA进行进化树的构建和分析。
如何用MEGA和Clustalx构建进化树
(1)利用该软件可得到不同树型,如 下图所示:
除此之外,还可 以有多种树型, 根据需要来选择。
2)显示建树的相关信息:点击图 标i。
3)点击优化图标,可进行各项优化: ������ Tree栏中,可以进行树型选择:rectangular tree/circle tree/radiation tree。每种树都可以进行长度,宽度或角度等的设定
是对真实的进化关系的评估或者模拟。如果我们采用了一
个适当的方法,那么所构建的进化树就会接近真实的“进
化树”。模拟的进化树需要一种数学方法来对其进行评估。
不同的算法有不同的适用目标。一般来说,最大简约性法 适用于符合以下条件的多序列:i 所要比较的序列的碱基 差别小,ii 对于序列上的每一个碱基有近似相等的变异率, iii 没有过多的颠换/转换的倾向,iv 所检验的序列的碱基 数目较多(大于几千个碱基);用最大可能性法分析序列
参考序列选择注意事项:
1、不选非培养(unclutured)微生物为参比;
2、不选未定分类地位的微生物,最相近的 仅作参考;c,在保证同属的前提下,优先 选择16S rDNA全长测序或全基因组测序的 种;d,每个种属选择一个参考序列,如果 自己的序列中同一属的较多,可适当选择两 个参考序列。
如果为核酸序列,选择“Nucleotide sequence”,点击“OK”,得到以下图示。
选择默认的Standard,点击OK后, 如图所示。
点击程序中的,可以得到下图
在另外一个窗口内,出现以下数据文件点击 选择和编辑数据分类图标, 可对所选择的序 列进行编辑,完成后点击close即可。
序列编辑完成后,可进行保存,点击保存后 出现以下界面,点击ok即可。
(1) phylogeny→UPGMA
MEGA构建系统进化树的步骤(以MEGA7为例)
MEGA构建系统进化树的步骤(以MEGA7为例)本文是看中国慕课山东大学生物信息学课程总结出来的分子进化的研究对象是核酸和蛋白质序列。
研究某个基因的进化,是用它的DNA序列,还是翻译后的蛋白质序列呢?序列的选取要遵循以下原则:1)如果DNA序列的两两间的一致度≥70%,选用DNA 序列。
因为,如果DNA序列都如此相似,它的蛋白质会相似到看不出区别,这对构建系统发生树是不利的。
所以这种情况下应该选用DNA序列,而不选蛋白质序列。
2)如果DNA序列的两两间的一致度≤70%,DNA序列和蛋白质序列都可以选用。
1. 将要用于构建系统进化树的所有序列合并到同一个fasta格式文件,注意:所有序列的方向都要保持一致( 5’-3’)。
想要做系统发生树先要做多序列比对,然后把多序列比对的结果提交给建树软件进行建树,所以在用MEGA建树时可以输入一个已经比对好的多序列比对,也可以输入一条原始序列,让MEGA先来做多序列比对,再建树(一般我们都是原始序列)。
所以我们以后者为例。
2.打开MEGA软件,选择主窗口的”File”→“Open A File”→找到并打开fasta文件,这时会询问以何种方式打开,我们是原始序列,需要先进行多序列比对,所以选择“Align”。
如果是比对好的多序列比对可以直接选择“Analyze”。
3.在打开的Alignment Explorer窗口中选择”Alignment”-“Align by ClustalW”进行多序列比对(MEGA提供了ClustalW 和Muscle两种多序列比对方法,这里选择熟悉的ClustalW),弹出窗口询问“Nothing selected for alignment,Select all?”选择“OK”。
4. 之后,弹出多序列比对参数设置窗口。
这个窗口和EMBL在线多序列比对一样,可以设置替换记分矩阵、不同的空位罚分(罚分填写的是正数,计算时按负数计算)等参数。
MEGA软件的使用
MEGA软件的使用Mega是一款操作十分简便的遗传学分析软件,其界面十分友好,即使初学者也很易上手。
1、数据的录入及编辑Mega软件能够接受多种数据格式,如FASTA格式、Phylip格式、PAUP数据格式等等。
而且Mega软件专门提供了把其他格式的数据转换位Mega数据格式的程序。
首先,打开Mega程序,有如下图所示的操作界面:单击工具栏中的“File”按钮,会出现如下图所示的菜单:从上图可以看出,下拉菜单有“Open Data”(打开数据)、“Reopen Data”(打开曾经打开的数据,一般会保留新近打开的几个数据)、“Close Data”(关闭数据)、“Export Data”(导出数据)、“Conver To MEGA Format”(将数据转化为MEGA 格式)、“Text Editor”(数据文本编辑)、“Printer Setup”(启动打印)、“Exit”(退出MEGA程序)。
单击“Open Data”选项,会弹出如下菜单:浏览文件,选择要分析的数据打开,单击“打开”按钮,会弹出如下操作界面:此程序操作界面,提供了三种选择数据选择:Nucleotide Sequences(核苷酸序列)、Protein Sequences(蛋白质序列)、Pairwise Distance(遗传距离矩阵)。
根据输入数据的类型,选择一种,点击“OK”即可。
如果选择“Pairwise Distance”,则操作界面有所不同;如下图所示:根据遗传距离矩阵的类型,如果是下三角矩阵,选择“Lower Left Matrix”即可;如果是上三角矩阵,选择“Upper Right Matrix”即可。
点击“OK”按钮,即可导入数据。
如果是核苷酸数据,则读完之后,会弹出如下对话框:如上图,如果是编码蛋白质的核苷酸序列,则选择“Yes”按钮;如果是不编码蛋白质的核苷酸序列,则点击“No”按钮。
之后,会弹出如下操作窗口:此作界面的名称是“Sequence Data Explorer”,在其最上方是工具栏“Data”、“Display”、“Highlight”等,然后是一些数据处理方式的快捷按钮,在操作界面的左下方是每个序列的名称。
Mega的使用以及进化树的绘制
Mega的使⽤以及进化树的绘制1.MEGA构建系统进化树的步骤2.CLUSTALX进⾏序列⽐对1.MEGA构建系统进化树的步骤1. 将要⽤于构建系统进化树的所有序列合并到同⼀个fasta格式⽂件,注意:所有序列的⽅向都要保持⼀致( 5’-3’)。
如图:2. 打开MEGA软件,选择"Alignment" - "Alignment Explorer/CLUSTAL",在对话框中选择Retrieve sequences from a file, 然后点OK,找到准备好的序列⽂件并打开,如图:。
3. 在打开的窗⼝中选择”Alignment”-“Align by ClustalX” 进⾏对齐,对齐过程需要⼀段时间,对齐完成后,最好将序列两端切齐,选择两端不齐的部分,单击右键,选择delete即可,如图:。
4. 关闭当前窗⼝,关闭的时候会提⽰两次否保存,第⼀次⽆所谓,保存不保存都可以,第⼆次⼀定要保存,保存的⽂件格式是.meg。
根据提⽰输⼊Title,然后会出现⼀个对话框询问是否是Protein-coding nucleotide sequence data, 根据情况选择Yes或No。
最后出现⼀个对话框询问是否打开,选择Yes,如图:。
5. 回到MEGA主窗⼝,在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” -“Neighbor-joining”,打开⼀个窗⼝,⾥⾯有很多参数可以设置,如何设置这些参数请参考详细的MEGA说明书,不会设置就暂且使⽤默认值,不要修改,点击下⾯的Compute按钮,系统进化树就画出来了,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Minimun-evolution”,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Maximun-parsimony”,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“UPGMA”,如图:6. 最后,使⽤TreeExplorer窗⼝中提供的⼀些功能可以对⽣成的系统进化树进⾏调整和美化。
mega操作过程-多序列比对、进化树、ppt课件
13
Progressive Alignment Method
ClustalW 程序:ClustalW 程序可以自由使用
基
➢ 在NCBI/EBI的FTP服务器上可以找到下载的软件包。
础 生
ClustalW 程序用选项单逐步指导用户进行操作,用户
物
可根据需要选择打分矩阵、设置空位罚分等。
信
ftp:///pub/software/
基础生物信息学及应用
王兴平
最新版整理ppt
1
内容
基
础
多序列比对
生
物 信
分子进化分析——系统发生树构建
息 学
核酸序列的预测与鉴定
及
应
酶切图谱制作
用
引物设计
2
基
础
多序列比对
生
物
信
息
学
及
应
用
3
内容:
基 础
➢ 多序列比对
生 物
➢ 多序列比对程序及应用
信
息
学
及
应
用
4
第一节、多序列比对
(Multiple sequence alignment)
基
➢ 将序列两两比对时的二维动态规划矩阵扩展到多维矩阵。即用
础
矩阵的维数来反映比对的序列数目。这种方法的计算量很大,
生
对于计算机系统的资源要求比较高,一般只有在进行少数的较
物
短的序列的比对的时候才会用到这个方法
信
息
➢ DCA (Divide-and-Conquer Alignment):a web-based
7
2、多序列比对的意义
用于描述一组序列之间的相似性关系,以便了解一个分
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.MEGA构建系统进化树的步骤
2.CLUSTALX进行序列比对
1.MEGA构建系统进化树的步骤
1. 将要用于构建系统进化树的所有序列合并到同一个fasta格式文件,注意:所有序列的方向都要保持一致( 5’-3’)。
如图:
2. 打开MEGA软件,选择"Alignment" - "Alignment Explorer/CLUSTAL",在对话框中选择Retrieve sequences from a file, 然后点OK,找到准备好的序列文件并打开,如图:。
3. 在打开的窗口中选择”Alignment”-“Align by ClustalX” 进行对齐,对齐过程需要一段时间,对齐完成后,最好将序列两端切齐,选择两端不齐的部分,
单击右键,选择delete即可,如图:。
4. 关闭当前窗口,关闭的时候会提示两次否保存,第一次无所谓,保存不保存都可以,第二次一定要保存,保存的文件格式是.meg。
根据提示输入Title,然后会出现一个对话框询问是否是Protein-coding nucleotide sequence data, 根据情况选择Yes或No。
最后出现一个对话框询问是否打开,选择Yes,如图:。
5. 回到MEGA主窗口,在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” -“Neighbor-joining”,打开一个窗口,里面有很多参数可以设
置,如何设置这些参数请参考详细的MEGA说明书,不会设置就暂且使用默认值,不要修改,点击下面的Compute按钮,系统进化树就画出来了,如图:
在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Minimun-evolution”,如图:
在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Maximun-parsimony”,如图:
在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“UPGMA”,
如图:
6. 最后,使用TreeExplorer窗口中提供的一些功能可以对生成的系统进化树进行调整和美化。
CLUSTALX进行序列比对
1.将下载的序列放入一个Text文本文档中,序列按一定的格式,
>pig AGAGACGGCCGCATCTTCTTGTGCAGTGCCAGCCTCGTCCCGTA GACAAAATGGTGAAGGTCGGTGTGAACGGATTTGGCCGTATTG GGCGCCTGGTCACCAGGGCTGCCATTTGCAGTGGCAAAGTGGA GATTGTTGCCATCAA的格式复制过来,放在一个文本文档里。
新建文本文档.txt
注意:CLustal 1.83分析出了全序列比对,彩色比对区上门的*越多,表示这段序列越保守
2.在File--load sequence载入序列,如图所示
4.点击align
5.
在桌面上即可生成aln格式的文本文档(用于下面Mega5.02进行进化树构建)
Mega5.02序列比对及建进化树
序列比对
1.用文本格式的序列数据进行比对
2.Align---edit alignment即新建一个数据---0k---DNA
3.
Edit--insert sequence from file ---选择文本文档
4.Alignent---Align by ciust W--ok---关闭序列比对--并保存在桌面上---Phylogeny--MAX
5.两种不同的方法最大释然和邻近法
邻近法更准确
建进化树1.File--convert file format to mega
2.
3.点击文件夹从桌面载入aln格式的文本文档
4.
5.点击OK,再命名
6.
7.
8.关闭窗口
9.点击OK
10.phylogen--text neighbor -joining tree -或者Maximum的方式进行构建--从桌面上选择刚命名的文件
11.
点击打开
12.
13.
14.点击Yes
15.
16.
17.将Test phylogery中的None改成如图
18.
19.
20.进化树就构建成功--点击横线进行细节修改
21.
22.点击左边第五个蓝色的图标
进行细节修改
23.可以双击分类后的名称,进行名称修改,如
Primer 5设计引物
1.File---New--DNA sequence
2.将序列复制过来(序列的格式必须是文本格式)--as is --OK
3.点击Primer
4.点击S--File-perferences
Length设置为20
点击OK
6.Search
7.type--both-PCR size 100-1000--primer length 25-5--OK
、
点击OK
8.选择打分高的,且退火温度在55℃左右的温度。
9.可通过手动调节上面的序列,使得二者的打分最高,如退火温度较高,则可以把序列长度降低一点,如19,点击Edit Primer --可以把引物序列复制下来
引物的基本原则
1.引物的长度18-28,不能太长。
引物越长特征性高,要求的退火温度越高,但是扩张效率较低,容易形成引物二聚体。
2.G、C的含量在45-55%左右,但有时也可能比较高或者比较低,不是很重要,45-55%的范围只是最好的。
G、C含量高,退火温度高。
3.3’端是最重要的,是起始阶段。
最好是A、T、C、G随机均一分布,不能集中的分布;特别3‘端前段最好不要连续3个以上的G、C出现,不能很好的促发反应,只要3’端的前10个碱基结合得好就行。
5‘不是很重要,可以很多不配对。
实际上3‘端连续出现G/C 但是效果也比较好。
GCCTCGTCCCGTAGACAAAAT
CCAGGGGGGCTAAGCAGTT
10.
11.外套和内套的设计使得特异性更高
要没有false priming
打分不一定都要100分
退火温度在55度以上都行
内套序列必须位于外套内
设计外套228-818 sense CACGGCAAGTTCAACGGCAC Anti -Sense TTTCTCCAGGCGGCAGGTCAG
设计内套310-585
Sense CTGCCAACATCAAGTGGGGTG
Anti -sense GTCCCTCCACGATGCCAAAG
一般先用外套引物进行扩增,再用内套引物扩增。
12.设计交叉序列的引物(温度相差不超过5度)
注意;这两个引物必须包括整个序列的90%以上的序列。
31-944
Sensse CCGTAACTTCTGTGCTGTGCCA
Anti sense AGAAGAGTGAGTGTCGCTGTTGAAGT
226-1029
Sense GCAAGTTCAACGGCACAGTCAA
Anti -sense TGCTGTAGCCAAATTCATTGTCGTA
13.双重PCR设计同时进行两个PCR扩增两对引物之间碱基序列相差100左右
31-247 63.5-63.5 100分
Sense CCGTAACTTCTGTGCTGTGCCA
Anti-sense TTGACTGTGCCGTTGAACTTGC
311-628 87分62.1-62.4
Sense TGCCAACATCAAGTGGGGTG
Anti -sense ACAGTCTTCTGGGTGGCAGTGAT
14.上游引物试剂盒已知的:如规定退火温度在73.2℃,则设计下游引物序列的温度在73℃左右,最好一样,不能超过或者少于2℃,可以改变引物长度提高退火温度,但是最高不能超过26 外套位点464
Anti-sense CATCACAAACATGGGGGCATCGGC
内套位点101
Anti-sense GCCGAATCCGTTCACTCCGACCTT
注意:关键不能错配,如果有错配可以看下错配的位点,如果和引物是反向不相交的,则不需考虑。