ClustalX使用方法
序列比对-Dotplot和Clustalx
实习二:序列比对-Dotplot和Clustalx一、实习目的:(1)掌握利用点阵法进行两条序列比对(2)学会使用Clustalx软件进行多条序列比对二、实习内容:(一)Dotplot点阵法是非常简单、直观的一种两条序列比对的方法,它能展示出两条序列所有可能配对的区域,由研究者决定最有意义或自己感兴趣的区域。
通过点阵法还可以对序列自身进行比对,寻找序列内部的正向或反向重复区域或互补区域。
正向重复为与主对角线平行的折线区域,而反向重复为与主对角线垂直的折线区域。
/molkit/dnadot/主要设置:窗口大小(Window Size):即在两条序列中同时比较的字符串的长度。
此软件要求窗口大小必须为奇数。
错配限制(Mismatch Limit):在给定窗口里,允许错配的数目。
如果错配数量小于等于此数目,则在图上标记点,否则,不做标记。
窗口大小越小,图上出现的点的数目越多,反之越小。
错配限制越小,图上出现的点越少,反之越小。
尝试改变这两个参数,体会其对比对结果的影响。
主要作用:1.通过序列自身比对,寻找其重复和反向重复区域。
2.查找同源序列,在entrez或srs系统,查寻不同物种中的同源序列再进行Dotplot分析。
(二)ClustalXClustal是一种利用渐近法(progressive alignment)进行多条序列比对的软件。
即从多条序列中最相似(距离最近)的两条序列开始比对,按照各个序列在进化树上的位置,由近及远的将其它序列依次加入到最终的比对结果。
Clustalx比对结果是构建系统发育树的前提。
运用流程:载入序列―>编辑序列―>设置参数―>完全比对―>比对结果三、作业1、简要说明你如何搜索不同物种的同源序列,并解释这些序列进行dotplot分析得到的结果。
答:主要有以下几个步骤:1)、首先进入entrez或srs系统,我选择的是entrez系统。
2)、点击,进入界面。
Clustalx的中文使用说明书
Clustalx的中文使用说明书
生物
用ClustalX做多序列比对分析图示
1、打开程序如下图所示:
2、Load Sequnce, 载入序列如下图所示:
3、选择序列文件,FASTA格式的如下图所示:
4、用文本编辑器察看FASTA序列文件内容,这里用的是记事本,推荐用EditPlus或者Ultraedit 如下图所示:
5、序列Load进去之后如下图所示:
6、Do Complete Alignment, 通常情况下直接选这个即可,无须修改比对参数如下图所示:
7、点Do Complete Alignment之后弹出的文件对话框,.dnd的是输出的指导树文件,.aln 的是序列比对结果,它们都是纯文本文件如下图所示:
点“ALIGN”之后开始等待,如果序列不多,很快就可以算完,如果数据很多,可能要等一段时间,这时候可以用眼睛盯着ClustalX的状态栏,那里会有程序运行状态和现在正在比对那两条序列的提示信息,看看可以消磨时间。
8、比对结束之后,我们可以看到这个结果如下图所示:
9、这时候我们可以发现ClustalX已经生成了.dnd和.aln两个文件,仍然用文本编辑器打开来看,这时.aln文件,这个文件可以用Mega2做进一步的bootstrap进化树分析如下图所示:
10、这是.dnd文件(指导树) 如下图所示:
11、可以用Treeview打开dnd文件,看上去就像这样子如下图所示
图3-15 ClustalX所识别的文件输入格式。
蛋白质组信息学实验汇总(2)
实验三、多序列比对一、软件平台clustalX、bioedit、DnaMan二、过程Clustal:○1Load Sequence(数据文件必须在ClustalX目录里)○2菜单Alignment->Alignment Parameters->Multiple Alignment Parameters 进入参数设置页面○3alignment -> do complete alignment,进行完全比对(生成.dnd和.aln 文件)○4比对完成,选择保存结果文件的格式phy:File->Save Sequence as-> 结果处理:Bioedit: ○1导入.aln文件○2“掐头去尾”editDnaMan: ○1打开DnaMan,依次打开“文件/打开指定的/多重比对”,载入Clustal X比对后的.aln文件○2点击options,参数设置,在这里,你可以设置每行显示的序列,是否显示一致序列,彩色或黑白等○3点击Output,输出为图形文件实验五、分子进化与系统发育分析一、软件平台clustalX ,MEGA,Phylip(注:phylip使用方法可搜“phylip软件的说明”)TreeView二、实验过程ClustalX:(1)使用CLUSTALX多序列比对,输出格式为*.PHY(具体见上文)(2)下载phylip,双击打开SEQBOOT ,按路径输入刚才生成的*.PHY文件;设定适当参数(4n+1);输出outfile1文件。
(3)打开PROTPARS(最大简约性法)【可选,具体情况具体分析】,输入outfile1文件后,得到outfile2和outtree1;(4)打开CONSENSE程序,输入outtree2,运行输出outfile3和outtree3文件;(5)树文件outtree3用TREEVIEW软件打开显示MEGA软件:(1)File->open a file/session->打开fasta文件,选择相应的data type (2)Align->edit/build aligns->Retrieve sequences from a file,打开文件;进行多序列比对,并另存为.meg文件(3)点击Phylogeny 选项,选择建树方法,建树保存。
JModeltest使用说明
工具:JModeltest下载地址:http://darwin.uvigo.es/补充工具:Clustalx下载地址:/1.使用Clustalx 工具进行多序列比对,将结果存储为FASTA 格式2.Clustalx 工具是一种多序列比对工具。
本次实验我使用的是2.0.12 版本,和以前的输出格式相比,又多了一种新的输出格式——FASTA 格式,这个格式是将比对结果中的gap 用“- ”替换,然后存储成一般的序列格式,这个格式对接下去JModeltest 的使用十分重要。
一般情况下FASTA 格式并不是默认的输出格式,需要在设置中添加。
首先,打开Clustalx, 再选择Alignment -> Output Format Options ,在弹出的对话框中将FASTA format 打上勾即可。
另外,Jmodeltest 也可以使用NEXUS 格式。
下面是一个例子,假设有两条序列(虽然是个多序列比对工具,还是举个两条序列的简单例子比较容易理解):>P1ATGGGGTTTAGA TAA>P2ATGTTTAGTTAA比对之后存储的FASTA 结果应该是:>P1ATGGGGTTTAGA TAA>P2- - - ATGTTTAGTTAA注意事项:A. 输出时记得要对输出的文件名进行修改,否则会把原来的文件替换掉;B. 进行比对时,比对文件必须放在纯英文的路径下,否则软件无法读取;2. JModeltest 的使用:JModeltest 下载下来后不需要再安装,直接运行即可。
使用起来也简单易懂。
首先,点击File -> Load DNA alignment ,读取比对结果的FASTA 格式文件文件,之后选择需要进行测试的模型,点击Analysis -> Compute likelihood scores ,弹出对话框:对话框提供了4 种不同模式进行计算,每种模式包含的模型具体如下:3 schemes: JC, HKY and GTR.5 schemes: JC, HKY, TN, TPM1, and GTR.7 schemes: JC, HKY, TN, TPM1, TIM1, TVM and GTR.11 schemes: JC, HKY, TN, TPM1, TPM2, TPM3, TIM1, TIM2, TIM3, TVM and GTR.选择好这后就可以点击开始计算。
【软件使用】clustalX2使用以及相关的问题
【软件使⽤】clustalX2使⽤以及相关的问题Clustalx的操作第⼀步:输⼊序列⽂件。
第⼆步:设定⽐对的⼀些参数。
参数设定窗⼝。
第三步:开始序列⽐对。
第四步:⽐对完成,选择保存结果⽂件的格式相关问题CLUSTALX-是CLUSTAL多重序列⽐对程序的Windows版本。
Clustal X为进⾏多重序列和轮廓⽐对和分析结果提供⼀个整体的环境。
这⾥总结⼀下在使⽤做序列⽐对过程中⼀些常见的问题~1,从⽹上看来说CLUSTALX软件使⽤的时候,开始要输⼊FASTA格式准备的DNA序列test.seq⽂件。
请问这种⽂件怎么⽣成啊?记事本?其实没有规定的⽂件名,不⼀定是叫test.seq,任何你想要的都可以,除了中⽂名(下⾯会说明)。
主要⾥⾯的内容是正确的格式就⾏了~。
Clustal⽀持的格式有多种,如NBRF/PIR, EMBL/SWISSPROT, Pearson (Fasta), Clustal (*.aln), GCG/MSF (Pileup), GCG9/RSF and GDE 等2,什么使⽤时,总是导⼊不了序列,出现 ERROR:Can not open output file??这个问题挺多⼈碰到过的~这是因为你导⼊的⽂件的路径包含有中⽂名。
把⽂件放在其它地⽅看看。
最好路径也不要有空格了。
当然前提是你的格式要正确了。
这个问题同样适⽤于ClustalW或其它dos类的软件3,ClustalX⽐对后的结果中.aln⽂件是什么?这个是序列⽐对结果的⽂件。
关于这部分,你可以看4,ClustalX⽐对后的结果中.dnd⽂件是什么?。
如何用MEGA5.0和Clustalx1.83构建进化树
如何用MEGA5.0和Clustalx1.83构建进化树MEGA是一个关于序列分析以及比较统计的工具包,从3.1版本到后来的4.0版本一直都广为大家熟悉,现在推出了Mega5.0版本。
功能比以前多有改进。
现主要介绍使用Mega 5.0构建系统进化树的方法。
供大家参考。
用MEGA构建进化树有以下步骤:1、测序:将克隆扩增测序得到的16S rDNA序列进行测序。
2、NCBI上做Blast/blast/Blast.cgi找到相似度最高的几个序列,确定一下你分离的细菌大约属于哪个科哪个属,如果相似度达到百分之百那基本可以确定你分离得到的就是Blast到的那个,然后寻找相似性最高的细菌,通常把该属的序列(Fasta格式文件)下载下来,或点击GenBank登录号,复制FSA TA 格式,整合在一个*.txt文档中(单独建立一个文件夹存放,后面的很多文件会自动装入该文件夹),如>XXXXAGGCTTAACACA TGCAAGTCGAGCGGAGCGAGGGTGCTTGCACCTTAGCTTAGCGGCG GACGGGTGAGTAA TGCTTAGGAA TCTGCCTA TTAGTGGGGGACAACA TTCCGAAAGGA A TGCTAA TACCGCA TACGCCCTACGGGGGAAAGCAGGGGA TCTTCGGACCTTGCGCTAA TAGA TGAGCCTAAGTCGGA TTAGCTAGTTGGTGGG>gi|289469964|gb|GU388381.1| Acinetobacter tandoii strain DSM 14970 16S ribosomal RNA gene, partial sequenceACTTAGCGGCGGACGGGTGAGTAA TGCTTAGGAA TCTGCCTA TTAGTGGGGGACAACA TTCCGAAAGGGA TGCTAA TACCGCA TACGCCCTACGGGGGAAAGCAGGGGA TCTTCGG ACCTTGCGCTAA TAGA TGAGCCTAAGTCGGA TTAGCTAGTTGGTGGGGTAAAGGCCTAC CAAGGCGACGA TCTGTAGCGGGTCTGAGAGGA TGA………………………….参考序列选择注意事项:1、不选非培养(unclutured)微生物为参比;2、不选未定分类地位的微生物,最相近的仅作参考;c,在保证同属的前提下,优先选择16S rDNA全长测序或全基因组测序的种;d,每个种属选择一个参考序列,如果自己的序列中同一属的较多,可适当选择两个参考序列。
Clustal多重序列比对图解教程图解使用
C l u s t a l x多重序列比对图解教程(B y R a i n d y) 本帖首发于Raindy'blog软件简介:CLUSTALX-是CLUSTAL多重序列比对程序的Windows版本。
ClustalX为进行多重序列和轮廓比对和分析结果提供一个整体的环境。
序列将显示屏幕的窗口中。
采用多色彩的模式可以在比对中加亮保守区的特征。
窗口上面的下拉菜单可让你选择传统多重比对和轮廓比对需要的所有选项。
主要功能:你可以剪切、粘贴序列以更改比对的顺序;你可以选择序列子集进行比对;你可以选择比对的子排列(Sub-range)进行重新比对并可插入到原始比对中;可执行比对质量分析,低分值片段或异常残基将以高亮显示。
当前版本:1.83PS:如果你是新手或喜欢中文界面,推荐使用本人汉化的Clustalx1.81版链接地址:ist&ID=7435(请完整复制)应用:Clustalx比对结果是构建系统发育树的前提实例:植物呼肠孤病毒属外层衣壳蛋白P8(AA序列)为例流程:载入序列―>编辑序列―>设置参数―>完全比对―>比对结果1.载入序列:运行ClustalX,主界面窗口如下所图(图1),依次在程序上方的菜单栏选择“File”-“LoadSequence”载入待比对的序列,如图2所示,如果当前已载入序列,此时会提示是否替换现有序列(Replaceexistingsequences),根据具体情形选择操作。
图1图22.编辑序列:对标尺(Ruler)上方的序列进行编辑操作,主要有Cutsequences(剪切序列)、Pastesequences(粘贴)、SelectAllsequences(选定所有序列),ClearsequenceSelection(清除序列选定)、Searchforstring(搜索字串)、RemoveAllgaps(移除序列空位)、RemoveGap-OnlyColumns(仅移除选定序列的空位)图33.参数设置:可以根据分析要求设置相对的比对参数。
几个进化树相关软件的使用方法
几个进化树相关软件的使用方法我在此介绍几个进化树分析及其相关软件的使用和应用范围。
这几个软件分别是PHYLIP、PUZZLE、PAUP、TREEVIEW、CLUSTALX和PHYLO-WIN (LINUX)。
在介绍软件之前,我先简要地叙述一下有关进化树分析的一些方法学问题。
进化树也称种系树,英文名叫“Phyligenetic tree”。
对于一个完整的进化树分析需要以下几个步骤:⑴要对所分析的多序列目标进行排列(To align sequences)。
做ALIGNMENT的软件很多,最经常使用的有CLUSTALX和CLUSTALW,前者是在WINDOW下的而后者是在DOS下的。
⑵要构建一个进化树(To reconstrut phyligenetic tree)。
构建进化树的算法主要分为两类:独立元素法(discrete character methods)和距离依靠法(distance methods)。
所谓独立元素法是指进化树的拓扑形状是由序列上的每个碱基/氨基酸的状态决定的(例如:一个序列上可能包含很多的酶切位点,而每个酶切位点的存在与否是由几个碱基的状态决定的,也就是说一个序列碱基的状态决定着它的酶切位点状态,当多个序列进行进化树分析时,进化树的拓扑形状也就由这些碱基的状态决定了)。
而距离依靠法是指进化树的拓扑形状由两两序列的进化距离决定的。
进化树枝条的长度代表着进化距离。
独立元素法包括最大简约性法(Maximum Parsimony methods)和最大可能性法(Maximum Likelihood methods);距离依靠法包括除权配对法(UPGMAM)和邻位相连法(Neighbor-joining)。
⑶对进化树进行评估。
主要采用Bootstraping法。
进化树的构建是一个统计学问题。
我们所构建出来的进化树只是对真实的进化关系的评估或者模拟。
如果我们采用了一个适当的方法,那么所构建的进化树就会接近真实的“进化树”。
进化树分析及相关软件使用说明
进化树分析及相关软件使用说明我在此介绍几个进化树分析及其相关软件的使用和应用范围。
这几个软件分别是PHYLIP、PUZZLE、PAUP、TREEVIEW、CLUSTALX和PHYLO-WIN 〔LINUX〕。
在介绍软件之前,我先简要地表达一下有关进化树分析的一些方法学问题。
进化树也称种系树,英文名叫“Phyligenetic tree〞。
对于一个完整的进化树分析需要以下几个步骤:⑴要对所分析的多序列目标进行排列〔To align sequences〕。
做ALIGNMENT的软件很多,最经常使用的有CLUSTALX和CLUSTALW,前者是在WINDOW下的而后者是在DOS下的。
⑵要构建一个进化树〔To reconstrut phyligenetic tree〕。
构建进化树的算法主要分为两类:独立元素法〔discrete character methods〕和距离依靠法〔distance methods〕。
所谓独立元素法是指进化树的拓扑形状是由序列上的每个碱基/氨基酸的状态决定的〔例如:一个序列上可能包含很多的酶切位点,而每个酶切位点的存在与否是由几个碱基的状态决定的,也就是说一个序列碱基的状态决定着它的酶切位点状态,当多个序列进行进化树分析时,进化树的拓扑形状也就由这些碱基的状态决定了〕。
而距离依靠法是指进化树的拓扑形状由两两序列的进化距离决定的。
进化树枝条的长度代表着进化距离。
独立元素法包括最大简约性法〔Maximum Parsimony methods〕和最大可能性法〔Maximum Likelihood methods〕;距离依靠法包括除权配对法〔UPGMAM〕和邻位相连法〔Neighbor-joining〕。
⑶对进化树进行评估。
主要采用Bootstraping法。
进化树的构建是一个统计学问题。
我们所构建出来的进化树只是对真实的进化关系的评估或者模拟。
如果我们采用了一个适当的方法,那么所构建的进化树就会接近真实的“进化树〞。
CLUSTALX进行序列比对及进化树构建 2
CLUSTALX进行序列比对1.将下载的序列放入一个Text文本文档中,序列按一定的格式,>pig AGAGACGGCCGCATCTTCTTGTGCAGTGCCAGCCTCGTCCCGTA GACAAAATGGTGAAGGTCGGTGTGAACGGATTTGGCCGTATTG GGCGCCTGGTCACCAGGGCTGCCATTTGCAGTGGCAAAGTGGA GATTGTTGCCATCAA的格式复制过来,放在一个文本文档里。
新建文本文档.txt注意:CLustal 1.83分析出了全序列比对,彩色比对区上门的*越多,表示这段序列越保守2.在File--load sequence载入序列,如图所示3.Alignment进行全序列比对--4.点击align5.在桌面上即可生成aln格式的文本文档(用于下面Mega5.02进行进化树构建)Mega5.02序列比对及建进化树序列比对1.用文本格式的序列数据进行比对2.Align---edit alignment即新建一个数据---0k---DNA3.Edit--insert sequence from file ---选择文本文档4.Alignent---Align by ciust W--ok---关闭序列比对--并保存在桌面上---Phylogeny--MAX5.两种不同的方法最大释然和邻近法邻近法更准确建进化树1.File--convert file format to mega2.3.点击文件夹从桌面载入aln格式的文本文档4.5.点击OK,再命名6.7.8.关闭窗口9.点击OK10.phylogen--text neighbor -joining tree -或者Maximum的方式进行构建--从桌面上选择刚命名的文件11.点击打开12.13.14.点击Yes15.16.17.将Test phylogery中的None改成如图18.19.20.进化树就构建成功--点击横线进行细节修改21.22.点击左边第五个蓝色的图标进行细节修改23.可以双击分类后的名称,进行名称修改,如Primer 5设计引物1.File---New--DNA sequence2.将序列复制过来(序列的格式必须是文本格式)--as is --OK3.点击Primer4.点击S--File-perferences5.一般将长度设置为20,然后根据需要可以适当提到21或者降到19 Length设置为20点击OK6.Search7.type--both-PCR size 100-1000--primer length 25-5--OK、点击OK8.选择打分高的,且退火温度在55℃左右的温度。
clustalx多序列比对结果建树
clustalx多序列比对结果建树
在ClustalX中进行多序列比对后,可以使用其提供的建树工
具将比对结果转化为树状结构。
以下是使用ClustalX建树的
步骤:
1. 打开ClustalX软件,点击"File",选择"Open Alignment",选择之前进行多序列比对的文件。
2. 点击"Tree",选择"Build Tree",进入建树参数设置界面。
3. 在参数设置界面中,可以选择不同的建树方法,如
Neighbor-Joining、UPGMA等。
可以根据需要选择合适的方法。
4. 设置完参数后,点击"OK"开始建树过程。
5. 建树完成后,可以在软件界面的右侧窗口中查看树状结构。
可以通过点击树状图上的节点来展开或折叠子树。
需要注意的是,ClustalX建树功能只是提供了一种简单的可视
化方法,用于初步了解序列的进化关系。
如果需要更加精确的进化关系推断,可以考虑使用其他更专业的建树软件如PhyML、PAUP*等。
Clustalx的使用
用ClustalX做多序列比对分析图示1、打开程序
如下图所示:
2、Load Sequnce, 载入序列
如下图所示:
3、选择序列文件,FASTA格式的
如下图所示:
4、用文本编辑器察看FASTA序列文件内容,这里用的是记事本,推荐用EditPlus或者Ultraedit
如下图所示:
5、序列Load进去之后如下图所示:
6、Do Complete Alignment, 通常情况下直接选这个即可,无须修改比对参数
如下图所示:
7、点Do Complete Alignment之后弹出的文件对话框,.dnd的是输出的指导树文件,.aln的是序列比对结果,它们都是纯文本文件
如下图所示:
点“ALIGN”之后开始等待,如果序列不多,很快就可以算完,如果数据很多,可能要等一段时间,这时候可以用眼睛盯着ClustalX的状态栏,那里会有程序运行状态和现在正在比对那两条序列的提示信息,看看可以消磨时间。
8、比对结束之后,我们可以看到这个结果
如下图所示:
9、这时候我们可以发现ClustalX已经生成了.dnd和.aln两个文件,仍然用文本编辑器打开来看,这时.aln文件,这个文件可以用Mega2做进一步的bootstrap进化树分析
如下图所示:
10、这是.dnd文件(指导树)
如下图所示:
11、可以用Treeview打开dnd文件,看上去就像这样子如下图所示:。
clustalx的应用
利用clustalx 2.1对蛋白进行多序列比对目录1. 方法介绍1.1概念1.2理论基础1.3任务1.4目的2研究内容3. 工具3.1 clustalx简介3.2 clustalx 后台运作流程3.3 clustalx的下载3.4 clustalx菜单设置4.操作步骤4.1获取目标序列4.2执行比对4.3 treeview软件制作进化树5. 结果分析正文1. 方法介绍:多序列比对1.1 概念:多序列比对即通过多个核苷酸或氨基酸的序列进行比较,确定序列之间可能由于功能、结构或进化上的关联而形成的相似片段。
1.2 理论基础:1)生物学一个最基本的假设是地球上所有物种都有共同的祖先,从这个祖先开始以树状形式发展,通常称为生命之树。
2)基于序列比对的同源即具有共同祖先。
同源序列一般相似;相似可以用百分比来描述。
序列不一定是同源的,相似序列在进化上具有趋同性。
序列决定结构,结构决定功能。
3)现有的基因、蛋白质等携带生物学信息、具有生物学功能的分子都是由原有的分子演化而来;现有的基因及其他核酸序列,都是由已经存在的基因或其他序列经过复制、转移、合并、删减等方式形成的;不同物种的基因、蛋白质在结构、序列上的相似性与其进化上亲缘关系密切相关。
1.3 任务:发现序列之间的相似性,找出序列之间共同的区域,辨别序列之间的差异。
1.4 目的:通过“相似序列→相似的结构→相似的功能“来判别序列之间的同源性,进而推测序列之间的进化关系。
2. 研究内容:通过对人类、家鼠、大鼠和鸡体内BMP-2(bone morphogeneticprotein 2)即骨形态发生蛋白2的多序列比对得到的dnd结果文件来揭示在四种生物中的该蛋白的同源性。
3. 工具:clustalx 2.13.1 clustalx简介:Clustal是用来对核酸与蛋白序列进行多序列比对的软件,可以用来发现特征序列,进行蛋白分类,证明序列间的同源性,帮助预测新序列二级结构与三级结构,确定PCR引物,以及在分子进化分析方面均有很大帮助。
clustalx中文说明
ClustalX Help可以在下列地址得到 ClustalX 的最新版本:ftp://ftp-igbmc.u-strasbg.fr/pub/ClustalX/General help for CLUSTAL X (1.8)Clustal X 是一个windows 界面多序列对比程序。
可以用剪切和粘贴的方法改变对比的顺序;可以在比对中选择较小的区域重新比对,并将比对的结果插回到原来的比对结果中。
能够进行比对质量评定,低分片断和多余的残基将突出显示。
序列输入序列和轮廓(已经存在的比对)利用菜单文件输入,所有的序列必须放到一个文件中,7种序列可以被自动识别: NBRF/PIR, EMBL/SWISSPROT, Pearson (Fasta), Clustal (*.aln), GCG/MSF (Pileup), 除用于表示间隙的"-" 例外 ("." in MSF/RSF),所有的非字母字符将被忽略。
序列和轮廓比对Clustal X 有两种比对格式: 多重比对格式和轮廓比对格式。
做一系列序列的多重比对时要保证选择多重比对模式,然后展示单一序列数据。
比对菜单既可以产生比对的指导树又可根据指导树进行比对,还可以做全多重比对。
在轮廓比对模式下,出现两个序列数据区,允许对两个比对结果进行比对。
轮廓允许添加新序列到旧的比对中,或者应用二级结构指导比对进程。
旧比对中的间隙用 "-"表示。
轮廓可以用以下任何一种格式输入,只有用 "-" (or "." for MSF/RSF) 代表每一个间隙位置。
在轮廓比对状态下, "Lock Scroll"按钮 is displayed which allows you to scroll the two profiles together using a single scroll bar. When the Lock Scroll is turned off, the two profiles can be scrolled independently.进化树进化树可以从旧的比对或新比对中产生。
Clustalx 实验指南(一步一步很详细)
实验三:多条序列比对——Clustalx(一)ClustalXClustal是一种利用渐近法(progressive alignment)进行多条序列比对的软件。
即从多条序列中最相似(距离最近)的两条序列开始比对,按照各个序列在进化树上的位置,由近及远的将其它序列依次加入到最终的比对结果。
(Figure 3.1)/1.安装clustalx程序。
双击安装clustalx-2.0.12-win.msi.exe文件到自己的电脑上。
也可从/download/current/下载,列表中的倒数第二个文件。
clustalx-2.0.12-win.msiFigure 3.1 clustal 算法2.准备要比对的序列请查找至少存在于5个物种中的同源序列(核酸或蛋白质皆可),并保存为fasta格式,存为文本文件(所有的序列请粘贴到同一个文本文件中)。
选择NM、XM或NP打头的序列,不要选择NC或NW打头的序列,那是全基因组序列。
做法可参照邮箱中的preparations for practice3.doc文件。
3.打开clustalX程序开始菜单-程序-clustalX2- clustalX24.载入序列点最上方的File菜单,选择Load Sequence-选择你刚保存的序列文件,点打开。
在左侧窗口里是fasta格式序列的标识号,取自序列第一行“>”后的字符。
(Figure 3.2) 注意:ClustalX程序无法识别汉字,无法识别带空位的文件夹名,如 my document。
各位同学保存的序列文件不要保存在桌面上或带汉字的文件夹中,推荐保存在D盘根目录下。
常见文件打开错误原因:1.序列格式有问题,非正确的fasta格式。
2.文件中有序列重复粘贴。
TIPS: 想要方便识别序列所属物种,可在每条序列“>”后输入物种名,加空位即可。
EXAMPLE:原格式:>gi|262050536|ref|NM_002218.4| Homo sapiens inter-alpha (globulin) inhibitor H4 (plasma Kallikrein-sensitive glycoprotein) (ITIH4), transcript variant 1, mRNA改为:>human gi|262050536|ref|NM_002218.4| Homo sapiens inter-alpha (globulin) inhibitor H4 (plasma Kallikrein-sensitive glycoprotein) (ITIH4), transcript variant 1, mRNAFigure 3.2 载入序列5.比对参数的选择可以对两条序列比对的参数和多条序列比对的参数进行设置。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
EBI提供 的在线 Clustalw 服务
更为详细的教程
可以在这里得到更多关于clustal的帮助:
trasbg.fr/BioInfo/ClustalX/Top.html
实际操作
• 使用clustalx程序,对给定的多序列, 选择合适的参数,进行多序列比对,输 出结果文件维phylip格式。
1.输入输出格式。
输入序列的格式比较灵活,可以是前面介绍过的 FASTA格式,还可以是PIR、SWISS-PROT、 GDE、Clustal、GCG/MSF、RSF等格式。
输出格式也可以选择,有ALN、GCG、PHYLIP 和NEXUS等,用户可以根据自己的需要选择合 适的输出格式。
Clustal的应用
• 相同的文件,使用ebi和我们提供的在线 服务,进行多序列比对。
• 对上述计算机程序比对的结果进行手工 改动(bioedit,seaview),使得多序 列比对结果跟符合要求。
• 用于描述一个同源基因之间的亲缘关系 的远近,应用到分子进化分析中。
• 其他应用,如构建profile,打分矩阵等。
多序列比对的方法
• 同源性分析中常常要通过多序列比对来 找出序列之间的相互关系,和blast的局 部匹配搜索不同,多序列比对大多都是 采用全局比对的算法。这样对于采用计 算机程序的自动多序列比对是一个非常 复杂且耗时的过程,特别是序列数目多, 且序列长的情况下。
2.两种工作模式。 a.多序列比对模式。 b.剖面(profile)比对模式。
3.一个实际的例子。
多序列比对实例
输入文件的格式(fasta):
>KCC2_YEAST NYIFGRTLGAGSFGVVRQARKLSTN…… >DMK_HUMAN DFEILKVIGRGAFSEVAVVKMKQTGQVYAMKIMNK……. >KPRO_MAIZE TRKFKVELGRGESGTVYKGVLEDDRHVAVKKLEN…… >DAF1_CAEEL QIRLTGRVGSGRFGNVSRGDYRGEAVAVKVFNALD…… >1CSN HYKVGRRIGEGSFGVIFEGTNLLNN……
序列同源性分析:
是将待研究序列加入到一组与之同源,但来自不同物 种的序列中进行多序列同时比较,以确定该序列与其它 序列间的同源性大小。这是理论分析方法中最关键的一 步。完成这一工作必须使用多序列比较算法。常用的程 序包有CLUSTAL等;
多序列比对的意义
• 用于描述一组序列之间的相似性关系, 以便了解一个基因家族的基本特征,寻 找motif,保守区域等。
多序列比对的方法
基本上多序列比对可以分为 1.手工比对(辅助编辑软件如bioedit, seaview,Genedoc等)
通过辅助软件的不同颜色显示不同残基,靠分 析者的观察来改变比对的状态。
2.计算机程序自动比对
通过特定的算法(如同步法,渐进法等),由 计算机程序自动搜索最佳的多序列比对状态。
自动多序列比对的算法
Clustal的渐进比对过程
在比对过程中,先对所有的序列进行 两两比对并计算它们相似性分值,然后 根据相似性分值将它们分成若干组,并 在每组之间进行比对,计算相似性分值。 根据相似性分值继续分组比对,直到得 到最终比对结果。在比对过程中,相似 性程度较高的序列先进行比对而距离较 远的序列添加在后面。
1.同步法 将序列两两比对时的二维动态规划矩
阵扩展到三维矩阵。即用矩阵的维数来 反映比对的序列数目。这种方法的计算 量很大,对于计算机系统的资源要求比 较高,一般只有在进行少数的较短的序 列的比对的时候才会用到这个方法。
自动多序列比对的算法
2.步进法 最常见的就是clustal所采用的方法。
其基本思想就是基于相似序列通常具 有进化相关性的这一假设。
多序列比对的原理以及 clustal在多序列比对中
的应用
内容提要
• 多序列比对的意义 • 多序列比对的方法 • 自动多序列比对的算法 • Clustalx的使用(clustal法) • 实例分析
序列相似性比较和序列
同源性分析
序列相似性比较:
就是将待研究序列与DNA或蛋白质序列库进行比较, 用于确定该序列的生物属性,也就是找出与此序列相似 的已知序列是什么。完成这一工作只需要使用两两序列 比较算法。常用的程序包有BLAST、FASTA等;
第一步:输入序列文件。
第二步:设定比对的一些参数。
参数设定窗口。
第三步:开始序件的格式
在线的clustalw分析
1.EBI提供的在线clustalw服务 /clustalw/ 2.我们构建的在线clustalw服务 /biopro/clustalw.html
多序列比对工具 -clustalX
Clustal是一个单机版的基于渐进比对的 多序列比对工具,由Higgins D.G. 等开发。 有应用于多种操作系统平台的版本,包括 linux版,DOS版的clustlw,windows版本 的clustalx等。
Clustal简介
• CLUSTAL是一种渐进的比对方法,先将 多个序列两两比对构建距离矩阵,反应 序列之间两两关系;然后根据距离矩阵 计算产生系统进化指导树,对关系密切 的序列进行加权;然后从最紧密的两条 序列开始,逐步引入临近的序列并不断 重新构建比对,直到所有序列都被加入 为止。
Clustalx的工作界面 (多序列比对模式)
Clustalx的工作界面 (剖面(profile)比对模式)
Clustal的工作原理
Clustal输入多个序列
快速的序列两两比对,计算序列间的 距离,获得一个距离矩阵。
邻接法(NJ)构建一个树(引导树)
根据引导树,渐进比对多个序列。
Clustal的应用