综合序列分析软件BioEdit中文说明书

合集下载

第四章 bioedit多序列比较的实际应用

第四章 bioedit多序列比较的实际应用


由于这些比较通常都希望能够推测新蛋白的功能, 不管它们是双重比较还是多序列比较,都可以回 答大量的其它的生物学问题。例如:在搜集的比 较序列中,可以看出隐含于蛋白之中的物种进化 关系,以便于更好地理解蛋白的进化。研究一个 家族中的相关蛋白的差异,分析进化压力和生物 秩序对于功能相关的蛋白进化影响。研究完多序 列比较中的高度保守区域,我们可以对蛋白质的 整个结构进行预测,并且猜测这些保守区域对于 维持
>gi|14786152|ref|XP_029934.1| matrix metalloproteinase 9 preproprotein [Homo sapiens] MSLWQPLVLVLLVLGCCFAAPRQRQSTLVLFPGDLRTNLTDRQLAEEYLYRYGYTRVAEMRGESKSLGPALLLLQKQLSLPETGELDSA TLKAMRTPRCGVPDLGRFQTFEGDLKWHHHNITYWIQNYSEDLPRAVIDDAFARAFALWSAVTPLTFTRVYSRDADIVIQFGVAEHGDG YPFDGKDGLLAHAFPPGPGIQGDAHFDDDELWSLGKGVVVPTRFGNADGAACHFPFIFEGRSYSACTTDGRSDGLPWCSTTANYDTD DRFGFCPSERLYTQDGNADGKPCQFPFIFQGQSYSACTTDGRSDGYRWCATTANYDRDKLFGFCPTRADSTVMGGNSAGELCVFPF TFLGKEYSTCTSEGRGDGRLWCATTSNFDSDKKWGFCPDQGYSLFLVAAHEFGHALGLDHSSVPEALMYPMYRFTEGPPLHKDDVN GIRHLYGPRPEPEPRPPTTTTPQPTAPPTVCPTGPPTVHPSERPTAGPTGPPSAGPTGPPTAGPSTATTVPLSPVDDACNVNIFDAIAEI GNQLYLFKDGKYWRFSEGRGSRPQGPFLIADKWPALPRKLDSVFEERLSKKLFFFSGRQVWVYTGASVLGPRRLDKLGLGADVAQVT GALRSGRGKMLLFSGRRLWRFDVKAQMVDPRSASEVDRMFPGVPLDTHDVFQYREKAYFCQDRFYWRVSSRSELNQVDQVGYVTY DILQCPED >gi|15718389|dbj|BAB68366.1| gelatinase [Paralichthys olivaceus] MRCCALAVCLVLVIVQDGWSLPLRSISVTFPGDILKNVTDTDLAETYLKRFGYLDKMHRSGFQSMVSTAKALKMMQRQMGLKETGKLD KSTLEAMKQPRCGVPDVANYQTFEGDLKWDHNDVTYRTLNYSPDMESSLIDDAFARAFKVWSDVTPLTFTRLYEGTADIMISFGKADH GDPYPFDGRNGLLAHAYPPGEGVQGDAHFDDDEHWTLGNGPAVKTLYGNADGAMCHFPFTFEGKSYTSCTTDGRTDNLPWCATTAD YSRDGKYGFCPSELLYTVGGNADGAKCVFPFVFLEKEYDSCTKEGRSDGYRWCATTANFDQDQKYGFCPSRDTAVFGGNSEGEPCH FPFVFLGKEYDSCTSEGREDGKLWCSTTDNYDEDAKWGFCDDEGYSLFLVAAHEFGHALGLDHSNIREALMYPMYTYVEDFSLHKDDI EGIQYLYGRGTGPDPTPPQPTSTTTTPNPTEEPEPTTPQPVDPTRDACKLTKFDTITMIENELHFFENGNYWKMPSRGDGGLKGPFSLS ERWPALPAVIDSAFEDLLTKNMYFFSGNRFWVYTKEGVLGPRSIEKLGLPTSIQKVEGALQRGKGKVLLFTEESFWKFDLKSQKMDKGY PKSTDYVFGGVPNDAHDVFQYKGHMYFCRDSFYWRMNSRRQVDRVGYVKYDLLKCSDSY >gi|13591993|ref|NP_112317.1| matrix metalloproteinase 9 (gelatinase B, 92-kDa type IV collagenase) [Rattus norvegicus] MNPWQPLLLVLLALGYSFAAPHQRQPTYVVFPRDLKTSNLTDTQLAEDYLYRYGYTRAAQMMGEKQSLRPALLMLQKQLSLPQTGELD SETLKAIRSPRCGVPDVGKFQTFEGDLKWHHHNITYWIQSYTEDLPRDVIDDSFARAFAVWSAVTPLTFTRVYGLEADIVIQFGVAEHGD GYPFDGKDGLLAHAFPPGPGIQGDAHFDDDELWSLGKGAVVPTYFGNANGAPCHFPFTFEGRSYLSCTTDGRNDGKPWCGTTADYD TDRKYGFCPSENLYTEHGNGDGKPCVFPFIFEGHSYSACTTKGRSDGYRWCATTANYDQDKLYGFCPTRADVTVTGGNSAGEMCVF PFVFLGKQYSTCTGEGRSDGRLWCATTSNFDADKKWGFCPDQGYSLFLVAAHEFGHALGLDHSSVPEALMYPMYHYHEDSPLHEDDI KGIQHLYGRGSKPDPRPPATTAAEPQPTAPPTMCPTAPPMAYPTGGPTVAPTGAPSPGPTGPPTAGPSEAPTESSTPVDNPCNVDVFD AIADIQGALHFFKDGRYWKFSNHGGSQLQGPFLIARTWPALPAKLNSAFEDPQSKKIFFFSGRKMWVYTGQTVLGPRSLDKLGLGSEVT LVTGLLPRRGGKALLISRERIWKFDL KSQKVDPQSVTRLDNEFSGVPWNSHNVFHYQDKAYFCHDKYFWRVSFHNRVNQVDHVAYVTYDLLQCP >gi|467621|emb|CAA55127.1| matrix metalloproteinase 9 [Bos taurus] MSPLQPLVLALLVLACCSAVPRRRQPTVVVFPGEPRTNLTNRQLAEEYLYRYGYTPGAELSEDGQSLQRALLRFQRRLSLPETGELDST TLNAMRAPRCGVPDVGRFQTFEGELKWHHHNITYWIQNYSEDLPRAVIDDAFARAFALWSAVTPLTFTRVYGPEADIVIQFGVREHGDG YPFDGKNGLLAHAFPPGKGIQGDAHFDDEELWSLGKGVVIPTYFGNAKGAACHFPFTFEGRSYSACTTDGRSDDMLWCSTTADYDAD RQFGFCPSERLYTQDGNADGKPCVFPFTFQGRTYSACTSDGRSDGYRWCATTANYDQDKLYGFCPTRVDATVTGGNAAGELCVFPF TFLGKEYSACTREGRNDGHLWCATTSNFDKDKKWGFCPDQGYSLFLVAAHEFGHALGLDHTSVPEALMYPMYRFTEEHPLHRDDVQ GIQHLYGPRPEPEPRPPTTTTTTTTEPQPTAPPTVCVTGPPTARPSEGPTTGPTGPPAAGPTGPPTAGPSAAPTESPDPAEDVCNVDIF DAIAEIRNRLHFFKAGKYWRLSEGGGRRVQGPFLVKSKWPALPRKLDSAFEDPLTKKIFFFSGRQVWVYTGASLLGPRRLDKLGLGPEV AQVTGALPRPEGKVLLFSGQSFWRFDVKTQKVDPQSVTPVDQMFPGVPISTHDIFQYQEKAYFCQDHFYWRVSSQNEVNQVDYVGYV TFDLLKCPED

核酸序列分析软件介绍

核酸序列分析软件介绍

核酸序列分析1、核酸序列检索可通过NCBI使用Entrez系统进行检索,也可用EBI的SRS服务器进行检索。

在同时检索多条序列时,可通过罗逻辑关系式按照GenBank接受号进行批量检索。

如用“AF113671 [ac] OR AF113672 [ac]”可同时检索这两条序列。

其中“[ac]”是序列接受号的描述字段。

2、核酸序列的基本分析(1)分子质量、碱基组成、碱基分布分子质量、碱基组成、碱基分布可通过一些常用软件等直接获得。

如:BioEdit(/BioEdit/bioedit.html),DNAMAN()。

(2)序列变换进行序列分析时,经常需要对DNA序列进行各种变换,例如反向序列、互补序列、互补反向序列、显示DNA双链、转换为RNA序列等。

这些用DNAMAN软件可很容易实现,这些功能集中在Sequence→Display,从中可选择不同的序列变换方式对当前通道的序列进行转换。

(3)限制性酶切分析该方面最好的资源是限制酶数据库(Restriction Enzyme Database,REBASE)。

REBASE数据库(,/rebase)中含有限制酶的所有信息,包括甲基化酶、相应的微生物来源、识别序列位点、裂解位点、甲基化特异性、酶的商业来源及公开发表的和未发表的参考文献。

其它资源还有:WebGene:/~tjyin/WebGene/RE.html,/personal/tyin.htmlWebCutter2:http://www//firstmarkert/firstmarket/cutter/cut2.html同时,很多软件也能够识别REBASE限制酶数据库。

强烈推荐使用集成化的软件如BioEdit和DNAMAN等。

所得出的结果给出指定DNA序列的酶切位点信息,为克隆鉴定和亚克隆提供了重要信息。

在实际进行分子生物学实验中,有时需要对多条相关序列(如发生突变的一批序列)同时进行酶切分析,以便为后续的克隆鉴定提供参考。

BioEdit_5.06中文使用说明书

BioEdit_5.06中文使用说明书

BioEdit_5.06中⽂使⽤说明书翻译说明1 原英⽂稿中附有许多⽰例如输出窗⼝序列等译⽂⼀般⽤参见英⽂稿表⽰在阅读此段时请参见英⽂中的图⽰对于⼀些较⼩的⽰例如等式的推导译⽂中保留2 原英⽂稿中也给出了许多算法和程序的原始⽂献和⽹址译者认为这是BioEdit的⼀个优点如果想深⼊的学习不能不读⼀读原始的⽂献译⽂中⽤REFERENCE表⽰请参考英⽂原稿3 译⽂中对专业的词汇采⽤以下办法处理即⼀般采⽤国内已有⼈使⽤的译法如果未见到则译者给出⼀种译法并在旁边列出英⽂译⽂中各节的标题都是这样处理的前者如最简单的例⼦Aligment⼀词有⽐对对⽐对排等多种翻译郝柏林院⼠建议译做联配见⽣物信息学⼿册p175⽅⾈⼦译做排列对⽐见新语丝⽹页本译⽂采⽤联配的译法后者如mask⼀词⽂中专门有⼀节解释其含义此词的普通含义有⾯具遮饰译⽂中使⽤屏蔽并在旁边写mask总之此类词汇使⽤多了⾃然明了其内在的含义4 偶尔译者会对某处略做解释旁边⽤译者注表⽰表⽰译者的理解请注意5 翻译时在词汇的翻译和算法的理解上参考了以下资料A ⽣物信息学⼿册郝柏林等著上海科学技术出版社 2000年B ⽣物信息学基因和蛋⽩质分析的实⽤指南 Andreas D.Baxebanis等原著李衍达等译清华⼤学出版社 2000年6 由于译者占有的资料不多⽔平有限在译⽂中肯定有漏译译的不全⾯甚⾄理解完全错误的地⽅(尤其是算法上)敬请指正关于BioEdit介绍BioEdit版本5.0.6版权?1997-2001汤姆霍尔当前版本制作于2001.12.2BioEdit是⼀个⽣物序列编辑器可在Windows 95/98/NT/2000中运⾏它的基本功能是提供蛋⽩质核酸序列的编辑排列处理和分析 1.0α版本是最早的未完成的并有瑕疵的版本 1.0α版本也⼀直未完成并有很多问题但是⽐较前⼀个还是增加了⼀点东西修正了⼀些问题在2.0版本中在增加和配置附加分析应⽤程序上增加了⼀个界⾯使其能通过BioEdit得到⼀个图形界⾯⽽且还增加了位置排列的信息基础动态描影版本3中增加了疏⽔亲⽔⾯互交的2-D浮雕数据绘图和⼀些更多的序列操作法版本4为绘制和注解质粒载体增加了⼀个图形界⾯在4.7.1版本中修改了处理序列信息和存储⽅法⽽且增加了⼀个⼆进制⽂件格式允许快速保存和打开⼤的排列序列容量增加到20,000在版本5中增加了⾃动注解序列或⼿动使⽤所有的标准Genbank功能部件定义⽽且在Isis Pharmaceuticals公司的请求下增加了序列排序和分型组控制注解⾏以及残基和⾮残基字符的鉴别BioEdit并不打算成为⼀个强序列分析程序但是打算成为⼀个序列分析的友好⽤户界⾯并连接其他在局域⽹和万维⽹上的更多的序列分析程序它现在使⽤于⼤的排列>2000序列⽂件界⾯最初模仿于⼀个⾮常好的程序――Don Gilbert 编写的SeqApp and SeqPup印地安那州⼤学免费提供SeqApp (⽤于个⼈计算机) and SeqPup (⽤于交换平台)地址是ftp:///doc/8f7d638d84868762caaed50f.html /molbio/seqpup/GeneDoc是⼀个特别的排列程序能够⾃由的在Windows 9x 和NT上使⽤也是⼀个⾮常专业的程序有很好的蛋⽩质排列注解和分析描影和结构定义功能部件就象⼀个反映排列的内在的进化树⽽这些在BioEdit中是没有的GeneDoc的⽹址是/doc/8f7d638d84868762caaed50f.html /biomed/genedocGeneDoc有⽐BioEdit更好的描影和分类选项有助于⼿⼯排列序列还有更好的图形处理缠绕和伸展的排列视图选项动态共有序列和更平滑和更快速的排列卷曲和刷新BioEdit是⽤Borland's C++ Builder编写的C++程序我是北卡罗来纳州⼤学微⽣物系的研究⽣不是专业的程序员这是我学习C++语⾔的⼊门必然是个⾮专业的设计这不是我博⼠⼯作的⼀部分这个程序⾮常⼩⽽且很有效率BioEdit为序列排列输出和⼀些分析提供容易的⼯具BioEdit功能BioEdit的主要⽬的是为那些不愿意被迫详细了解⼀个程序的使⽤⽅法的⽣物学家提供⼀个有⽤的⼯具BioEdit是直观的菜单式的并有⼤量的图⽰提供⽤户⼀个外部分析程序的图形界⾯主要功能是提供明显的容易使⽤的菜单选项5.0.6版本提供以下功能⽤于序列处理和编辑的简单的图形界⾯使⽤编辑选项包括残基的select and drag选择和拖动和grab and drag抓取和拖动变量选择选项⿏标点击插⼊和删除缺⼝全框选择全屏编辑中剪切复制和粘贴编辑窗⼝的⾃动刷新固定序列框保护排列中的固定残基使⽤各种功能部件内含⼦外显⼦促进⼦CDS和所有标准GenBank功能部件类型⾃动的和⼿动的注解序列使⽤⼀个模板序列⾃动注解同⼀排列中的其他序列序列分组分为各个颜⾊编码家族为同步⼿动排列锁定组成员⽤户定义的适当功能部件能够设定考虑任何功能部件就像⽤于类似性描影序列同⼀性矩阵和保存图表视图的核酸或氨基酸序列中的相关碱基⽤户定义的基序搜索使⽤标准的Prosite命名法和IUPAC功能部件允许搜索核酸或氨基酸序列还有精确的⽂本搜索包括或忽略缺⼝程序⾏可以定义为DNA RNA核酸蛋⽩质未定义或注解注解可以⽤于保存普通的注释或东西就象⼆级结构模糊定义但是不能保存计算根本的多基因树图阅读器⽀持节点翻转和打印链接多基因树图到排列并保存到BioEdit格式排列⽂件在⼀个排列末端添加另⼀个排列配置附件应⽤程序界⾯进⼊⼀个有BioEdit产⽣的图形界⾯的外部分析程序在外部应⽤程序中⾃动提供信息和找回⽂件外部应⽤程序进⼊分开的调度单位允许同步应⽤BioEdit外部程序的输出⽂件可以⾃动被其他程序打开在ABI⾃动序列模型3773733700中显⽰打印和编辑ABI痕迹⽂件在版本2和3中有SCF⽂件就象⽤Licor序列输出⽂件RNA⽐较分析⼯具包括共变可能配对和互交信息分析使⽤⿏标指⽰的动态数据视图的互交信息输出2D矩阵图表关于互交信息矩阵⾏和框的互交式的1D图表⽤BioEdit或GanBank格式保存序列注解信息通过氨基酸翻译排列蛋⽩质编码核酸序列在排列中搜索保存的残基寻找好的PCR⽬标或帮助定义基序在核酸或蛋⽩质序列中搜索⽤户定义的基序或⽤通配符搜索精确的⽂本并选择包括或忽略缺⼝⽤⽀持最多20,000序列每个⽂档进⾏循环存储器分配最多可以成功测定四百六⼗万个碱基 E. coli基因组核糖体数据库中的原核细胞16SRNA排列29 Mb, 6205个序列将会被单独处理在配置为Pentium 233 Mhz80 Mb RAM的计算机中⽤BioEdit计划⽂件格式最多只需要10秒种可以写⼊⼀个16S RNA排列内部的读写GenBank Fasta Phylip和NBRF/PIR⽂件⽤Don Gilbert’s ReadSeq导⼊输出⼀些其他格式的⽂件使⽤BioEdit计划⽂件格式快速读写⼤排列⽂件使⽤⾃动更新的排列蛋⽩质全标题和GenBank区域信息进⾏ClustalW多序列排列Des Higgins et. al.编写的内部界⾯外部程序就象排列来⾃于核苷酸序列的蛋⽩质视图时的核苷酸编码序列将残基块状复制到剪贴板允许将全不排列或部分排列粘贴到⽂字处理器基本序列处理在⽂档之间复制粘贴序列翻译和还原编码RNA?DNA?RNA反转互补⼤写字母⼩写字母多⽂档界⾯最多同时打开20个⽂档但是在其他打开的窗⼝不能设置限制六框翻译核酸序列为Fasta格式ORF表⽤⽮量图进⾏半⾃动质粒⽮量绘图和注解⾃动酶切位点和位置标记⾃动多接头视图和⽤户控制绘图⼯具将质粒⽂件保存为可编辑的⽮量图形⽂件如位图复制到其他图形程序并可以打印氨基酸和核苷酸成分摘要和图表Revert to Saved恢复保存和undo撤销功能编辑氨基酸和核酸序列简单的指定⾊彩表编辑蛋⽩质和核酸序列使⽤不同的⾊彩表排列易感的描影法以信息为根据其中包括排列位置BioEdit 能够读写GenBank, Fasta, NBRF/PIR, Phylip 3.2 和 Phylip 4格式能够读ClustalW 和 GCG格式.10个附加格式的导⼊输出过滤器使⽤Don Gilbert的ReadSeq导⼊/添加⼀个⽂件到最后的另⼀个⽂件上(不考虑⽂件格式)基本的多⽂本编辑器限制性内切酶图谱⽤于任何或所有形式的翻译复酶和输出选项包括酶的提供者和环状DNA选项游览限制性内切酶创造商⾃动连接到你喜欢的⽹页游览器如Netscape或Internet Explorer程序和程序组的概述BioEdit是⽤Borland C++ Builder 3.0编写的(开始时是⽤C++ Builder 1.0)这是曾经是Borland公司的最新C++产品它结合了Borland C++ 5和Delphi的可视要素库VCL允许⽤户界⾯的可视开发使⽤快速申请开发RAD环境的好处在于它能够容易的创造出⼤量的图形界⾯它的缺点是编码不轻便BioEdit只能在Windows 95, 98, NT and 2000中使⽤我原来计划可以使BioEdit在Win16使⽤但是⾃从Windows 3.x过时了以后我就不再计划这样做了组织BioEdit当前⽀持同时编辑最多50个⽂件主要的控制形式包括打开⽂件的菜单创建新⽂档调整球形选项如⾊彩表密码⼦表分析参数选择和⼀个窗⼝管理器最初每个⽂档有它⾃⼰的整套处理菜单可以限制⽂档然⽽这被⼀个更传统的多⽂档界⾯所替代BioEdit没有使⽤额外的物理存储器除⾮编辑⼤的排列但是它看起来像占⽤了很多资源BioEdit每个⽂档最多可以有20,000个序列但在序列⼤⼩上没有限制在80MbRAM的233MHz的个⼈计算机上可以很好的处理⼀个来⾃于核糖体数据库的完整的原核16S rRNA排列6205个序列每⼀个有3319个字符⼀旦⽤BioEdit格式保存这个⽂件可以在⼏秒钟打开⽤GenBank格式要⼏分钟才能打开程序⽂件(BioEdit.exe)可以在主安装⽬录中找到可能还有以下⼦⽬录apps附件程序⽹页和⽹页书签通常以下⽂件会出现在apps⽂件夹按名称排列accApp.ini (在⾸次安装时为accApp.def)Bblast.htmlBioEdit.htmlblast_adv.gifblast_form_0.gifblastall.exe (在没有BLAST的版本中不出现)blastcl3.exe (在没有BLAST的版本中不出现) blast.txt bookmark.txtcap.doccap.execlear_inp.gifclustalw.execlustalw.txtcutter.htmlDnadist.docDnadist.exeDnamlk.docDnamlk.exeDos4gw.exe (PHYLIP 程序需要)Expasy.giffastDNAml.docfastdnaml.exeFitch.docFitch.exeformatdb.exe (在没有BLAST的版本中不出现) IdPlot.exe isrecsmall.gifKitsch.docKitsch.exemod_ad.gifmod_submit.gifnnpredict.htmlPFSCAN_form.htmlphi_blast.gifPHIBlast.htmlPhylip.mapProtdist.docProtdist.exeProtpars.docProtpars.exepsi_blast.gifPSIBlast.htmlReadseq.exeReadSeq.txtscnpsit1.htmlSiblogo.gifsmweb.gifdatabase (是局部的BLAST数据库安装的版本必须有BLAST⼯具). BioEdit (全版本) 有以下⽂件在database⽂件夹Ecoli.phrEcoli.pinEcoli.psqEcoli_ORFs.txt (E. coli 开放读码框架的⽂本⽂件).help/doc/8f7d638d84868762caaed50f.html t BioEdit.GID (不是安装来的出现在帮助⽂件第⼀次使⽤后) Bioedit.hlptablesBlosum62codon.tabcolor.tabdayhoffdefcolor.tabenzyme.tabGc.valgonnetmatchPam120Pam250Pam40Pam80Seqcode.val安装⽂件夹通常包括以下⽂件_deisreg.isr (安装相关⽂件)_isreg32.dll (安装相关⽂件)BioEdit.exe (BioEdit 执⾏⽂件)DeIsL1.isu (安装相关⽂件)RNaseP_prot.gb (蛋⽩质排列⽰例)RNaseP_prot_genes.gb (DNA排列⽰例)RNaseP_RNA.gb (RNA排列⽰例)PBSSK_plus.pmd (质粒绘图⽰例)bacterio.gb (附带GenBank 信息的蛋⽩质排列⽰例)bacterio.bio (附带GenBank信息图式注解记号标记和序列族的BioEdit⽂件⽰例) YopD.gb (附带GenBank信息的另⼀个⽰例⽂件)TreeView.zip (Roderic D.M. Page编写的极好的系统进化树阅读器完全安装才有) TreeView.txt (记录TreeView的安装信息和配置BioEdit与tree-generating附件的连接)license.txt (BioEdit 许可证协议)ReadMe.txt (总说明)重要的是⽂件夹和⽂件的名字不能更改如果更改了BioEdit将不能正确安装将会有⼀个BioEdit.ini⽂件出现在你的Windows主⽬录下它包含BioEdit的初始化默认值和参数选择虽然这个⽂件可以⼿动编辑但是我们推荐不要编辑和⼿动编辑这个⽂件当前被⽀持功能部件和已知问题的列表请看BioEdit的功能和已知问题局限性已知问题和局限性BioEdit想要成为⼀个处理个别简单序列的多⽤途界⾯带有适合于⾃动化多重排列选项的综合序列排列最佳成对排列并且着重于使⼿⼯排列更容易随着时间的推移增加了⼀些附件的功能质粒绘图限制性内切酶图谱ABI和SCF查阅RNA⽐较分析和其他功能中的图式注解然⽽常⽤的查找功能特殊化分析如蛋⽩质⼆级结构三级结构的预测RNA结构的热动⼒学预测排列性质的统计学分析序列模式的概率或神经⽹络模型排列和结构的预测不包括在这个程序之内虽然⽤户可以配置命令⾏附件应⽤软件有程序链接连到ClustalW局域BLAST和BLAST client 3但是在ClustalW程序或BLAST 程序升级后不能保证这些链接正确⼯作虽然在BioEdit安装程序中提供的局域BLAST和Clustal程序将会继续⼯作但在下⼀次NCBI决定改变它的委托⼈时BLAST client 3将不能正常⼯作我也不再⼀直⽀持这个程序源代码将在稍后提供下载但是会有⼀些紊乱没有很好注释限制于Borland C++ Builder这是我毫⽆疑惑的发布源代码的原因同样⾃动⽹页链接为⽹页如BLAST PSI-BLAST PROSITE轮廓扫描⽹页提供⼀个选择序列它们的⼯作依赖于⽹页的局域HTML模板BioEdit编辑的资源包括查询⽂本区域的选择序列因为万维⽹的⾼度易变性这些也许不能长时间正常⼯作如果⼀些地址变化或者HTML界⾯充分改变这些将不再能正确⼯作它们可能可以在BioEdit/apps⽂件夹中局部的被新的同名更新⽹页所替代但是它们是否能正常⼯作将依赖于⽹页中必需的URL定位是否被指定为绝对路径或相对路径它们是否依赖于局域CGI或Java 程序和其他潜在的问题想要配置命名⾏分析程序的界⾯很好的⼯作可能不需要复杂的scripting语⾔然⽽因为这个界⾯及其选项的静态特点可能有程序不能正确的通过BioEdit运⾏虽然绝⼤多数接受命令⾏的程序可以被设置总之许多⼈可能宁愿为了更好的控制选项⽽从命令⾏运⾏程序BioEidt可以很好显⽰合适⼤⼩的排列然⽽对于⼀次打开的排列⽂档数量有限制同样⼀个单⼀排列中的序列数量也有限制现在最多⼀次打开50个排列⽂档⼀个排列中的最多序列数是20,000序列数量的限制和序列长度是⽆关的排列的绝对⼤⼩是有效的系统内存决定的如果⽂档在系统中全部进⼊虚拟内存编辑将会变得很慢如果排列中有⼏千个rRNA基因或者全部基因组的序列列表在Win95/98或NT系统中⾄少需要64到128Mb的内存在Win2000系统中⾄少需要128Mb内存在排列矩阵N× M > 40,000,000 (N = 序列数M=最长序列长度)时Undo撤消选项⾃动失效BioEdit是由Borland C++ Builder编写的是100% Windows基础它是不可移植的因为这个程序的⼤部分是图形界⾯在UNIX或Mac中可能不好使⽤BioEdit使⽤⼿册序列编辑处理⼿⼯序列排列下⾯是基本的BioEdit排列⽂档窗⼝如果你不喜欢现在的样⼦不要当⼼字体⼤⼩背景颜⾊残基颜⾊和标题窗⼝宽度都可以改变⿏标箭头右下⽅的黄⾊条幅显⽰的是当前序列的绝对位置这同样显⽰在控制栏的Position标题选择关闭黄⾊条幅就进⼊View->show sequence position by mouse arrow总的⼿⼯排序功能是在编辑窗⼝有三个可应⽤的基本模式选项可在Sequence->Edit Mode中找到Select / Slide mode(选择/调整模式)⽤⿏标左键选择框住的残基⽤⿏标来回的拖动选择默认值是朝你滑动的⽅向忽略unlocked gaps并在所选择的另⼀边开启新的unlockedgaps为了移动所选择的全部序列的下游不管缺⼝在移动时按住shift键你也可以在按钮板上切换合适的按钮见后改变默认值为移动所选择的全部序列的下游选定选项后在滑动时⽤shift键忽略unlocked gaps⽤shift键选择所有在现在选定的和新选择的残基CTRL键可以在当前选择上增加⼀个新的选择例如你也许想在三个互不相连的序列中选择残基Edit mode编辑模式在编辑残基模式中你可以在⽂档的任何位置除了标题放置任何类型的光标⽤箭头你可以在序列中⾛来⾛去编辑有两种形式插⼊和改写当编辑器在编辑模式可以看见在编辑模式的下拉菜单中有⼀个选项在其它两个排列模式,这个选项不会出现.Grab & Drag mode(抓取/拖动模式)从mode⽬录中选择Grab & Drag或者切换G/D按钮见后你可以从屏幕上动态的抓取和拖动单个残基⽤shift键移动整个残基序列的下游或者在按钮板上切换成合适的按钮――见后Grouping of sequences序列分组Sequences may be grouped into groups (or"families").序列可以进⾏分组或分成家族⼀个组的序列排列可以相互锁定意味着⼿动调节⽤可调整的残基插⼊或和删除缺⼝将⾃动同步调节⼀个锁定的组This only applies to sliding resides (Select / slide mode or Grab & Drag mode), not to single insertions and deletions of gaps with right mouse clicks. For information on grouping sequences and locking the alignment of groups of sequences, see grouping sequences.这只适合于可调整的残基Select / slide mode或Grab & Drag mode不能⽤⿏标右键进⾏单个缺⼝的插⼊和删除想了解有关序列分组和其排列锁定的信息看grouping sequences⼯具条 / 加速按钮锁定和开启全部序列的所有缺⼝当打开⼀个排列这个按钮是在开启状态但是缺⼝是现在的虽然它们过去被保存在这个按钮被按下去后才能进⾏改变为了开启当前序列的所有缺⼝你必须按这个按钮两次进⾏切换到这个状态第⼀状态是锁定所有缺⼝上个按钮的锁定状态按下这个按钮可以⽤⿏标右键插⼊单个缺⼝⽤⿏标右键删除缺⼝在所有序列中插⼊缺⼝除了在⽤⿏标右键点击这个按钮的位置在所有序列中插⼊缺⼝除了在⽤⿏标右键点击这个按钮的位置在选择位置没有缺⼝的序列将不会改变但是有这个按钮在那⼉缺⼝将始终被删除转换⿏标左键和右键的默认值功能切换Grab & Drag模式按下这个按钮可调整残基的默认值是忽略或扩展到下游缺⼝使⽤shift键可以调整转换这个功能按下这个按钮可调整残基的默认值是移动全部所选序列的下游胜过忽略或扩展到下游缺⼝使⽤shift键可以调整转换这个功能普通视图模式当序列颜⾊显⽰时残基根据当前的⾊彩表着⾊这个选项⽤于序列是单⾊视图时所有其他视图覆盖单⾊视图反转颜⾊视图模式背景栏根据每⼀个残基的⾊彩表描影残基的颜⾊是它们普通颜⾊的反转排列的强度――残基根据每⼀栏的信息内容灰度描影残基背景根据每⼀栏的信息内容描影把⽂档窗⼝中⼀致的和类似的残基描影按下这个按钮控制条上将会出现⼀个下拉菜单可以控制隐藏的百分⽐开端蛋⽩质排列的类似性隐藏的矩阵⽂件可以在Alignment->Similarity Matrix菜单中详细说明绘出功能部件其上有层次的序列只绘出功能部件没有序列根据当前的⾊彩表序列彩⾊视图根据当前选择的序列颜⾊序列单⾊视图只⽤于normal view按钮也被按下⽤⼀个字符默认值是.显⽰序列的同⼀性默认值是top.如果按下前⼀个按钮这个下拉菜单能够选择标记同⼀性的字符显⽰或隐藏交互信息检查器只⽤于RNA分析引出⾊彩表编辑对话窗切换ignore anchor points模式如果这个按钮没有按下固定栏限制排列的范围按下这个按钮固定栏被忽视卷屏速度控制器控制⽔平卷屏条卷屏是因残基增加增加或移去位置标记旗增加或移去⼀个栏的固定点在编辑盒中编辑在⼀个⽂本窗⼝中进⾏⼀个序列主要的编辑会⼗分⽅便为⼀个序列开启⼀个编辑窗⼝双击序列的标题或选中序列并从Sequence菜单中选择Edit Sequence为了使改变⽣效必须按下Apply或Apply and Close按钮取消将不会改变序列在⼀个序列第⼀次编辑时将会出现下⾯的窗⼝在Sequence Type下拉菜单中下列选项是可⽤的如果⼀个序列是未知的蛋⽩质⾊彩表通常是彩⾊的就像⼀个已经经过类似性底纹处理的蛋⽩质序列可以保留⼀个关于排列的每⼀⾏的屏幕信息的注解但是不能计算类似性和同⼀性不服从标准的处理如翻译互补⾃动排列等在单个序列编辑器中你可以⽤lock sequence选项选择锁定任何序列应⽤这个选项时selecting/dragging或抓取和拖动将不能使⽤但是⽤⿏标右键增加或删除缺⼝始终可以使⽤按下按钮可以展开窗⼝看相关的GenBank的信息窗⼝扩展如下按钮可以⽤于提出在⼤的编辑窗⼝中的相关领域**注意GenBank信息将只能⽤GenBank或BioEdit格式保存***注意GenBank信息包括功能部件领域是内部独⽴于⽤户定义的图⽰注解窗⼝隐藏⼀个⽂档可以进⾏窗⼝隐藏就是双击窗⼝的标题栏可以隐藏标题栏再次双击可以使其变回原来的⼤⼩它也可以最⼩化和最⼤化增加⼀个新序列通过以下⽅式增加新序列1.在Sequence菜单下选择New Sequence选项序列可以像原始⽂本⼀样被键⼊或复制进序列窗⼝按下Apply按钮可以在⽂档中增加序列2.通过Edit菜单的Copy Sequence(s)和Paste Sequence(s)命令复制或粘贴来⾃其他BioEdit⽂档的序列同样也可以使⽤当前菜单快捷键(默认值Ctrl+F8复制Ctrl+F9粘贴)全屏编辑序列可以在全屏编辑就像在⼀个⽂字处理器上⼀样必须⾸先设定Mode选项为Edit Residues(BioEdit在安装后默认模式为Slide Residue)在编辑模式下你可以使⽤箭头在屏幕上移动输⼊像在⽂本编辑器中⼀样编辑有两种选项插⼊模式和改写模式它们类似于在⽂字编辑器中的功能选择序列点击序列的标题可以选中序列拖划出⼀个⽅框可以选中多个序列或⽤shift键选择两个选择序列之间的所有序列⽤Ctrl键加⿏标可以分别选择标题或给选中的序列加上详细的标题双击标题将会打开⼀个单序列编辑器再次点击原先选中的标题使其进⼊全屏编辑模式你可以编辑标题后按下< return >或点击序列标题板的任何位置使对标题的改动⽣效移动序列想移动⼀个序列(或⼀些序列)选中它(⽤⿏标左键点击它的标题使其变亮)把它拖放到你想要的位置Cut Copy Paste剪切复制粘贴Copy复制编辑窗⼝的⽂本(序列残基)⽤⿏标选择⽂本并从Edit菜单选择Copy不像⽂字编辑器你可以复制你想选择的区域⽽不是复制⽂本的全部⾏这种⽅式复制的区域可以粘贴在任何能够进⾏⽂本编辑的程序中如果只是如果你没有选中在全部序列中任何残基序列的标题将会以BioEdit序列结构形式复制到BioEdit的剪贴板在选择Paste Sequence(s)时全部序列将会被粘贴到⽂档全部序列⽤⿏标选择序列标题并从Edit菜单选择Copy Sequence(s)标题被选中的序列将以Fasta格式被复制到Windows剪贴板多于⼀个被选中的序列将以Fasta序列⽬录的形式复制到剪贴板中并在BioEdit内部复制成⼀组全部BioEdit序列结构能够被粘贴在任何BioEdit⽂档中注意BioEdit剪贴板中包括所有序列相关数据Genbank信息图⽰注解是在BioEdit 同⼀步骤的内部它们不能在独⽴的步骤之间转移为了在BioEdit排列⽂档之间复制序列必须确定两个⽂档是在程序的同⼀步骤打开的只有Fasta格式的序列可以被复制到普通的Windows剪贴板Paste粘贴在编辑窗中的⽂本为了把⼀个序列粘贴⼊主编辑窗界⾯必须是Edit Residues模式见全屏编辑如果⽂本的⼀个区域被粘贴到⼀个序列只有第⼀⾏⽤回车键定义将会被粘贴这避免了在粘贴⽂本进⼊序列时可能出现的问题也避免了不注意的使错误的序列在其下为了把⽂本的⽚段粘贴到排列的⼀个区域⽚段必须⼀次⼀个的粘贴进序列如果⽂档在Slide Residues或Grab and Drag模式Paste粘贴的功能将会和Paste Sequence(s)粘贴序列的功能⼀样见后全部序列从⽂档菜单到粘贴序列从Edit菜单中选择Paste Sequence(s)序列将会增加到⽂档的最后它们可以移动到⽂档的任何位置Cut剪切和Cut Sequence(s)剪切序列就象Copy复制和CopySequences复制序列⼀样但是其功能是从⽂档中删除复制的信息然⽽只有在Edit Residues模式下残基才能从⽂档中删除同样当在没有选中任何残基的情况下使⽤剪切功能时标题被选中的序列将以Fasta格式被复制到Windows剪贴板并以序列结构的形式复制到BioEdit剪贴板中但是它们不能从⽂档中删除为了适当的从⽂档中剪切序列可以选择Cut Sequence(s)Minimizing an Alignment排列的最⼩化当⼀个排列⼿⼯处理时当序列定期的增加并⼿⼯排列到⼀个现有的排列中缺⼝经常导致⼀个专栏出现在每⼀个序列中为了在不改变现有排列的情况下移动缺⼝选择Minimize AlignmentBasic Manipulations / Sequence Menu基本处理序列菜单⼀些简单的序列处理可以通过BioEdit的⼀个菜单选项⾃动完成这些选项在Sequence中在BioEdit中Masks屏蔽在这⼀点上有⼀点薄弱主要⽤于RNA⽐较分析功能关于在BioEdit中如果使⽤屏蔽看Masks锁定和开启缺⼝当残基在序列中滑动时⼀个锁定的缺⼝将不能被压缩为了锁定缺⼝选择想要锁定的缺⼝后选择Lock Gaps想要锁定序列中的所有缺⼝选择序列的标题后选择Lock Gaps想要锁定⼀个排列中的缺⼝切换lock/unlock按钮进⼊锁定状态开启的缺⼝就是锁定状态的相反想要开启⼀个排列中的所有缺⼝切换lock/unlock按钮进⼊开启状态Degap选项可以移动所有开启的缺⼝它也可以移动被选中标题的序列中的所有开启的缺⼝注意和.表⽰开启的缺⼝表⽰锁定的缺⼝这个惯例⽤于BioEdit中每⼀个窗⼝和功能如果⼀个句点没有经过BioEdit加上的缺⼝特点但也有⼀种加⼯过的缺⼝类型为了程序的可计算性宁愿使⽤BioEdit中的缺⼝特点同样⼀些程序可能使⽤⼀个句点去表⽰排列位置中没有残基或缺⼝但是只是在序列的开始或结尾BioEdit不直接注意这种差别序列⾏之前或之后的位置被加⼯成缺⼝⽽且BioEdit假定每⼀个排列包含有真正的同源序列尽管BioEdit也被设计成允许⽤户忽视程序的排列中⼼并只使⽤它处理序列的数据Sequence Menu序列菜单(不包括mask功能)New Sequence新序列创造新序列开启⼀个单⼀序列编辑器。

Bioedit操作指南PPT课件

Bioedit操作指南PPT课件
Biedit软件的应用介绍:DNA序列基本操作
1. 目的:纯菌种16S rRNA,利用Sanger方法双端测序,然后检查测序质量,将双端测序 的序列拼接成一条完整的序列,利用这个长序列去与数据库比对,判断这个序列最 可能是从哪个微生物来的。
2. 具体操作过程:以一个纯菌种的16S rRNA测序为例,练习序列拼接(assembly). 用Sanger方法,从两端测序,引物为27F和1492R。
正向引物27F测得的序列
Overlap
反向引物1492R测得的序列
拼接 (assembly)
Contig
.
1
Biedit软件的应用介绍:DNA序列基本操作
第一步:Sanger测序下机文件为.abi文件,可以用Bioedit打开查看测序质量。峰型好 的碱基质量较好,把质量好的碱基部分提取出来,存成fasta文件。
.
2
Biedit软件的应用介绍:DNA序列基本操作
第二步:将27F和1492R测得的序列都整接成 一个长的contig。
操作如下:file----new alignment-----file----import ------sequence alignment file---同时选择 Seq27F.fas和seq1492R.fas-----file-----save as 27F+1492R.fas-----file----open 27F+1492R.fas ---点击选择两个文件名-----accessory applications-----CAP assembly contig program-----run application-----enter----随即产生了contig序列,delete原始的序列(seq27F.fas和 Seq1492R.fas),给contig命名,另存为Seq27F+1492R_contig.fas。

biometre PCR仪中文说明

biometre PCR仪中文说明

到压力全部放出。打开盖子。
重要:在离合器装置启动的状态下(施加理想压力时),千万不要使用金属针继续增加压力。这会导
致试管和设备的损坏!
5 创建一个程序
5.1 选择一个目录 在 T1 中,程序既可以储存在主目录中,也可以储存在 9 个单独的子目录中。在每个子目录中,最多
可以储存 100 个程序。为了方便的识别选择的储存位置,子目录可以被命名。(见 5.3) 由主菜单开始。
你继续旋转转轮,压力不会再增加了。
注意:盖子的压力在满槽的时候达到最佳。如果槽中的试管很少,你应该在四个角的位置上放置一
些空薄壁管,以避免压力过大使试管损坏。
打开热盖:
逆时针旋转转轮释放压力。不再有阻力的时候就说明压力已经释放了。现在您可以打开盖子。
重要:请注意顺序!有压力的时候千万不能打开盖子,因为这样可能会损坏门锁系统。
UVWXYZ - () # °C/,<>&+.%!
A name B blank C name OK D enter

用光标键←→↑↓从字母中选择一个,用[D enter]确认。
Directory:
5
Program no: 0
name: T

ABCDEFGHIJKLMNOPQRST
UVWXYZ - () # °C/,<>&+.%!
A name B blank C name OK D enter
选择的字母会在显示屏上出现,光标会向右移动一格。选择下一个字母,用[D enter]确认。
注意:如果系统接受了一个错误的字母该怎么办?
按[A name]在名称内移动光标。现在您可以用光标键→←在名称上移动光标了。按了[A ABC]之后, 您可以输入新的字母。您也可以使用这个功能去更改一个已存程序的名称。

如何利用BioEdit和Clustalx进行序列比对

如何利用BioEdit和Clustalx进行序列比对

1、将要进行序列比对的信息保存为.txt文本文档类型(如11.txt和21.txt)
2、打开BioEdit,选择“New Alignment”图1,在file下拉菜单中选择”import”→“sequence
alignment file”图2选择刚才新建的两个或多个文本,点击保存,保存类型为“Fasta”
生成文件名为.fas。

图1
图2
3、打开Clustalx软件,选择“文件”→“载入序列”,打开刚才保存的文件(注意,该文
件应该与ClustalX在同一文件夹中),选择“序列比对”→“完全序列比对”,这时会生成两个文件,.aln和.dnd文件,其中.aln为序列比对文件,而.dnd为树文件。

4、打开BioEdit软件,选择选择“New Alignment”,在file下拉菜单中选择”import”→
“sequence alignment file”找到刚才生成的.aln文件打开就可以进行比对分析了。

5、。

BioEdit实验报告

BioEdit实验报告

生物信息学引论实验课报告(3)一、实验目的与要求1、熟悉使用BioEdit软件基于核酸序列比对分析的真核基因结构分析;2、熟悉使用BioEdit软件进行核酸序列的点突变定位;二、实验内容(一)使用BioEdit软件进行序列分析(选取一种数据);(二)1. 人瘦素(leptin) 基因编码区点突变408 A→C的定位:打开BioEdit软件→将人瘦素(leptin) mRNA的FASTA格式序列输入分析框→点击左侧序列说明框中的序列说明→点击Sequence栏→选择Nucleic Acid→点击Find next O RF→从起始密码ATG的第一个碱基开始查找该基因编码区408(464,NM_000230)位碱基(A);2. 人瘦素(leptin) 基因编码区点突变408 A→C的限制酶切点分析:再点击Sequence栏→选择Nucleic Acid→点击Restriction M ap→点击Generate Map按钮→找到该基因编码区408(464,NM_000230)位碱基后可见该位置有限制酶Hind III 的切点(AAGCTT);(提示:如发生408 A→C突变,则该酶切点消失);3. 人瘦素(leptin) 基因编码区点突变408 A→C分析的引物设计:调用Internet浏览器并在其地址栏输入primer3网址(/cgi-bin/primer/primer3.cgi)→用复制/粘贴方式将人瘦素(leptin) mRNA(NM_000230)的FASTA格式序列输入分析框→在targets框填入464,1→选择Product Size (~300 bp)和Primer Tm (~58.0) →点击Pick Primesr按钮→从显示的五队引物中选择合适的引物;4. 人瘦素(leptin) mRNA定量的引物设计:方法同“3. 人瘦素(leptin) 基因编码区点突变408 A→C分析的引物设计”,但在targets框将突变点位置改为外显子交会点位置,另外Product Size 一般选择~150 bp。

第四章 bioedit多序列比较的实际应用

第四章 bioedit多序列比较的实际应用






>gi|14786152|ref|XP_029934.1| matrix metalloproteinase 9 preproprotein [Homo sapiens] MSLWQPLVLVLLVLGCCFAAPRQRQSTLVLFPGDLRTNLTDRQLAEEYLYRYGYTRVAEMRGESKSLGPALLLLQKQLSLPETGELDSA TLKAMRTPRCGVPDLGRFQTFEGDLKWHHHNITYWIQNYSEDLPRAVIDDAFARAFALWSAVTPLTFTRVYSRDADIVIQFGVAEHGDG YPFDGKDGLLAHAFPPGPGIQGDAHFDDDELWSLGKGVVVPTRFGNADGAACHFPFIFEGRSYSACTTDGRSDGLPWCSTTANYDTD DRFGFCPSERLYTQDGNADGKPCQFPFIFQGQSYSACTTDGRSDGYRWCATTANYDRDKLFGFCPTRADSTVMGGNSAGELCVFPF TFLGKEYSTCTSEGRGDGRLWCATTSNFDSDKKWGFCPDQGYSLFLVAAHEFGHALGLDHSSVPEALMYPMYRFTEGPPLHKDDVN GIRHLYGPRPEPEPRPPTTTTPQPTAPPTVCPTGPPTVHPSERPTAGPTGPPSAGPTGPPTAGPSTATTVPLSPVDDACNVNIFDAIAEI GNQLYLFKDGKYWRFSEGRGSRPQGPFLIADKWPALPRKLDSVFEERLSKKLFFFSGRQVWVYTGASVLGPRRLDKLGLGADVAQVT GALRSGRGKMLLFSGRRLWRFDVKAQMVDPRSASEVDRMFPGVPLDTHDVFQYREKAYFCQDRFYWRVSSRSELNQVDQVGYVTY DILQCPED >gi|15718389|dbj|BAB68366.1| gelatinase [Paralichthys olivaceus] MRCCALAVCLVLVIVQDGWSLPLRSISVTFPGDILKNVTDTDLAETYLKRFGYLDKMHRSGFQSMVSTAKALKMMQRQMGLKETGKLD KSTLEAMKQPRCGVPDVANYQTFEGDLKWDHNDVTYRTLNYSPDMESSLIDDAFARAFKVWSDVTPLTFTRLYEGTADIMISFGKADH GDPYPFDGRNGLLAHAYPPGEGVQGDAHFDDDEHWTLGNGPAVKTLYGNADGAMCHFPFTFEGKSYTSCTTDGRTDNLPWCATTAD YSRDGKYGFCPSELLYTVGGNADGAKCVFPFVFLEKEYDSCTKEGRSDGYRWCATTANFDQDQKYGFCPSRDTAVFGGNSEGEPCH FPFVFLGKEYDSCTSEGREDGKLWCSTTDNYDEDAKWGFCDDEGYSLFLVAAHEFGHALGLDHSNIREALMYPMYTYVEDFSLHKDDI EGIQYLYGRGTGPDPTPPQPTSTTTTPNPTEEPEPTTPQPVDPTRDACKLTKFDTITMIENELHFFENGNYWKMPSRGDGGLKGPFSLS ERWPALPAVIDSAFEDLLTKNMYFFSGNRFWVYTKEGVLGPRSIEKLGLPTSIQKVEGALQRGKGKVLLFTEESFWKFDLKSQKMDKGY PKSTDYVFGGVPNDAHDVFQYKGHMYFCRDSFYWRMNSRRQVDRVGYVKYDLLKCSDSY >gi|13591993|ref|NP_112317.1| matrix metalloproteinase 9 (gelatinase B, 92-kDa type IV collagenase) [Rattus norvegicus] MNPWQPLLLVLLALGYSFAAPHQRQPTYVVFPRDLKTSNLTDTQLAEDYLYRYGYTRAAQMMGEKQSLRPALLMLQKQLSLPQTGELD SETLKAIRSPRCGVPDVGKFQTFEGDLKWHHHNITYWIQSYTEDLPRDVIDDSFARAFAVWSAVTPLTFTRVYGLEADIVIQFGVAEHGD GYPFDGKDGLLAHAFPPGPGIQGDAHFDDDELWSLGKGAVVPTYFGNANGAPCHFPFTFEGRSYLSCTTDGRNDGKPWCGTTADYD TDRKYGFCPSENLYTEHGNGDGKPCVFPFIFEGHSYSACTTKGRSDGYRWCATTANYDQDKLYGFCPTRADVTVTGGNSAGEMCVF PFVFLGKQYSTCTGEGRSDGRLWCATTSNFDADKKWGFCPDQGYSLFLVAAHEFGHALGLDHSSVPEALMYPMYHYHEDSPLHEDDI KGIQHLYGRGSKPDPRPPATTAAEPQPTAPPTMCPTAPPMAYPTGGPTVAPTGAPSPGPTGPPTAGPSEAPTESSTPVDNPCNVDVFD AIADIQGALHFFKDGRYWKFSNHGGSQLQGPFLIARTWPALPAKLNSAFEDPQSKKIFFFSGRKMWVYTGQTVLGPRSLDKLGLGSEVT LVTGLLPRRGGKALLISRERIWKFDL KSQKVDPQSVTRLDNEFSGVPWNSHNVFHYQDKAYFCHDKYFWRVSFHNRVNQVDHVAYVTYDLLQCP >gi|467621|emb|CAA55127.1| matrix metalloproteinase 9 [Bos taurus] MSPLQPLVLALLVLACCSAVPRRRQPTVVVFPGEPRTNLTNRQLAEEYLYRYGYTPGAELSEDGQSLQRALLRFQRRLSLPETGELDST TLNAMRAPRCGVPDVGRFQTFEGELKWHHHNITYWIQNYSEDLPRAVIDDAFARAFALWSAVTPLTFTRVYGPEADIVIQFGVREHGDG YPFDGKNGLLAHAFPPGKGIQGDAHFDDEELWSLGKGVVIPTYFGNAKGAACHFPFTFEGRSYSACTTDGRSDDMLWCSTTADYDAD RQFGFCPSERLYTQDGNADGKPCVFPFTFQGRTYSACTSDGRSDGYRWCATTANYDQDKLYGFCPTRVDATVTGGNAAGELCVFPF TFLGKEYSACTREGRNDGHLWCATTSNFDKDKKWGFCPDQGYSLFLVAAHEFGHALGLDHTSVPEALMYPMYRFTEEHPLHRDDVQ GIQHLYGPRPEPEPRPPTTTTTTTTEPQPTAPPTVCVTGPPTARPSEGPTTGPTGPPAAGPTGPPTAGPSAAPTESPDPAEDVCNVDIF DAIAEIRNRLHFFKAGKYWRLSEGGGRRVQGPFLVKSKWPALPRKLDSAFEDPLTKKIFFFSGRQVWVYTGASLLGPRRLDKLGLGPEV AQVTGALPRPEGKVLLFSGQSFWRFDVKTQKVDPQSVTPVDQMFPGVPISTHDIFQYQEKAYFCQDHFYWRVSSQNEVNQVDYVGYV TFDLLKCPED

生物信息学分析工具的操作指南与使用技巧

生物信息学分析工具的操作指南与使用技巧

生物信息学分析工具的操作指南与使用技巧近年来,随着生物学研究的向深度学习和大数据方向转变,生物信息学分析工具越来越重要。

这些工具能够处理和解读庞大的生物信息数据,从而提供对基因、蛋白质和其他生物分子功能的深入了解。

为了帮助研究者更好地应用这些工具,本文将提供生物信息学分析工具的操作指南与使用技巧。

一、 BLASTBLAST(Basic Local Alignment Search Tool)是最常用的生物信息学工具之一,用于比对基因或蛋白质序列并寻找相似性。

以下是使用BLAST的操作指南:1. 登录NCBI(National Center for Biotechnology Information)网站,选择"BLAST"选项卡。

2. 选择合适的BLAST程序,如nucleotide BLAST(用于比对核苷酸序列)或protein BLAST(用于比对蛋白质序列)。

3. 输入待比对的序列或上传序列文件。

4. 选择适当的数据库进行比对。

例如,对于人类基因,可以选择"Human genome"数据库。

5. 调整BLAST参数,如期望阈值(E-value)和比对长度,以优化结果。

6. 提交任务并等待结果。

BLAST将返回比对结果和相似性分数。

使用技巧:- 选择正确的数据库,以确保比对结果具有生物学相关性。

- 调整参数以满足特定的研究需求,如提高灵敏度或选择严格的相似性阈值。

- 分析比对结果时,关注较高的BLAST分数和较低的E-value,以确定最相关的序列。

二、DNA序列编辑器DNA序列编辑器是生物信息学研究中常用的工具,用于编辑、操作和分析DNA序列。

以下是使用DNA序列编辑器的操作指南:1. 下载和安装合适的DNA序列编辑器,如ApE(A plasmid Editor)或SnapGene。

2. 打开编辑器并创建新项目。

3. 在序列窗口中输入或粘贴DNA序列。

BioEdit(一)多序列比对

BioEdit(一)多序列比对

BioEdit(一)多序列比对BioEdit是一个免费的序列编辑器与分析工具软件,功能包括:序列编辑、外挂分析程序、RNA分析、寻找特征序列、支持超过20000个序列的多序列文件、基本序列处理功能、质粒图绘制等等。

在我们日常克隆基因,
测序完成后经常会用的的一款本地多序列比对软件
能够帮助我们直观的看出克隆的基因是否存在SNP位点不同家族基因(核算序列、蛋白序列)相似度
下面我们看一下,多序列比对功能
File-New Alignment-Import-Sequence alignment file
文件类型:选择“All File”
打开你想要进行比对的序列(一般为Fasta格式)点击打开,文件里面的序列就会自动导入
在最左边方框中双击序列名称
就可以直接命名
如果我们这个时候有新的序列想直接插入
点击Sequence-New sequence
将序列粘贴到下面大方框中
注意一定要选择“Sequence type”
点击Apply and Close,序列就会添加到比对界面
Ctrl+A可以将所有序列一键选中
Ctrl+左键,可以选择自己想比对的序列
最后依次点击
Accessory Application-Cluster W Multiple Alignment-Run Cluster W
为了我们方便我们快速寻找差异位点
点击方框所示,可以把相同的设置成“….”。

bioedit-phylip操作流程

bioedit-phylip操作流程

一.建系统发育树Bioedit1.将要比对序列(FASTA格式)放在一个文本文档中,命名XX.txt1.打开bioedit,点击(new Alignment)2.在File中找到import,点击,选择sequence alignment file。

“文件类型”选txt, rtf,将序列文件导入。

得:3.在中选择clustalw multiple alignment,点击点击Run Clustalw→OK 得:4.在mode中选择edit,对序列进行“掐头去尾”保存为xx.phy格式。

5.点击6.然后:可得:结果如下图所示:此即最终的系统进化树。

但还需对该树进行评价,这得用phylip 中的bootstrap(自展支持率:进化树可信度评估。

可信度一般超过66即认为可信,当然,如果是要判断二者是同一种,必须达到95以上,66-95只能说是一个亚种或者变种。

这个节点数不是同源性,注意了,是同源性可信度。

引导程序、辅助程序)进行。

来验证每个分支的支持率,可将支持率通过photoshop 软件添加到每个节点上。

二.系统树的评价Phylip[S(phy-outfile-1)→D(1-outfile-2)→N(2-outtree-3)→C(3-outtree)]1.将xx.phy复制到Phylip目录中exe文件夹中。

2.打开exe文件夹中seqboot,手动输入xx.phy→按回车键→再输入Y →回车→ 7(奇数均可)→回车→回车。

会在exe文件夹中生成outfile。

3.将outfile改为1,打开软件dnadist.exe,并将文件1 输入→回车→输入M→回车→D→回车→100→回车。

(将Analyze multiple data sets 项改为100,其余不变)。

输入Y →回车→ 7(奇数均可)→回车→回车。

会在exe文件夹中生成outfile。

4.生成一个outfile 文件,将其它改为2。

打开软件neighbor.exe,将刚才形成的文件2 输入:并将Analyze multiple data sets 项改为100,其余不变。

BioEdit

BioEdit

关于BioEdit介绍BioEdit版本5.0.6版权©1997-2001汤姆霍尔当前版本制作于2001.12.2BioEdit是一个生物序列编辑器可在Windows 95/98/NT/2000中运行它的基本功能是提供蛋白质核酸序列的编辑排列处理和分析 1.0α版本是最早的未完成的并有瑕疵的版本 1.0α版本也一直未完成并有很多问题但是比较前一个还是增加了一点东西修正了一些问题在2.0版本中在增加和配置附加分析应用程序上增加了一个界面使其能通过BioEdit得到一个图形界面而且还增加了位置排列的信息基础动态描影版本3中增加了疏水亲水面互交的2-D浮雕数据绘图和一些更多的序列操作法版本4为绘制和注解质粒载体增加了一个图形界面在4.7.1版本中修改了处理序列信息和存储方法而且增加了一个二进制文件格式允许快速保存和打开大的排列序列容量增加到20,000在版本5中增加了自动注解序列或手动使用所有的标准Genbank功能部件定义而且在Isis Pharmaceuticals公司的请求下增加了序列排序和分型组控制注解行以及残基和非残基字符的鉴别BioEdit并不打算成为一个强序列分析程序但是打算成为一个序列分析的友好用户界面并连接其他在局域网和万维网上的更多的序列分析程序它现在使用于大的排列>2000序列文件界面最初模仿于一个非常好的程序――Don Gilbert 编写的SeqApp and SeqPup印地安那州大学免费提供SeqApp (用于个人计算机) and SeqPup (用于交换平台)地址是ftp:///molbio/seqpup/GeneDoc是一个特别的排列程序能够自由的在Windows 9x 和NT上使用也是一个非常专业的程序有很好的蛋白质排列注解和分析描影和结构定义功能部件就象一个反映排列的内在的进化树而这些在BioEdit中是没有的GeneDoc的网址是/biomed/genedocGeneDoc有比BioEdit更好的描影和分类选项有助于手工排列序列还有更好的图形处理缠绕和伸展的排列视图选项动态共有序列和更平滑和更快速的排列卷曲和刷新BioEdit是用Borland's C++ Builder编写的C++程序我是北卡罗来纳州大学微生物系的研究生不是专业的程序员这是我学习C++语言的入门必然是个非专业的设计这不是我博士工作的一部分这个程序非常小而且很有效率BioEdit为序列排列输出和一些分析提供容易的工具BioEdit功能BioEdit的主要目的是为那些不愿意被迫详细了解一个程序的使用方法的生物学家提供一个有用的工具BioEdit是直观的菜单式的并有大量的图示提供用户一个外部分析程序的图形界面主要功能是提供明显的容易使用的菜单选项5.0.6版本提供以下功能用于序列处理和编辑的简单的图形界面使用编辑选项包括残基的select and drag选择和拖动和grab and drag抓取和拖动变量选择选项鼠标点击插入和删除缺口全框选择全屏编辑中剪切复制和粘贴编辑窗口的自动刷新固定序列框保护排列中的固定残基使用各种功能部件内含子外显子促进子CDS和所有标准GenBank功能部件类型自动的和手动的注解序列使用一个模板序列自动注解同一排列中的其他序列序列分组分为各个颜色编码家族为同步手动排列锁定组成员用户定义的适当功能部件能够设定考虑任何功能部件就像用于类似性描影序列同一性矩阵和保存图表视图的核酸或氨基酸序列中的相关碱基用户定义的基序搜索使用标准的Prosite命名法和IUPAC功能部件允许搜索核酸或氨基酸序列还有精确的文本搜索包括或忽略缺口程序行可以定义为DNA RNA核酸蛋白质未定义或注解注解可以用于保存普通的注释或东西就象二级结构模糊定义但是不能保存计算根本的多基因树图阅读器支持节点翻转和打印链接多基因树图到排列并保存到BioEdit格式排列文件在一个排列末端添加另一个排列配置附件应用程序界面进入一个有BioEdit产生的图形界面的外部分析程序在外部应用程序中自动提供信息和找回文件外部应用程序进入分开的调度单位允许同步应用BioEdit外部程序的输出文件可以自动被其他程序打开在ABI自动序列模型3773733700中显示打印和编辑ABI痕迹文件在版本2和3中有SCF文件就象用Licor序列输出文件RNA比较分析工具包括共变可能配对和互交信息分析使用鼠标指示的动态数据视图的互交信息输出2D矩阵图表关于互交信息矩阵行和框的互交式的1D图表用BioEdit或GanBank格式保存序列注解信息通过氨基酸翻译排列蛋白质编码核酸序列在排列中搜索保存的残基寻找好的PCR目标或帮助定义基序在核酸或蛋白质序列中搜索用户定义的基序或用通配符搜索精确的文本并选择包括或忽略缺口用支持最多20,000序列每个文档进行循环存储器分配最多可以成功测定四百六十万个碱基 E. coli基因组核糖体数据库中的原核细胞16SRNA排列29 Mb, 6205个序列将会被单独处理在配置为Pentium 233 Mhz80 Mb RAM的计算机中用BioEdit计划文件格式最多只需要10秒种可以写入一个16S RNA排列内部的读写GenBank Fasta Phylip和NBRF/PIR文件用Don Gilbert’s ReadSeq导入输出一些其他格式的文件使用BioEdit计划文件格式快速读写大排列文件使用自动更新的排列蛋白质全标题和GenBank区域信息进行ClustalW多序列排列Des Higgins et. al.编写的内部界面外部程序就象排列来自于核苷酸序列的蛋白质视图时的核苷酸编码序列将残基块状复制到剪贴板允许将全不排列或部分排列粘贴到文字处理器基本序列处理在文档之间复制粘贴序列翻译和还原编码RNAÆDNAÆRNA反转互补大写字母小写字母多文档界面最多同时打开20个文档但是在其他打开的窗口不能设置限制六框翻译核酸序列为Fasta格式ORF表用矢量图进行半自动质粒矢量绘图和注解自动酶切位点和位置标记自动多接头视图和用户控制绘图工具将质粒文件保存为可编辑的矢量图形文件如位图复制到其他图形程序并可以打印氨基酸和核苷酸成分摘要和图表Revert to Saved恢复保存和undo撤销功能编辑氨基酸和核酸序列简单的指定色彩表编辑蛋白质和核酸序列使用不同的色彩表排列易感的描影法以信息为根据其中包括排列位置BioEdit 能够读写GenBank, Fasta, NBRF/PIR, Phylip 3.2 和 Phylip 4格式能够读ClustalW 和 GCG格式.10个附加格式的导入输出过滤器使用Don Gilbert的ReadSeq导入/添加一个文件到最后的另一个文件上(不考虑文件格式)基本的多文本编辑器限制性内切酶图谱用于任何或所有形式的翻译复酶和输出选项包括酶的提供者和环状DNA选项游览限制性内切酶创造商自动连接到你喜欢的网页游览器如Netscape或Internet Explorer程序和程序组的概述BioEdit是用Borland C++ Builder 3.0编写的(开始时是用C++ Builder 1.0)这是曾经是Borland公司的最新C++产品它结合了Borland C++ 5和Delphi的可视要素库VCL允许用户界面的可视开发使用快速申请开发RAD环境的好处在于它能够容易的创造出大量的图形界面它的缺点是编码不轻便BioEdit只能在Windows 95, 98, NT and 2000中使用我原来计划可以使BioEdit在Win16使用但是自从Windows 3.x过时了以后我就不再计划这样做了组织BioEdit当前支持同时编辑最多50个文件主要的控制形式包括打开文件的菜单创建新文档调整球形选项如色彩表密码子表分析参数选择和一个窗口管理器最初每个文档有它自己的整套处理菜单可以限制文档然而这被一个更传统的多文档界面所替代BioEdit没有使用额外的物理存储器除非编辑大的排列但是它看起来像占用了很多资源BioEdit每个文档最多可以有20,000个序列但在序列大小上没有限制在80MbRAM的233MHz的个人计算机上可以很好的处理一个来自于核糖体数据库的完整的原核16S rRNA排列6205个序列每一个有3319个字符一旦用BioEdit格式保存这个文件可以在几秒钟打开用GenBank格式要几分钟才能打开程序文件(BioEdit.exe)可以在主安装目录中找到可能还有以下子目录apps附件程序网页和网页书签通常以下文件会出现在apps文件夹按名称排列accApp.ini (在首次安装时为accApp.def)Bblast.htmlBioEdit.htmlblast_adv.gifblast_form_0.gifblastall.exe (在没有BLAST的版本中不出现)blastcl3.exe (在没有BLAST的版本中不出现) blast.txtbookmark.txtcap.doccap.execlear_inp.gifclustalw.execlustalw.txtcutter.htmlDnadist.docDnadist.exeDnamlk.docDnamlk.exeDos4gw.exe (PHYLIP 程序需要)Expasy.giffastDNAml.docfastdnaml.exeFitch.docFitch.exeformatdb.exe (在没有BLAST的版本中不出现) IdPlot.exeisrecsmall.gifKitsch.docKitsch.exemod_ad.gifmod_submit.gifnnpredict.htmlNote.gifPFSCAN_form.htmlphi_blast.gifPHIBlast.htmlPhylip.mapProtdist.docProtdist.exeProtpars.docProtpars.exepsi_blast.gifPSIBlast.htmlReadseq.exeReadSeq.txtscnpsit1.htmlSiblogo.gifsmweb.gifdatabase (是局部的BLAST数据库安装的版本必须有BLAST工具).BioEdit (全版本) 有以下文件在database文件夹Ecoli.phrEcoli.pinEcoli.psqEcoli_ORFs.txt (E. coli 开放读码框架的文本文件).helptBioEdit.GID (不是安装来的出现在帮助文件第一次使用后)Bioedit.hlptablesBlosum62codon.tabcolor.tabdayhoffdefcolor.tabenzyme.tabGc.valgonnetIdentifymatchPam120Pam250Pam40Pam80Seqcode.val安装文件夹通常包括以下文件_deisreg.isr (安装相关文件)_isreg32.dll (安装相关文件)BioEdit.exe (BioEdit 执行文件)DeIsL1.isu (安装相关文件)RNaseP_prot.gb (蛋白质排列示例)RNaseP_prot_genes.gb (DNA排列示例)RNaseP_RNA.gb (RNA排列示例)PBSSK_plus.pmd (质粒绘图示例)bacterio.gb (附带GenBank 信息的蛋白质排列示例)bacterio.bio (附带GenBank信息图式注解记号标记和序列族的BioEdit文件示例) YopD.gb (附带GenBank信息的另一个示例文件)TreeView.zip (Roderic D.M. Page编写的极好的系统进化树阅读器完全安装才有) TreeView.txt (记录TreeView的安装信息和配置BioEdit与tree-generating附件的连接)license.txt (BioEdit 许可证协议)ReadMe.txt (总说明)重要的是文件夹和文件的名字不能更改如果更改了BioEdit将不能正确安装将会有一个BioEdit.ini文件出现在你的Windows主目录下它包含BioEdit的初始化默认值和参数选择虽然这个文件可以手动编辑但是我们推荐不要编辑和手动编辑这个文件当前被支持功能部件和已知问题的列表请看BioEdit的功能和已知问题局限性已知问题和局限性BioEdit想要成为一个处理个别简单序列的多用途界面带有适合于自动化多重排列选项的综合序列排列最佳成对排列并且着重于使手工排列更容易随着时间的推移增加了一些附件的功能质粒绘图限制性内切酶图谱ABI和SCF查阅RNA比较分析和其他功能中的图式注解然而常用的查找功能特殊化分析如蛋白质二级结构三级结构的预测RNA结构的热动力学预测排列性质的统计学分析序列模式的概率或神经网络模型排列和结构的预测不包括在这个程序之内虽然用户可以配置命令行附件应用软件有程序链接连到ClustalW局域BLAST和BLAST client 3但是在ClustalW程序或BLAST程序升级后不能保证这些链接正确工作虽然在BioEdit安装程序中提供的局域BLAST和Clustal程序将会继续工作但在下一次NCBI决定改变它的委托人时BLAST client 3将不能正常工作我也不再一直支持这个程序源代码将在稍后提供下载但是会有一些紊乱没有很好注释限制于Borland C++ Builder这是我毫无疑惑的发布源代码的原因同样自动网页链接为网页如BLAST PSI-BLAST PROSITE轮廓扫描网页提供一个选择序列它们的工作依赖于网页的局域HTML模板BioEdit编辑的资源包括查询文本区域的选择序列因为万维网的高度易变性这些也许不能长时间正常工作如果一些地址变化或者HTML界面充分改变这些将不再能正确工作它们可能可以在BioEdit/apps文件夹中局部的被新的同名更新网页所替代但是它们是否能正常工作将依赖于网页中必需的URL定位是否被指定为绝对路径或相对路径它们是否依赖于局域CGI或Java程序和其他潜在的问题想要配置命名行分析程序的界面很好的工作可能不需要复杂的scripting语言然而因为这个界面及其选项的静态特点可能有程序不能正确的通过BioEdit运行虽然绝大多数接受命令行的程序可以被设置总之许多人可能宁愿为了更好的控制选项而从命令行运行程序BioEidt可以很好显示合适大小的排列然而对于一次打开的排列文档数量有限制同样一个单一排列中的序列数量也有限制现在最多一次打开50个排列文档一个排列中的最多序列数是20,000序列数量的限制和序列长度是无关的排列的绝对大小是有效的系统内存决定的如果文档在系统中全部进入虚拟内存编辑将会变得很慢如果排列中有几千个rRNA基因或者全部基因组的序列列表在Win95/98或NT系统中至少需要64到128Mb的内存在Win2000系统中至少需要128Mb内存在排列矩阵N× M > 40,000,000 (N = 序列数M=最长序列长度)时Undo撤消选项自动失效BioEdit是由Borland C++ Builder编写的是100% Windows基础它是不可移植的因为这个程序的大部分是图形界面在UNIX或Mac中可能不好使用BioEdit使用手册序列编辑处理手工序列排列下面是基本的BioEdit排列文档窗口如果你不喜欢现在的样子不要当心字体大小背景颜色残基颜色和标题窗口宽度都可以改变鼠标箭头右下方的黄色条幅显示的是当前序列的绝对位置这同样显示在控制栏的Position标题选择关闭黄色条幅就进入View->show sequence position by mouse arrow总的手工排序功能是在编辑窗口有三个可应用的基本模式选项可在Sequence->Edit Mode中找到Select / Slide mode(选择/调整模式)用鼠标左键选择框住的残基用鼠标来回的拖动选择默认值是朝你滑动的方向忽略unlocked gaps并在所选择的另一边开启新的unlockedgaps为了移动所选择的全部序列的下游不管缺口在移动时按住shift键你也可以在按钮板上切换合适的按钮见后改变默认值为移动所选择的全部序列的下游选定选项后在滑动时用shift键忽略unlocked gaps用shift键选择所有在现在选定的和新选择的残基CTRL键可以在当前选择上增加一个新的选择例如你也许想在三个互不相连的序列中选择残基Edit mode编辑模式在编辑残基模式中你可以在文档的任何位置除了标题放置任何类型的光标用箭头你可以在序列中走来走去编辑有两种形式插入和改写当编辑器在编辑模式可以看见在编辑模式的下拉菜单中有一个选项在其它两个排列模式,这个选项不会出现.Grab & Drag mode(抓取/拖动模式)从mode目录中选择Grab & Drag或者切换G/D按钮见后你可以从屏幕上动态的抓取和拖动单个残基用shift键移动整个残基序列的下游或者在按钮板上切换成合适的按钮――见后Grouping of sequences序列分组Sequences may be grouped into groups (or"families").序列可以进行分组或分成家族一个组的序列排列可以相互锁定意味着手动调节用可调整的残基插入或和删除缺口将自动同步调节一个锁定的组This only applies to sliding resides (Select / slide mode or Grab & Drag mode), not to single insertions and deletions of gaps with right mouse clicks. For information on grouping sequences and locking the alignment of groups of sequences, see grouping sequences.这只适合于可调整的残基Select / slide mode或Grab & Drag mode不能用鼠标右键进行单个缺口的插入和删除想了解有关序列分组和其排列锁定的信息看grouping sequences工具条 / 加速按钮锁定和开启全部序列的所有缺口当打开一个排列这个按钮是在开启状态但是缺口是现在的虽然它们过去被保存在这个按钮被按下去后才能进行改变为了开启当前序列的所有缺口你必须按这个按钮两次进行切换到这个状态第一状态是锁定所有缺口上个按钮的锁定状态按下这个按钮可以用鼠标右键插入单个缺口用鼠标右键删除缺口在所有序列中插入缺口除了在用鼠标右键点击这个按钮的位置在所有序列中插入缺口除了在用鼠标右键点击这个按钮的位置在选择位置没有缺口的序列将不会改变但是有这个按钮在那儿缺口将始终被删除转换鼠标左键和右键的默认值功能切换Grab & Drag模式按下这个按钮可调整残基的默认值是忽略或扩展到下游缺口使用shift键可以调整转换这个功能按下这个按钮可调整残基的默认值是移动全部所选序列的下游胜过忽略或扩展到下游缺口使用shift键可以调整转换这个功能普通视图模式当序列颜色显示时残基根据当前的色彩表着色这个选项用于序列是单色视图时所有其他视图覆盖单色视图反转颜色视图模式背景栏根据每一个残基的色彩表描影残基的颜色是它们普通颜色的反转排列的强度――残基根据每一栏的信息内容灰度描影残基背景根据每一栏的信息内容描影把文档窗口中一致的和类似的残基描影按下这个按钮控制条上将会出现一个下拉菜单可以控制隐藏的百分比开端蛋白质排列的类似性隐藏的矩阵文件可以在Alignment->Similarity Matrix菜单中详细说明绘出功能部件其上有层次的序列只绘出功能部件没有序列根据当前的色彩表序列彩色视图根据当前选择的序列颜色序列单色视图只用于normal view按钮也被按下用一个字符默认值是.显示序列的同一性默认值是top.如果按下前一个按钮这个下拉菜单能够选择标记同一性的字符显示或隐藏交互信息检查器只用于RNA分析引出色彩表编辑对话窗切换ignore anchor points模式如果这个按钮没有按下固定栏限制排列的范围按下这个按钮固定栏被忽视卷屏速度控制器控制水平卷屏条卷屏是因残基增加增加或移去位置标记旗增加或移去一个栏的固定点在编辑盒中编辑在一个文本窗口中进行一个序列主要的编辑会十分方便为一个序列开启一个编辑窗口双击序列的标题或选中序列并从Sequence菜单中选择Edit Sequence为了使改变生效必须按下Apply或Apply and Close按钮取消将不会改变序列在一个序列第一次编辑时将会出现下面的窗口在Sequence Type下拉菜单中下列选项是可用的如果一个序列是未知的蛋白质色彩表通常是彩色的就像一个已经经过类似性底纹处理的蛋白质序列可以保留一个关于排列的每一行的屏幕信息的注解但是不能计算类似性和同一性不服从标准的处理如翻译互补自动排列等在单个序列编辑器中你可以用lock sequence选项选择锁定任何序列应用这个选项时selecting/dragging或抓取和拖动将不能使用但是用鼠标右键增加或删除缺口始终可以使用按下按钮可以展开窗口看相关的GenBank的信息窗口扩展如下按钮可以用于提出在大的编辑窗口中的相关领域**注意GenBank信息将只能用GenBank或BioEdit格式保存***注意GenBank信息包括功能部件领域是内部独立于用户定义的图示注解窗口隐藏一个文档可以进行窗口隐藏就是双击窗口的标题栏可以隐藏标题栏再次双击可以使其变回原来的大小它也可以最小化和最大化增加一个新序列通过以下方式增加新序列1.在Sequence菜单下选择New Sequence选项序列可以像原始文本一样被键入或复制进序列窗口按下Apply按钮可以在文档中增加序列2.通过Edit菜单的Copy Sequence(s)和Paste Sequence(s)命令复制或粘贴来自其他BioEdit文档的序列同样也可以使用当前菜单快捷键(默认值Ctrl+F8复制Ctrl+F9粘贴)全屏编辑序列可以在全屏编辑就像在一个文字处理器上一样必须首先设定Mode选项为Edit Residues(BioEdit在安装后默认模式为Slide Residue)在编辑模式下你可以使用箭头在屏幕上移动输入像在文本编辑器中一样编辑有两种选项插入模式和改写模式它们类似于在文字编辑器中的功能选择序列点击序列的标题可以选中序列拖划出一个方框可以选中多个序列或用shift键选择两个选择序列之间的所有序列用Ctrl键加鼠标可以分别选择标题或给选中的序列加上详细的标题双击标题将会打开一个单序列编辑器再次点击原先选中的标题使其进入全屏编辑模式你可以编辑标题后按下< return >或点击序列标题板的任何位置使对标题的改动生效移动序列想移动一个序列(或一些序列)选中它(用鼠标左键点击它的标题使其变亮)把它拖放到你想要的位置Cut Copy Paste剪切复制粘贴Copy复制编辑窗口的文本(序列残基)用鼠标选择文本并从Edit菜单选择Copy不像文字编辑器你可以复制你想选择的区域而不是复制文本的全部行这种方式复制的区域可以粘贴在任何能够进行文本编辑的程序中如果只是如果你没有选中在全部序列中任何残基序列的标题将会以BioEdit序列结构形式复制到BioEdit的剪贴板在选择Paste Sequence(s)时全部序列将会被粘贴到文档全部序列用鼠标选择序列标题并从Edit菜单选择Copy Sequence(s)标题被选中的序列将以Fasta格式被复制到Windows剪贴板多于一个被选中的序列将以Fasta序列目录的形式复制到剪贴板中并在BioEdit内部复制成一组全部BioEdit序列结构能够被粘贴在任何BioEdit文档中注意BioEdit剪贴板中包括所有序列相关数据Genbank信息图示注解是在BioEdit 同一步骤的内部它们不能在独立的步骤之间转移为了在BioEdit排列文档之间复制序列必须确定两个文档是在程序的同一步骤打开的只有Fasta格式的序列可以被复制到普通的Windows剪贴板Paste粘贴在编辑窗中的文本为了把一个序列粘贴入主编辑窗界面必须是Edit Residues模式见全屏编辑如果文本的一个区域被粘贴到一个序列只有第一行用回车键定义将会被粘贴这避免了在粘贴文本进入序列时可能出现的问题也避免了不注意的使错误的序列在其下为了把文本的片段粘贴到排列的一个区域片段必须一次一个的粘贴进序列如果文档在Slide Residues或Grab and Drag模式Paste粘贴的功能将会和Paste Sequence(s)粘贴序列的功能一样见后全部序列从文档菜单到粘贴序列从Edit菜单中选择Paste Sequence(s)序列将会增加到文档的最后它们可以移动到文档的任何位置Cut剪切和Cut Sequence(s)剪切序列就象Copy复制和CopySequences复制序列一样但是其功能是从文档中删除复制的信息然而只有在Edit Residues模式下残基才能从文档中删除同样当在没有选中任何残基的情况下使用剪切功能时标题被选中的序列将以Fasta格式被复制到Windows剪贴板并以序列结构的形式复制到BioEdit剪贴板中但是它们不能从文档中删除为了适当的从文档中剪切序列可以选择Cut Sequence(s)Minimizing an Alignment排列的最小化当一个排列手工处理时当序列定期的增加并手工排列到一个现有的排列中缺口经常导致一个专栏出现在每一个序列中为了在不改变现有排列的情况下移动缺口选择Minimize AlignmentBasic Manipulations / Sequence Menu基本处理序列菜单一些简单的序列处理可以通过BioEdit的一个菜单选项自动完成这些选项在Sequence中在BioEdit中Masks屏蔽在这一点上有一点薄弱主要用于RNA比较分析功能关于在BioEdit中如果使用屏蔽看Masks锁定和开启缺口当残基在序列中滑动时一个锁定的缺口将不能被压缩为了锁定缺口选择想要锁定的缺口后选择Lock Gaps想要锁定序列中的所有缺口选择序列的标题后选择Lock Gaps想要锁定一个排列中的缺口切换lock/unlock按钮进入锁定状态开启的缺口就是锁定状态的相反想要开启一个排列中的所有缺口切换lock/unlock按钮进入开启状态Degap选项可以移动所有开启的缺口它也可以移动被选中标题的序列中的所有开启的缺口注意和.表示开启的缺口表示锁定的缺口这个惯例用于BioEdit中每一个窗口和功能如果一个句点没有经过BioEdit加上的缺口特点但也有一种加工过的缺口类型为了程序的可计算性宁愿使用BioEdit中的缺口特点同样一些程序可能使用一个句点去表示排列位置中没有残基或缺口但是只是在序列的开始或结尾BioEdit不直接注意这种差别序列行之前或之后的位置被加工成缺口而且BioEdit假定每一个排列包含有真正的同源序列尽管BioEdit也被设计成允许用户忽视程序的排列中心并只使用它处理序列的数据Sequence Menu序列菜单(不包括mask功能)New Sequence新序列创造新序列开启一个单一序列编辑器Edit Sequence编辑序列在单一序列编辑器中开启首次选择的序列Select Positions选择位置开启一个对话框允许在所有选中的序列中选择具体位置Open at cursor position在光标处打开如果文档处于编辑状态光标同时出现这个选项将在单一序列编辑器中打开光标当前所在位置的序列Rename重命名根据子菜单选项重命名序列标题Edit title改变屏幕上序列的标题with LOCUS把所有选中的标题改为LOCUS栏内容。

BioEdit

BioEdit

NBRF/PIR 格式
Phylip
Task1: 输入BCL2
登陆到GeneBank网站,搜索下载如下6个物种BCL2 protein,存成 *.gb文件。
[Bos taurus] [Mus musculus] [Rattus norvegicus] [Epinephelus coioides] [Felis catus] [Danio rerio]
Task1: 结果
序列编辑
操作主要在Edit菜单,但也有些快捷键
编辑模式
Sequence菜单里也有部分序列编辑选项,如
双序列比对
首先,选定待比对的两序列
其次,到Sequence->Similarity Matrix内选定打分矩阵
最后,到Sequence->Pairwise alignment里选择比对算 法。
结果
结果图形显示
以比对结果为活动框,打开File->Graph view,可进行更 精细人性化的显示。
Task 2: 序列编辑和比对
1. 对导入的BCL2序列尝试进行插入gap和删除gap,大小 写转换,序列彩色显示;
2. 任选两条BCL2蛋白序列,选择打分矩阵,进行双序列比 对;
3. 用graph view显示比对结果,并尝试对界面中的显示选 项做改变处理;
质粒图
质粒图:
编辑、修改和标识质粒序列; 编辑限定性定性内切酶标识的质粒图;
外挂程序
安装目录bioedit/apps/下
序列编辑比对
BCL2家族蛋白为例:
序列输入 序列编辑 序列比对 比对结果显示 其它
序列输入
手动输入 文件输入 剪切板输入 网络获取

BioEdit及MEGA分析序列同源性简介

BioEdit及MEGA分析序列同源性简介

利用系统进化分析软件对序列进行同源性分析1.0目的1.1为了保持国际上各个耐药性实验室的高检验水准,进行分子进化分析是有很重要作用的。

它不仅可以保证流行病学目的顺利实现,而且有利于发现检测阶段可能产生的潜在的交叉污染。

1.2利用此软件进行分析所得的信息对于进行艾滋病毒在人群中传播的流行病学研究具有十分重要的意义。

1.3通过对实验室之前分析的数据与当前数据进行比较,可以发现在此前实验过程中由于标本处理不当所导致的潜在的实验室污染。

1.4对于确保得到高质量的实验结果并及时发现可能出现在实验室里的问题具有重要意义。

2.0仪器设备2.1计算机一台。

2.2Windows 95以上的操作系统。

2.3BioEdit 以及MEGA 4 分析软件。

2.3.1均为免费软件,可以从互联网上下载,在计算机上进行安装。

3.0操作过程3.1局限及要求3.1.1经过序列编辑软件拼接处理后的txt文件或fasta文件均可,例如ChromasPro软件。

3.1.2可以在MEGA上分析的分子序列或距离矩阵数据。

3.1.3Mega 4软件只能将长度相等的序列转换为MEGA输出文件,因此,任何多序列文件必须通过BioEdit软件进行对齐修剪,然后才能进入通过Mega软件转换成*.meg格式进行分析。

3.1.4该数据集的大小受限于计算机上可用的物理(RAM)和虚拟内存。

3.1.5分析的序列必须包括两个或两个以上长度相同的序列,所有序列分析之前必须用MEGA软件对齐。

3.1.6核苷酸和氨基酸序列应该用英文字母连续书写,不区分大小写。

一些特殊的特殊符号,例如表示对齐缺口,碱基缺失等的符号也可以包含在序列中。

3.1.7空格和制表符经常用于数据文件中,因此会被MEGA忽略。

ASCII字符,如(.)(- )(?),一般都作为特殊符号来表示序列中的不同碱基,分别表示第一个序列,对齐缺口及碱基缺失。

3.1.8BioEdit 软件进行序列比对3.1.9双击BioEdit图标打开BioEdit 序列对比编辑器窗口。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档