本地blast的详细用法∷柳城
BLAST使用方法
BLAST使用方法
BLAST(Basic Local Alignment Search Tool)是一种用于比较生物
学序列的工具,可以在数据库中查找类似序列,并计算它们之间的相似度。BLAST可用于寻找相似的基因、蛋白质序列、DNA序列等,以及用于确定
序列的功能和进化关系。本文将介绍BLAST的使用方法。
2. 准备序列:在使用BLAST之前,你需要准备你想要比较的序列。
可以是DNA序列、蛋白质序列或其他生物学序列。可以从公共数据库如NCBI的GenBank中获取序列,也可以使用你自己的实验数据。
3.选择数据库:BLAST使用数据库来存储和检索序列。常见的数据库
包括NCBI的NT数据库(核苷酸数据库),NR数据库(非冗余蛋白质数
据库)等。根据你的研究需要,选择适合你的数据库。你也可以建立自己
的数据库,将实验室内部的数据添加到其中。
4.运行BLAST:使用BLAST的命令行接口或网页界面,输入你的序列
和数据库信息,运行BLAST。下面是使用命令行接口运行BLAST的示例:`$ blastn -query sequence.fasta -db nt -out result.txt`
在这个命令中,`blastn`是BLAST程序的名称,`sequence.fasta`是
包含你的序列的FASTA文件,`nt`是数据库的名称,`result.txt`是结果
输出的文件。
如果使用网页版BLAST,你只需将序列和数据库信息输入网页表单,
点击运行即可。
5.解析结果:BLAST运行完成后,会生成一个结果文件,其中包含比
Blast使用方法攻略
Blast使⽤⽅法攻略
结果12列
Query id,Subject id,% identity,alignment length,mismatches,gap openings,q. start,q. end,s. start,s. end,e-value,bit score
Blast,全称Basic Local Alignment Search Tool,即"基于局部⽐对算法的搜索⼯具",由Altschul等⼈于1990年发布。Blast能够实现⽐较两段核酸或者蛋⽩序列之间的同源性的功能,它能够快速的找到两段序列之间的同源序列并对⽐对区域进⾏打分以确定同源性的⾼低。
Blast的运⾏⽅式是先⽤⽬标序列建数据库(这种数据库称为database,⾥⾯的每⼀条序列称为subject),然后⽤待查的序列(称为 query)在database中搜索,每⼀条query与database中的每⼀条subject都要进⾏双序列⽐对,从⽽得出全部⽐对结果。
Blast是⼀个集成的程序包,通过调⽤不同的⽐对模块,blast实现了五种可能的序列⽐对⽅式:
blastp:蛋⽩序列与蛋⽩库做⽐对,直接⽐对蛋⽩序列的同源性。
blastx:核酸序列对蛋⽩库的⽐对,先将核酸序列翻译成蛋⽩序列(根据相位可以翻译为6种可能的蛋⽩序列),然后再与蛋⽩库做⽐对。
blastn:核酸序列对核酸库的⽐对,直接⽐较核酸序列的同源性。
tblastn:蛋⽩序列对核酸库的⽐对,将库中的核酸翻译成蛋⽩序列,然后进⾏⽐对。
tblastx:核酸序列对核酸库在蛋⽩级别的⽐对,将库和待查序列都翻译成蛋⽩序列,然后对蛋⽩序列进⾏⽐对。
BLAST使用方法
BLAST使用方法
一、BLAST的安装和准备工作
2.获取待比对的序列文件,可以是FASTA格式的DNA或蛋白质序列。
二、BLAST的常用参数和选项
1. Program:指定使用哪种BLAST程序(如BLASTn、BLASTp等)。
2. Database:指定使用哪个数据库进行比对。
3. Query:指定待比对的序列文件。
4. E-value:期望值。一种描述比对结果误差率的指标,值越小表示
结果越可信。通常情况下,E-value小于0.01被认为是显著结果。
5. Word size:BLAST在比对时使用的核心词的长度。长度越大表示
查全率(sensitivity)越高,但速度会减慢。
6. Gap open:允许在比对过程中插入空位(如插入一个碱基)。Gap open参数定义了开放一个空位的惩罚分数。
7. Gap extension:允许空位的延伸。Gap extension参数定义了延
伸一个空位的惩罚分数。
三、使用BLAST进行比对
1.命令行方式:
-打开命令行界面,并定位到BLAST软件的安装目录。
- 输入命令,指定BLAST程序、数据库、查询文件和其他参数。例如:blastn -db nt -query query.fasta -out output.txt -evalue 0.01
-运行命令,BLAST将开始进行比对并生成结果文件。
2.网页方式(以NCBIBLAST为例):
- 打开NCBI网站的BLAST页面()。
-选择需要使用的BLAST程序(如BLASTn、BLASTp等)。
Blast使用教程详解
19
Blast任务提交表单(二)
2.设置各种参数部分
设置搜索的范围,entrez关键词, 或者选择特定物种
一些过滤选项,包括简 单重复序列,人类基因 组中的重复序列等
E值上限 窗口大小 如果你对blast的命令行选项熟悉的话,可以在这里加入更多的参数
20
Blast任务提交表单(三)
3.设置结果输出显示格式 E值范围 选择需要显示的选项 以及显示的文件格式 显示数目 Alignment的显 示方式
生物序列的相似性搜索
-blast简介及其应用
2005年3月
生物信息学常见的应用与软件
序列数据的保存格式与相关数据库资源 在数据库中进行序列相似性搜索
多序列比对
进化树构建与分子进化分析 Motif的寻找与序列的模式识别 RNA二级结构,蛋白质二、三级结构的预测 基因芯片的数据分析
2
内容提要
17
NCBI提供的Blast服务
登陆ncbi的 blast主页
核酸序列
蛋白序列
翻译序列
底下有其他一些针对 特殊数据库的和查看 以往的比对结果等
18
Blast任务提交表单(一)
1.序列信息部分
序列范围 (默认全部)
填入查询(query)的序列
选择搜索数据库 如果接受其他参数默认 设置,点击开始搜索
我们通过blast搜索来获取一些这个序列 的信息。
blast的用法总结大全
blast的用法总结大全
(学习版)
编制人:__________________
审核人:__________________
审批人:__________________
编制学校:__________________
编制时间:____年____月____日
序言
下载提示:该文档是本店铺精心编制而成的,希望大家下载后,能够帮助大家解决实际问题。文档下载后可定制修改,请根据实际需要进行调整和使用,谢谢!
并且,本店铺为大家提供各种类型的经典范文,如英语单词、英语语法、英语听力、英语知识点、语文知识点、文言文、数学公式、数学知识点、作文大全、其他资料等等,想了解不同范文格式和写法,敬请关注!
Download tips: This document is carefully compiled by this editor.
I hope that after you download it, it can help you solve practical problems. The document can be customized and modified after downloading, please adjust and use it according to actual needs, thank you!
In addition, this shop provides various types of classic sample essays, such as English words, English grammar, English listening, English knowledge points, Chinese knowledge points, classical Chinese, mathematical formulas, mathematics knowledge points, composition books, other materials, etc. Learn about the different formats and writing styles of sample essays, so stay tuned!
blast简介及其应用
分析过程
1.登陆NCBI的BLAST主页 http://www.ncbi.nlm.nih.gov/BLAST/
界面如图所示:
37
登陆BLAST主页
38
分析过程
2.根据序列的类型,选择合适的比对分析界面程序。本例中分析的是蛋白质序列,所以 单击选择Basic BLAST→Protein Blast项,进入蛋白质比对分析界面。如下图:
39
40
41
分析过程
3.填写表单信息 在网页的Enter accession number.gi.or FASTA sequence对话框中输入待查询序列, 下面Choose search set→database项中选Swissprot库(nr:NCBI所有翻译库,Ref seq:专家参照库,Swissprot:欧洲蛋白质专家库,pat:专利库,pdb:蛋白质三 维结构库),单击BLAST运行程序。
• 单机版 单机版的BLAST可以通过NCBI的ftp站点获得,
有适合不同平台的版本(包括linux,dos等)。 获得程序的同时必须获取相应的数据库才能在 本地进行BLAST分析。单机版的优点是可以处理 大批的数据,可以自己定义数据库,但是需要 耗费本地机的大量资源,此外操作也没有网络 版直观、方便,需要一定的计算机操作水平。
序列范围 (默认全部)
选择搜索数据库 填入查询(query)的序列
blast使用指南
blast使用指南
Blast使用指南
Blast(Basic Local Alignment Search Tool)是一种常用于生物信息学研究中的序列比对分析工具。它可以根据输入的查询序列,在数据库中搜索相似序列,并给出比对结果。本文将为大家提供一份Blast使用指南,帮助大家更好地使用Blast进行序列比对分析。
一、什么是Blast?
Blast是一种基于局部比对算法的工具,它可以在大规模的数据库中快速搜索相似的序列。通过比对查询序列和数据库中的序列,Blast 可以找到相似度较高的序列,从而推测它们之间的功能和结构的相似性。
二、Blast的使用步骤
1. 准备查询序列
在使用Blast之前,首先需要准备查询序列。查询序列可以是DNA 序列或蛋白质序列,可以通过实验测序或从已有的数据库中获取。确保查询序列的准确性和完整性非常重要,因为查询序列的质量将直接影响到Blast的结果。
2. 选择合适的Blast程序和数据库
Blast有多个版本和程序可供选择,根据具体的研究目的和需求,选择合适的Blast程序和数据库非常重要。常用的Blast程序包括Blastn(用于DNA序列比对)、Blastp(用于蛋白质序列比对)等。数据库则可以选择NCBI的nr数据库、UniProt数据库等。
3. 运行Blast程序
在选择好Blast程序和数据库后,可以通过命令行或图形界面来运行Blast程序。对于初学者来说,推荐使用图形界面,因为图形界面更直观、易于操作。在运行Blast程序时,需要输入查询序列文件和选择合适的参数设置,如比对算法、期望阈值、返回结果的数量等。
构建NCBI本地BLAST数据库(NRNT等)blastxdiamond使用方法blast。。。
构建NCBI本地BLAST数据库(NRNT等)blastxdiamond使⽤⽅法blast。。。:
如何下载 NCBI NR NT数据库?
下载blast:
先了解BLAST Databases:
如何下载NCBI blast数据库?
NCBI提供了⼀个⾮常智能化的脚本update_blastdb.pl来⾃动下载所有blast数据库。
脚本使⽤⽅法:
perl update_blastdb.pl nr
有哪些可供下载的blast数据库?
perl update_blastdb.pl --showall
该命令会显⽰所有可供下载的blast数据库,请⾃⾏选择:
16SMicrobial
cdd_delta
env_nr
env_nt
est
est_human
est_mouse
est_others
gss
gss_annot
htgs
human_genomic
landmark
nr
nt
other_genomic
pataa
patnt
pdbaa
pdbnt
ref_prok_rep_genomes
ref_viroids_rep_genomes
ref_viruses_rep_genomes
refseq_genomic
refseq_protein
refseq_rna
refseqgene
sts
swissprot
taxdb
tsa_nr
tsa_nt
vector
这⾥我选择的是nr数据库。
nohup perl update_blastdb.pl --decompress nr >out.log 2>&1 &
⾃动在后台下载,然后⾃动解压。(下载到⼀半断⽹了,在运⾏会接着下载,⽽不会覆盖已经下载好的⽂件)
Blast软件的详细使用方法
Blast软件的详细使用方法
blastall -p blastn -i myRNA.fasta -d humanRNA.fasta -o myresult.blastout -a 2 -F F -T T -e 1e-10
解释如下:
blastall: 这是本地化/命令行执行blast时的程序名字!(Tips:blastall直接回车就会给出你所有的参数帮助,但是英文的)
-p: p 是program的简写,program在计算机领域中是程序的意思。此参数是指定要使用何种子程序,所谓子程序,就是针对不同的需要,如核酸序列和核酸序列进行比对、蛋白质序列和蛋白质序列进行比对、假设翻译后核酸序列于蛋白质序列进行比对,选择相应的子程序: blastn 是用于核酸对核酸blastp 是蛋白质对蛋白质序列等等,一共5个自程序。
-i: i 是input的简写,意思是输入文件,就是你自己的要进行比对的序列文件(fasta格式)-d: d是database的简写,意思是要比对的目标数据库,在例子中就是humanRNA.fasta (别忘了要formatdb)
-o: o是output的简写,意思是结果文件名字,这个根据你自己的习惯起名字,可以带路径,(上边两个参数-i -d 也都可以带路径)
*注意以上4个参数是必须的,缺一不可,下面的参数是为了得到更好的结果自己可调的参数,如果你不加也没有关系,blastall程序本身会给一个默认值!
-a: 是指计算时要用的CPU个数,我的机器有两个CPU,所以用-a 2,这样可以并行化进行计算,提高速度,当然你的计算机就一个CPU,可以不用这个参数,系统默认值为1,就是一个CPU
在线blast的用法总结
在线b l a s t的用法总结-标准化文件发布号:(9556-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII
Blast(Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。
BLAST 采用一种局部的算法获得两个序列中具有相似性的序列
NCBI的在线blast:/Blast.cgi
本文详细出处参考:/475/
举例一:核酸序列的比对
1,进入在线blast界面,可以选择blast特定的物种(如人,小鼠,水稻等),也可以选择blast所有的核酸或蛋白序列。不同的blast程序上面已经有了介绍。这里以常用的核酸库作为例子。
(补充介绍下:1、BLASTN【 nucleotide blast】是核酸序列到核酸库中的一种
查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。2、BLASTP【protein blast】是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。
3、BLASTX是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列
(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序
列比对。
4、TBLASTN是蛋白序列到核酸库中的一种查询。与BLASTX相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。
本地BLAST使用方法
formatdb -i month.nt -p F -o T
-i input file 参数用于指定需要格式的数据库
-p type of file 用于指定文件类型,T 为蛋白质,F为核酸,默认为 T
-o parse options 用于指定是否解析序列ID并创建索引 T 为创建,F为不创建,默认为F。
blastall -p blastn -d month.nt -i test.txt -o out.txt –m 8 –e 10e-20
-p program name 为需要使用的程序名
blastn 为核酸序列对比搜索
blastp 为蛋白质序列对比搜索
blastx 为用被翻译的核酸序列在蛋白质数据库中搜索
tblastn 为用蛋白质序列在 [核酸序列翻译后数据库] [**1]中搜索
tblastx 为用翻译后的核酸序列在核酸序列翻译后数据库中搜索
-d database name 指定所使用的数据库名称
-i input file 待搜索的序列文件
-o output file 指定保存结果的文件
-m 8 表格形式输出
-e 10e-20 设置e value的值
即可在out.txt中得到相应的结果。
此外,之前由于在使用formatdb.exe 使没有使用 -o T 参数,导致没有生成索引文件,出现了以下错误提示:
WARNING: Test: Could not find index files for database month.nt
一个正确的解决办法,那就是在使用formatdb.exe时,不要忘了-o 参数,因为这个参数默认是不创建索引的,另外数据库的类型不要弄错了!
本地BLAST操作
本地BLAST
搜索符合条件的序列,在结果列表页面中,点击右侧Send to的下拉菜单,选择File,选择FASTA,然后产生文件保存到自己磁盘:
安装blast本地软件,并测试,点击开始菜单,选择运行,在打开的输入框中输入“cmd”,确定,进入DOS界面,路径切换到你的blast安装目录bin目录下,键入“blastall”,回车:
运行建库程序formatdb:
建库的过程是建立目标序列的索引文件,前面下载保存的fasta格式的序列文件必须用formatdb格式化后,才能用于本地BLAST搜索。
在D:\blast\bin下新建文件夹database, 将local blast demo data解压到本地,将其中的db. seq和query. fasta复制到database文件夹,在DOS窗口切换到当前目录下(d:\blast\bin),输入命令:formatdb.exe –i database\db.seq –p F
此时database文件夹下生成几个新的文件。扩展名为nin, nsq和nhr的三个文件分别是新建的库索引(indices)、序列(sequences)和头(header)文件。如果你的数据库是蛋白质序列,这三个文件的扩展名将分别是*.pin, *.psq和*.phr:
输入如下命令:
blastall.exe –p blastn -i database\query.fasta -d database\db.seq -o out.txt
运行结束,在bin文件夹下出现一个新文件out.txt:
Blast的使用
Blast简介(二)
Blast 是一个序列相似性搜索的程序 包,其中包含了很多个独立的程序,这 些程序是根据查询的对象和数据库的不 同来定义的。比如说查询的序列为核 酸,查询数据库亦为核酸序列数据库, 那么就应该选择blastn程序。 下表列出了主要的blast程序。
主要的blast程序
程序名 Blastn Blastp Blastx Tblastn TBlastx 查询序列 核酸 蛋白质 核酸 蛋白质 核酸 数据库 核酸 蛋白质 蛋白质 核酸 核酸 搜索方法 核酸序列搜索逐一核酸数据库中的序列 蛋白质序列搜索逐一蛋白质数据库中的序 列 核酸序列6框翻译成蛋白质序列后和蛋白 质数据库中的序列逐一搜索。 蛋白质序列和核酸数据库中的核酸序列6 框翻译后的蛋白质序列逐一比对。 核酸序列6框翻译成蛋白质序列,再和核 酸数据库中的核酸序列6框翻译成的蛋 白质序列逐一进行比对。
单机版 单机版的blast可以通过NCBI的ftp站点获 得,有适合不同平台的版本(包括linux, dos等)。获得程序的同时必须获取相应 的数据库才能在本地进行blast分析。单机 版的优点是可以处理大批的数据,可以自 己定义数据库,但是需要耗费本地机的大 量资源,此外操作也没有网络版直观、方 便,需要一定的计算机操作水平。
选择搜索数据库 如果接受其他参数默认 设置,点击开始搜索
Blast任务提交表单(二)
如何构建属于自己的序列比对库 本地Blast比对库构建教程
序列比对库的构建教程
如何将大量的基因序列或基因组序列文件建成一个属于自己的系列比对库,方便我们随时进行本地Blast比对呢?
构建本地Blast比对库的好处是:
1.不用再担心停电而导致无法比对。
2.不用再担心打不开基因组序列的窘境了。
3.可以实现对批量序列进行比对。
4.如果NCBI里没有某物种的基因组,恰恰你手中有,可以建库进行基因比对。
5.能够快速知道序列与基因组里哪些部位有匹配,且匹配率有多大。
6.通过与基因组库比对,能帮我们验证所扩增的基因是否是正确的,而不是其
它基因。
7.能够将收集到的对自己研究方向有用的大量序列构建成库,针对性更强,方
便随时进行序列比对。
基于以上原因,我们知道构建本地Blast序列比对库的好处会很多,接下来的教程将教大家如何构建本地Blast序列比对数据库,为我们的研究营造更多方便。
本教程以构建基因序列的比对库为例(注:蛋白序列比对库构建方法与此相同)
建库及使用的前提:如需要将本地比对库建在D盘,我们应先在D盘下载并安
装一下BLAST软件,下载地址可以点击如下链接(也可在NCBI点击BLAST下载):https:///blast/executables/blast+/2.9.0/
然后下载界面如下图,我们需要根据自己的电脑版本来下载,Windows 64位系统下载下图圈出来的那个(注:切记不要下载ncbi-blast-2.10.1+-win64,这个新版本在建库时会出现磁盘空间不足的现象)。
安装好BLAST软件后接下来开始建库:
1.首先我们需要准备用于建库的基因序列,比如自己下载的某个类群的大量基
本地blast使用说明
先找到程序所在cd c:\cd blastcd bin格式化 数据库formatdb -i datebase.txt -p F(F是核苷酸库 T是蛋白库)然后BLAST(blastall下有子程序:blastn blastx blastt)blastall -p blastn -d datebase.txt -i 待比对.txt -o 结果.txt -e 1e-101e-004 差不多全对齐Microsoft Windows XP [版本 5.1.2600](C) 版权所有 1985-2001 Microsoft Corp.C:\Documents and Settings\Administrator>cd c:\C:\>dir驱动器 C 中的卷没有标签。卷的序列号是 A427-A482C:\ 的目录2009-03-09 08:48 39,087 1.txt2009-03-09 14:36 159 2.txt2008-11-10 12:46 0 AUTOEXEC.BAT2009-03-12 15:34
088,960 megablast.exe2009-03-12 15:41 20,998 result.txt2007-08-23 05:39 2,068,480 rpsblast.exe2007-08-23 05:39 1,581,056 seedtop.exe21 个文件 23,426,329 字节2 个目录 7,236,440,064 可用字节C:\blast\bin>fastacmd -d 2.txt -p F[NULL_Caption] ERROR: ERROR: Cannot initialize readdb for 2.txt databaseC:\blast\bin>formatbd -i 2.txt -p F'fnormatbd' 不是内部或外部命令,也不是可运行的程序或批处理文件。C:\blast\bin>formatdb -i 2.txt -p FC:\blast\bin>blastall -p blastn -d 2.txt -i 1.txt -o 333.txt -e 1e-10C:\blast\bin>
BLAST专题
NCBI 在线 Blast 的图文说明Blast(Basic Local Alignment Search Tool)是一套在蛋白质数据库或 DNA 数据库中进行相 似性比较的分析工具。BLAST 程序能迅速与公开数据库进行相似性序列 序列比较。BLAST 结果 序列 中的得分是对一种对相似性的统计说明。 BLAST 采用一种局部的算法获得两个序列中具有相似性的序列。 Blast 中常用的程序介绍: 中常用的程序介绍: 1、BLASTP 是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条 所查序列作一对一的序列比对。 2、BLASTX 是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸 序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序列比对。 3、BLASTN 是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列 作一对一地核酸序列比对。 4、TBLASTN 是蛋白序列到核酸库中的一种查询。与 BLASTX 相反,它是将库中的核酸序列 翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。 5、TBLASTX 是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸 序列都翻译成蛋白(每条核酸序列会产生 6 条可能的蛋白序列),这样每次比对会产生 36 种比对阵列。 NCBI 的在线 blast:/Blast.cgi 1,进入在线 blast 界面,可以选择 blast 特定的物种(如人,小鼠,水稻等),也可以选择 blast 所有的核酸或蛋白序列。不同的 blast 程序上面已经有了介绍。这里以常用的核酸库作 为例子。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本地blast的详细用法
Posted on 03 四月 2009 by 柳城,阅读 9,626
本地blast的详细使用方法
blast all -p blastn -i myRNA.fasta -d humanRNA.fasta -o myresult.blastout -a 2 -F F -T T -e 1e-10
解释如下:
blastall: 这是本地化/命令行执行blast时的程序名字!(Tips:blastall直接回车就会给出你所有的参数帮助,但是英文的)
-p: p 是program的简写,program在计算机领域中是程序的意思。此参数是指定要使用何种子程序,所谓子程序,就是针对不同的需要,如核酸序列和核酸序列进行比对、蛋白质序列和蛋白质序列进行比对、假设翻译后核酸序列于蛋白质序列进行比对,选择相应的子程序: blastn 是用于核酸对核酸 blastp 是蛋白质对蛋白质序列等等,一共5个自程序。
-i: i 是input的简写,意思是输入文件,就是你自己的要进行比对的序列文件(fasta格式)
-d: d是database的简写,意思是要比对的目标数据库,在例子中就是humanRNA.fasta (别忘了要formatdb)
-o: o是output的简写,意思是结果文件名字,这个根据你自己的习惯起名字,可以带路径,(上边两个参数-i -d 也都可以带路径)
*注意以上4个参数是必须的,缺一不可,下面的参数是为了得到更好的结果自己可调的参数,如果你不加也没有关系,blastall程序本身会给一个默认值!
-a: 是指计算时要用的CPU个数,我的机器有两个CPU,所以用-a 2,这样可以并行化进行计算,提高速度,当然你的计算机就一个CPU,可以不用这个参数,系统默认值为1,就是一个CPU
-F: 是filter的简写,blastall程序中有对简单的重复序列和低复杂度的一些repeats过滤调,默认是T (注意以后的有几种参数就两个选项,T/F T就是ture,真,你可以理解为打开该功能; F就是false,假,理解为关闭该功能)
-T: 是HTML的简写,是指blast结果文件是否用HTML格式,默认是F!如果你想用IE看,我建议用-T T
-e: 是Expectation value,期望值,默认是10,我用的10-10!
BLASTALL 用法
a.格式化序列数据库
格式化序列数据库— —formatdb
formatdb简单介绍:
formatdb处理的都是格式为 ASN.1和FASTA,而且不论是核苷酸序列数据库,还是蛋白质序列数据库;不论是使用Blastall ,还是Blastpgp,Mega Blast应用程序,这一步都是不可少的。
formatdb命令行参数:
formatdb - 得到formatdb 所有的参数显示(见附录二)和介绍,
主要参数的说明:
-i输入需要格式化的源数据库名称O p t i o n a l
-p文件类型,是核苷酸序列数据库,还是蛋白质序列数据库
T–p r o t e i n F-n u c l e o t i d e[T/F]O p t i o n a l d e f a u l t=T
-a输入数据库的格式是A S N.1(否则是F A S T A)
T-T r u e,F-F a l s e.[T/F]O p t i o n a l d e f a u l t=F
-o解析选项
T-T r u e:解析序列标识并且建立目录
F-F a l s e:与上相反
[T/F]O p t i o n a l d e f a u l t=F
命令示例:
f o r m a t d b-i e c o l i.n t-p F-o T
运行此命令就会在当前目录下产生用于BLAST搜索的7个文件,一旦如上的formatdb命令执行完毕,就不再需要ecoli.nt,可以移除。此时,blastall可以直接使用。
b.Blastall常用参数简析
-p Program Name [String]
所用程序名称[String],用户可以根据需要从blastn,blastp,blastx,tblastn,tblastx中任选一程序。
-d Database [String] default = nr
所用序列数据库的名称 [String],默认为:nr
-i Query File [File In] default = stdin
所用查询序列文件[File In],默认为:stdin,本文例为 test.txt
-e Expectation value (E) [Real] default = 10.0
期望值[Real] 默认为10.0 描述搜索某一特定数据库时,随机出现的匹配序列数目。
-m alignment view options: 比对显示选项,其具体的说明可以用以下的比对实例说明
0 = pairwise,显示具体匹配信息(缺省)
1 = query-anchored showing identities,查询-比上区域,显示一致性
2 = query-anchored no identities,查询-比上区域,不显示一致性
3 = flat query-anchored, show identities,查询-比上区域的屏文形式,显示一致性
4 = flat query-anchored, no identities,查询-比上区域的屏文形式,不显示一致性
5 = query-anchored no identities and blunt ends,查询-比上区域,不显示一致性,无突然的结束
6 = flat query-anchored, no identities and blunt ends,查询-比上区域的屏文形式,不显示一致性
7 = XML Blast output,XML格式的输出
8 = tabular,TAB格式的输出
9 =tabular with comment lines,带注释行的TAB格式的输出
10 =ASN, text,文本方式的ASN格式输出