本地Blast

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

本地Blast使用说明

一、软件的下载安装

1.1安装流程

建议安装在非系统盘,如将下载的 BLAST 程序安装到 E:\blast,生成bin、doc 两个子目录,其中 bin 是程序目录,doc 是文档目录,这样就安装完毕了。

1.2 设置环境变量

右键点击“我的电脑”-“属性”,然后选择“高级系统设置”标签-“环境变量”(图1),在用户变量下方“Path”随安装过程已自动添加其变量值,即“E:\Blast\bin”。此时点击“新建”-变量名“BLASTDB”,变量值为“E:\Blast\db”(即数据库路径,图2)。

二、查看程序版本信息

点击 Windows 的“开始”菜单下的“运行”,输入“cmd”调出 MS-DOS 命令行,转到 Blast 安装目录,输入命令“blastn -version”即可查看版本,若能显示说明本地blast 已经安装成功。

三、使用

3.1本地数据库的构建

下载所需的数据(Fasta格式),将X 放到E:\blast\db 文件夹下,然后调出MS-DOS 命令行,转到E:\blast\db 文件夹下运行以下命令:格式化

数据库,命令为:

makeblastdb -in 数据库文件 -dbtype 序列类型(核酸:nul;蛋白:prot)-title database_title-parse_seqids -out database_name-logfile File_Name

格式化数据库后,创建三个主要的文件——库索引(indices),序列(sequences)和头(headers)文件。生成的文件的扩展名分别是:.pin、.psq、.phr(对蛋白质序列)或.nin、.nsq、.nhr(对核酸序列)。而其他的序列识别符和索引则包含在.psi和.psd(或.nsi 和.nsd)中。

3.2核酸序列相似性搜索

blastn -db database_name -query input_file -out output_file

-outfmt "7 qacc sacc qstart qend sstart send length bitscore evalue pident ppos"

备注:qacc:查询序列Acession号;sacc:目标序列Acession号;

qstart qend:分别表示查询序列比对上的起始、终止位置;

sstart send:分别表示目标序列比对上的起始、终止位置;

length:长度; bitscore:得分; evalue:E-Value值;

pident:一致性; ppos:相似性

3.3 查看并获取目标序列:

blastdbcmd -db refseq_rna -entry 224071016 -out test.fa

可以从数据库中提取gi号为224071016的序列,并且以fasta格式存入文

3.4蛋白质序列相似性搜索

Blastp -db database_name-query input_file -out output_file

-outfmt "7 qacc sacc qstart qend sstart send length bitscore evalue pident ppos"

3.5 查看并获取目标序列:重复3.3

相关文档
最新文档