本地Blast
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本地Blast使用说明
一、软件的下载安装
1.1安装流程
建议安装在非系统盘,如将下载的 BLAST 程序安装到 E:\blast,生成bin、doc 两个子目录,其中 bin 是程序目录,doc 是文档目录,这样就安装完毕了。
1.2 设置环境变量
右键点击“我的电脑”-“属性”,然后选择“高级系统设置”标签-“环境变量”(图1),在用户变量下方“Path”随安装过程已自动添加其变量值,即“E:\Blast\bin”。此时点击“新建”-变量名“BLASTDB”,变量值为“E:\Blast\db”(即数据库路径,图2)。
二、查看程序版本信息
点击 Windows 的“开始”菜单下的“运行”,输入“cmd”调出 MS-DOS 命令行,转到 Blast 安装目录,输入命令“blastn -version”即可查看版本,若能显示说明本地blast 已经安装成功。
三、使用
3.1本地数据库的构建
下载所需的数据(Fasta格式),将X 放到E:\blast\db 文件夹下,然后调出MS-DOS 命令行,转到E:\blast\db 文件夹下运行以下命令:格式化
数据库,命令为:
makeblastdb -in 数据库文件 -dbtype 序列类型(核酸:nul;蛋白:prot)-title database_title-parse_seqids -out database_name-logfile File_Name
格式化数据库后,创建三个主要的文件——库索引(indices),序列(sequences)和头(headers)文件。生成的文件的扩展名分别是:.pin、.psq、.phr(对蛋白质序列)或.nin、.nsq、.nhr(对核酸序列)。而其他的序列识别符和索引则包含在.psi和.psd(或.nsi 和.nsd)中。
3.2核酸序列相似性搜索
blastn -db database_name -query input_file -out output_file
-outfmt "7 qacc sacc qstart qend sstart send length bitscore evalue pident ppos"
备注:qacc:查询序列Acession号;sacc:目标序列Acession号;
qstart qend:分别表示查询序列比对上的起始、终止位置;
sstart send:分别表示目标序列比对上的起始、终止位置;
length:长度; bitscore:得分; evalue:E-Value值;
pident:一致性; ppos:相似性
3.3 查看并获取目标序列:
blastdbcmd -db refseq_rna -entry 224071016 -out test.fa
可以从数据库中提取gi号为224071016的序列,并且以fasta格式存入文
件
3.4蛋白质序列相似性搜索
Blastp -db database_name-query input_file -out output_file
-outfmt "7 qacc sacc qstart qend sstart send length bitscore evalue pident ppos"
3.5 查看并获取目标序列:重复3.3