将序列转换为FASTA格式的方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
将序列转换为 FASTA 格式的方法
方法一:利用 NCBI Entrez 查询序列并转存成为 fasta 格式
Entrez 基本操作
1.进入 NCBI 主网页 ()
2.在网页上方 Search 栏选择 database (例:protein),在 for 字段输入 keyword (例:
TF3A_*),然后按 GO
3.储存个别序列档案:
结果网页出现后,例如勾选 P03001,在 Display 栏选择 FASTA,在 Send to 栏选择 file,按 Send to 按钮即可将 P03001 序列以 FASTA 格式存在自己的 PC 中。记得选取适当的目录,并输入正确的档名。(例: tf3a_xenla.txt)
4.如何储存batch序列档案:
结果网页出现后,勾选 P34694、P34695、P17842、Q92664、P03001、P39933 等六条序列,在Display 栏选择 FASTA,在 Send to 栏选择 file,按 Display按钮可以检视这些序列的FASTA格式内容,按Send to按钮则可将这一组序列以 FASTA 格式存在自己的 PC
中。记得选取适当的目录,并输入正确的档名。(例: tf3abatch.txt) 这个 batch 序列档案可以用 JEMBOSS的emma 程序进行多序列并列分析。
方法二:利用 JEMBOSS 的 seqret 进行格式转换
请参考JEMBOSS 使用说明网页,seqret 部分。
方法三:利用 GCG command mode 的 tofasta 程序将 gcg 格式的序列转为 fasta 格式使用方法
unix % tofasta序列档案
再选择需要转换的区域 (例如:从第 a 个到第 b 个),最后储存已转换成功的档案说明
假设使用者有一条 gcg 格式的蛋白质序列tf3a_xenbo.swissprot (核酸序列亦可),可以利用
tofasta tf3a_xenbo.swissprot来将序列转换为 fasta 格式。存盘之后,再以 more 指令检查是否确实转换完成。
※ ToFastA 使用方法参考:.tw/gcghelp/tofasta.html
Copyright © National Health Research Institutes. All rights reserved.