GenBank数据库的简略介绍
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
GenBank主页
GenBank查找页面及描述部分
GenBank序列文件
特性表
关键字
CDs are recurring units in polypeptide
chains
CD s编码序列,含终止 密码子 polyA signal 多 聚A信号
CDs are recurring units in polypeptide chains
• 数据格式为FastA
GenBank数据库—数据库格式
FASTA格式 • 将一个DNA或者蛋白质序列表示为一个带有一些标记的核
苷酸或氨基酸字符串。 • 大于号(>)表示一个新文件的开始 • 结束用(//) GenBank纯文本文件格式:GenBank,flatfile,GBFF
FASTA格式序列的提交
序列本身
序列结束
4859 bp
GenBank数据记录
GenBank注释内容
• 序列条目关键字: – LOCUS (代码), – DEFINITION (说明), – ACCESSION(编号), – NID符(核酸标识), – KEYWORDS (关键词), – SOURCE (数据来源), – REFERENCE (文献), – FEATURES (特性表), – BASE COUNT (碱基组成) – ORIGIN (碱基排列顺序)。
• 新版的核酸序列数据库将引入新的关键词SV (序列版本号),用“编号.版本号” 表示,并取代关键词NID
谢谢观赏
GenBank数据库的简略介绍
数据库的作用
• 序列搜素 • 文献搜索 • 功能信息查询 • 引物设计 • Blast序列分析
GenBank数据库结构
• 完整的 GenBank数据库包括序列文件,索引文件 以及其它有关文件。
• 索引文件是根据数据库中作者、参考文献等建立 的,用于数据库查询。
• GenPept是由GenBank中的核酸序列翻译而得到的 蛋白质序列数据库