生物学数据库的内容与结构

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

二 Flat File实例
UniProt数据库: Universal Protein , 是信息最丰富、资源最广的蛋白质数据库。 Swiss-Prot、 TrEMBL 和 PIR-PSD 三大数据库的数据。
主要来自于基因组测序项目完成后,后续获得的蛋白质序列。
包含了大量来自文献的蛋白质的生物功能的信息。
二 Flat File实例

ID AC 标识符:Primary (citable) accession number: P99999; Secondary accession number(s): A4D166, Q96BV4 DT: 1986---2007---2016 DE:



第九周 第二代测序技术及应用
第十一周 系统生物学(1) 第十三周 系统生物学(2) 第十五周 基因组注释/编程基础
第十二周 序列结果与环境因子关系分析
第十四周 网络结构图 第十六周 答疑(?)
一 数据存储基础 数据格式

程序
• DNAman • DNAStar • Clustal • Mega • Contig
GN: Gene name;
OS: Organism source OC: Organism comment OX: Organism cross-reference


RN: Reference Number
RP: Reference position RX: Reference cross-reference RA: Reference Author

信息树 节点
TXT


FASTA
Pearson
二 Flat File


平面文件格式---纯文本文件
ASCII:American Standard Code for Information Interchange,美国标准信息交换 代码。

百度文库
Entry/record: field, value

优势所在:通用性


RT: Reference Title
RL: Reference Location
二 Flat File实例


DR:Data Resources
FT:不同的序列特征 CC: 注释模块
二 Flat File实例
三 序列格式
Swissprot format
Fasta format
四 XML格式
第二章(2)生物学数据库的内容 与结构
生物信息学讲授安排
第一周 绪论(什么是生物信息学) 第三周 生物学数据库的内容与结构(Endnote) 第五周 序列比对原理 第七周 分子进化与系统发育 第二周 生物数据库基础及NCBI/BLAST 第四周 序列格式与拼接 第六周 序列比对上机 第八周 进化树构建(基于16S rRNA基因) 第十周 高通量数据的初步分析
相关文档
最新文档