第四章生物分子数据库.ppt

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

21 Mar 2003 2020-12-131 7,943,364,438 b谢a谢s你es的观in赏 24,353,128 records. 10
2020-12-11
EMBL核酸数据库中的每一个序列数据被赋予一个登录号, 它是一个永久性的唯一标识
EMBL的序列数据用外在的ASCII文本文件来表示, 而每一个文件分为文件头和文件体两大部分
2020-12-11
谢谢你的观赏
2020-12-11
谢谢你的观赏
3
❖生物分子数据库
一级数据库
❖ 数据库中的数据直接来源于实验获得的原始 数据,只经过简单的归类整理和注释
二级数据库
❖ 对原始生物分子数据进行整理、分类的结果, 是在一级数据库、实验数据和理论分析的基 础上针对特定的应用目标而建立的 。
2020-12-11
谢谢你的观赏
http://www.embl-heidelberg.de (2)美国生物技术信息中心的GenBank http://www.ncbi.nlm.nih.gov/Web/Genbank/ind ex.html (3)日本遗传研究所的DDBJ
http://www.ddbj.nig.ac.jp/
2020-12-11
文件头由一系列的信息描述行所组成,
文件头实际上对应于一个序列的注释(annotation)
“ID”为序列的标识符行,包括登录号、类型,分子的长度 “AC”为登录号行;
“XX”为分隔符号行; “DT” 为创建和更新日期行
“DE”为序列描述行; “KW”为关键字行; “OG”行描述细胞组织; “OS”行描述生物体种属; “OC”行描述生物体分类信息; “RN”描述参考文献的编号; “RP”描述参考文献的页码; “RA”描述参考文献的作者; “RT”描述参考文献的题目; “RL”描述参考文献的出处; “RC”描述参考文献的注解; “RX”、“DR”行描述交叉引用信息; “FH” 为特征开始符号; “FT”为特征表行 (1)Feature Key,它是描述域生物功能的关键字;
(1)人类基因组区域
包括基因、克隆、PCR标记物、断点、细胞遗传学标记、易碎位 点、 EST、综合区域、contigs、重复等;
(2)人类基因组图谱,
包含细胞遗传学图谱、连接图谱、辐射混合图谱、contig 图谱、集 成图谱,所有这些图谱都可以被直观地显示出来;
(3)人类基因组中的变化,
包括基因突变和基因多态性,加上等位基因频率数据。
2020-12-11
谢谢你的观赏
12
使用EMBL
(1)CD-ROM形式 (2)ftp服务器 (3)Gopher服务器 (4)WWW服务器
这是目前最常用的一种形式
2020-12-11
谢谢你的观赏
13
EMBL提供一些与序列相关的检索操作(基于3W服务器)
(1)序列查询 最简单的查询就是通过序列的登录号(如X58929) 或序列名称(如SCARGC)直接查询。
2020-12-11
谢谢你的观赏
16
2020-12-11
谢谢你的观赏
与 染 色 体 相 关 的 信 息
17
其它模式生物基因组数据库
如:鼠基因组数据库 MGD
(http://www.informatics.jax.org/)
酵母基因组数据库 SGD (http://genomewww.stanford.edu/Saccharomyces/)
以下着重介绍EBML
2020-12-11
谢谢你的观赏
8
MBL中的数据分类情况(单位:Gigabases)
2020-1(2-11EST-Expressed sequenc谢e谢ta你gs的;观S赏TS-sequence tagged sites)
9
(取自http://www3.ebi.ac.uk/Services/DBStats/)
谢谢你的观赏
6
核酸序列数据的增长趋势
(纵轴代表总的核酸序列长度,单位:百万bp)
2020-12-11
谢谢你的观赏
7
• 三个数据库中的数据基本一致,仅在 数据格式上有所差别,对于特定的查询, 三个数据库的响应结果一样。
• 这三个数据库是综合性的DNA和RNA序 列数据库,每条记录代表一个单独、连 续、附有注释的DNA或RNA片段。
2020-12-11
第四章 生物分Biblioteka Baidu数据库
主讲人:孙 啸
制作人:刘志华
东南大学 吴健雄实验室
谢谢你的观赏
1
第一节 引言
生物分子数据 高速增长
分子生物学 及相关领域研究人员 迅速获得最新实验数据
建立生物分子数据库
2020-12-11
谢谢你的观赏
2
❖生物分子数据库应满足5个方面的 主要需求
❖(1)时间性 ❖(2)注释 ❖(3)支撑数据 ❖(4)数据质量 ❖(5)集成性
(2)Location,指明特征在序列中的特定位置; (3)Qualifiers,描述关于一个特征的辅助信息;
文件体由序列本身所组成,由“SQ”标志的行开始。
谢谢你的观序赏列结束的标记是“//”。
11
提交数据
(1)编辑电子表格
(2)利用Authorin程序 (3)利用基于WWW网络环境的序列提交系统
DR
SWISS-PROT:P01860;GC3_HUMAN
(2)核酸同源性搜索
3W服务器支持用户使用FastA程序进行核酸同源搜索。 FastA根据给定的目标序列在数据库中搜索其同源序列。
2020-12-11
谢谢你的观赏
15
2、基因组数据库(GDB)
人类基因组计划所得到的图谱数据
目前GDB包含对下述三种对象的描述:
如果找到所查询的序列,则服务器将查询结果以HTML文件返 回给用户 如果数据库中该序列有到MEDLINE的交叉索引,则系统同时返 回与包含参考文献摘要等信息的MEDLINE链接 如果该序列有到其它数据库的交叉索引,也返回相应的链接
2020-12-11
谢谢你的观赏
14
例如: 登录号为J00231的核酸序列具有这样一个交叉索引行:
4
生物分子数据库几个明显的特征:
(1)数据库的更新速度不断加快
数据量呈指数增长趋势
(2)数据库使用频率增长更快
(3)数据库的复杂程度不断增加
(4)数据库网络化
(5)面向应用
(20206-1)2-11先进的软硬件配谢置谢你的观赏
5
第二节 核酸序列数据库
国际上权威的核酸序列数据库
(1)欧洲分子生物学实验室的EMBL
相关文档
最新文档