蛋白结构数据库PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
残基间化学键 氢键 盐桥 顺势残基 特性位点 晶胞参数 直角-PDB坐标 直角部分结晶学坐标 非晶相对称 转换因子
.
25
MODEL ATOM SIGATM ANISOU
多亚基时显示亚基号 标准基团的原子坐标 标准差 温度因子
SIGUIJ
各种温度因素导致的标准差
TER HETATM
链末端 非标准基团原子坐标
4.3 蛋白质结构数据库
.
1
目录
4.3.1 PDB数据库 4.3.2 MMDB数据库 4.3.3 SCOP数据库 4.3.4 DSSP数据库
.
2
引言
4.3.1 PDB数据库
1.简介
美国Brookhaven实验室1971年建立的大
分子结构数据库PDB 蛋白质晶体结构资 料数据库 (Protein Data Bank)。
ENDMDL
亚基结束
CONECT
原子间的连通性有关记录
MASTER
版权拥有者
END
文件结束
.
26
6.结构模型显示软件 RasMol
RasMol是一个进行分子三维立体结构显示 的软件,可以非常方便地观察蛋白质、核酸以 及一些小分子的三维结构,并在自己的个人电 脑上,以各种模式、各种角度,甚至按照自己 的意愿旋转,观察此分子的微观三维立体结构, 进而了解化合物分子结构和各种微观性质与宏 观性质之间的定量关系。
PDB数据库的维护由结构生物信息学研 究合作组织(Research Collaboration for Structural Bioinformatics, RCSB)负责。
.
4
2.数据来源
通过实验(X射线晶体衍射,核磁共振, 电子显微镜方法等)测定的生物大分子的三 维结构。
主要是蛋白质的三维结构,还包括核酸、 糖类、蛋白质与核酸复合物的三维结构。
(5)单击左侧目录中的Download Files下载不同格式和内容 的文件;或下载FASTA序列文件;也可单击1adz 右侧 的Download PDB file 图标下载PDB文件(1adz.pdb)。
.
12
生物学与化学标签
.Байду номын сангаас
13
方法标签
.
14
序列标签
.
15
几何形状标签
.
16
摘要标签
.
17
例2:查询“人calmodulin (钙调素蛋白:一种钙结 合蛋白)”
(1)登陆PDB网站
(2)单击Advanced search→将Structure Title 限制为 human和calmodulin →单击Evaluate Query
(3)得到多个结构数据,其中“PDB ID = 1GGZ”的搜 索结果最符合要求,是人上皮细胞中的钙调素样 蛋白,单击此ID,进入1GGZ的具体界面。
.
10
.
11
数据查看:
(3)分别单击标签Biology & Chemistry生物学和化学, Materials & Methods材料和方法,Sequence Details细 分序列,Geometry几何形态,观察数据信息。也可以 单击Help查看帮助文件。
(4)回到Structure Summary组织摘要,标签,在右侧的 Images and Visualization区域可以观察蛋白的三维结构, 可以单击KiNG,Jmol,WebMol等查看三维结构。
.
27
例如:在RasMol软件下观察1GGZ.pdb结构
(1)下载并安装RasMol 2.7.3.1 (http://www.rasmol.org/software/rasmol/ )
(2)单击开始→程序→Raswin→Raswin,运行RasMol。
PDB和它的镜像站点提供每个PDB记录 的查询,可按一些专门的查询项目(如提交 数据、作者姓名、结构表达)进行检索。
.
9
例1:查询“PDB ID = 1ADZ”的结构数据 (1)登陆PDB网站 http://www.rcsb.org/pdb/ (2)在上方的搜索栏选中“PDB ID or
keyword ” ,在文本框中输入“1ADZ”, 单击Site Search按钮,出现结果。
.
18
电子教程
5.数据结构
PDB中对于每一个结构记录,包含名 称、参考文献、序列、一级结构、二级结构 和原子坐标等信息。
每条记录有两种序列信息,一种是显式 序列信息(explicit sequence),一种是隐式序 列信息(implicit sequence)。
.
20
在PDB文件中,以关键字SEQRES作为 显式序列标记,以该关键字打头的每一行都 是关于序列的信息;PDB的隐式序列即为立 体化学数据,包括每个原子的名称和原子的 三维坐标。
JRNL REMARK 1 REMARK 2 REMARK 3 REMARK 4
DBREF SEQADV
结构测定者 修订日期及相关内容 已撤销或更改的相关记录 发表坐标集的文献 有关文献 最大分辨率 用到的程序和统计方法 其他注解 其他序列库的有关记录 PDB与其它记录的出入
.
23
SEQRES MODRES
.
5
3.数据统计
截止2008年4月,PDB数据库已含有 50277 个结构数据,其中约93%是蛋白质的 结构。
.
6
Other 包括 proteins nucleicacids complexes X-ray NMR Microscopy
4.数据查询
PDB中的记录有唯一的PDB-ID,包括4 个字符串,可由大写字母A~Z和数字0~9组 合而成。
HET HETNAM HETSYN FORMUL
HELIX SHEET TURN SSBOND
残基序列 对标准残基的修饰 非标准残基 非标准残基的化学名称 非标准残基的同义字 非标准残基化学式 螺旋 折叠 转角 有二硫键存在
.
24
LINK HYDBND SLTBRG CISPEP
SITE CRYST1 ORIGXn SCALEn MTRIXn TVECT
.
21
PDB数据库的详细字段说明如下:
HEADER OBSLTE TITLE CAVEAT COMPND SOURCE KEYWDS EXPDTA
分子类,公布日期,ID号 注明该ID号已改为新号 说明试验方法类型 可能的错误提示 化合物分子组成 化合物来源 关键词 测定结构所用的试验方法
.
22
AUTHOR REVDAT SPRSDE