蛋白结构数据库资料

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

SCOP首先从总体上将蛋白质进行分类,例如全 型,全型,以平行折叠为主的/型,以反平行 折叠为主的+型 等。
例如: SCOP1.73版本有46456个全型蛋白质,该结构类 型下有258个折叠类。在这258个折叠类中的第一 个超家族是类球蛋白;类球蛋白又包含4个家族, 其中第一个家族包含6个结构域;每个结构域下面 有很多蛋白质成员。
HETSYN FORMUL HELIX SHEET TURN SSBOND
非标准残基的同义字 非标准残基化学式 螺旋 折叠 转角 有二硫键存在
LINK
残基间化学键
HYDBND SLTBRG CISPEP SITE CRYST1 ORIGXn SCALEn MTRIXn TVECT
氢键 盐桥 顺势残基 特性位点 晶胞参数 直角-PDB坐标 直角部分结晶学坐标 非晶相对称 转换因子
③通过命令行方式。
(9)蛋白质三维立体结构图像的输出
习题: 1. PDB和RSCB的中英文全称分别是什么? 2. PDB中的数据主要来源于哪两种实验测定 的生物大分子三维结构? 3. PDB中的每条记录有哪两种序列信息? 4. PDB记录中的EXPDTA,HELIX,SSBOND
各代表什么含义?
4.3.2 MMDB数据库
(2)DSSP的输出文件 1adz.dssp
(3)DSSPcont查询 /services/DSSPcont/
习题:
1. MMDB,SCOP和DSSP的中英文全称分 别是什么? 2. DSSP数据库中二级结构共分为几类,分 别代表什么? 3. 简要描述一下SCOP数据库的分类层次。
PDB数据库的详细字段说明如下:
HEADER OBSLTE 分子类,公布日期,ID号 注明该ID号已改为新号
TITLE CAVEAT COMPND SOURCE KEYWDS EXPDTA
说明试验方法类型 可能的错误提示 化合物分子组成 化合物来源 关键词 测定结构所用的试验方法
AUTHOR REVDAT SPRSDE JRNL REMARK 1 REMARK 2 REMARK 3 REMARK 4
SCOP数据库除了提供蛋白质结构和进 化关系信息外,对于每一个蛋白质还包括下 述信息:到PDB的链接,序列,参考文献, 结构的图像等。
SCOP的结构分类主要是通过人工来完 成的,通过图形显示器观察和比较蛋白质结 构,并借助于一些软件工具进行分析。
2.分类的层次结构 (1)家族:
具有明显进化关系的蛋白质聚集到一个家 族中,意味着两个蛋白质之间的等同氨基 酸残基数超过30%。然而,在某些情况下, 虽然两个蛋白质序列不相似,但它们具有 相似的结构和相似的功能,表明属于同一 个家族。
数据查看:
(3)分别单击标签Biology & Chemistry生物学和化学, Materials & Methods材料和方法,Sequence Details细 分序列,Geometry几何形态,观察数据信息。也可以 单击Help查看帮助文件。 (4)回到Structure Summary组织摘要,标签,在右侧的 Images and Visualization区域可以观察蛋白的三维结构, 可以单击KiNG,Jmol,WebMol等查看三维结构。 (5)单击左侧目录中的Download Files下载不同格式和内容 的文件;或下载FASTA序列文件;也可单击1adz 右侧 的Download PDB file 图标下载PDB文件(1adz.pdb)。
也可以直接利用查找工具,查找特定的蛋白质1GGZ。
4.3.4 DSSP数据库
1.简介
蛋白质二级结构数据库DSSP (Database of Secondary Structure of Protein)是一个二级 结构推导数据库。对生物大分子数据库PDB 中的任何一个蛋白质,根据其三维结构推导 出对应的二级结构。
Cn3D是MMDB一个配套的三维结构显 示程序,它具有可靠的显示三维数据库结构 的能力。图像以动画形式显示,用户可以旋 转或缩放结构,也可以用条带图、空间结构 图、热能分布图等方式来显示,掌握分子结 构的不同功能
(1)在刚才的查询结果页,单击左侧结构图下方的View options,展开选项。 (2)Tasks选择Save File,Program选择Cn3D,Drawing 选择Backbone。 (3)在结构图上单击,下载文件3 。
(4)下载并安装Cn3D软件。
(5)开始→程序→NCBI→Cn3D→Cn3D4.1 注:MMDB采用ASN.1的记录格式,而非PDB格式。
4.3.3 SCOP数据库
1.简介
蛋白质结构分类数据库SCOP (Structural Classification of Proteins)的目标是提供关于 已知结构蛋白质之间的结构和进化关系的信 息,所涉及的蛋白质包括结构数据库PDB中 的所有条目。
4.3 蛋白质结构数据库
目录
4.3.1 PDB数据库
4.3.2 MMDB数据库
4.3.3 SCOP数据库
4.3.4 DSSP数据库
引言
4.3.1 PDB数据库
1.简介
美国Brookhaven实验室1971年建立的大
分子结构数据库PDB 蛋白质晶体结构资
料数据库 (Protein Data Bank)。
RasMol是一个进行分子三维立体结构显示 的软件,可以非常方便地观察蛋白质、核酸以 及一些小分子的三维结构,并在自己的个人电 脑上,以各种模式、各种角度,甚至按照自己 的意愿旋转,观察此分子的微观三维立体结构, 进而了解化合物分子结构和各种微观性质与宏 观性质之间的定量关系。
例如:在RasMol软件下观察1GGZ.pdb结构
PDB数据库的维护由结构生物信息学研 究合作组织(Research Collaboration for Structural Bioinformatics, RCSB)负责。
2.数据来源
通过实验(X射线晶体衍射,核磁共振, 电子显微镜方法等)测定的生物大分子的三 维结构。 主要是蛋白质的三维结构,还包括核酸、 糖类、蛋白质与核酸复合物的三维结构。
2.查询
(1)登陆网站
/Structure/MMDB/m mdb.shtml
(2)在文本框中输入“1ggz”(或者右下角的 PDB/MMDB Code文本框中 ),单击Go按 钮,显示查询结果。
家族构成
3D大分子结构
保守区域
数据库
3.三维结构显示程序 Cn3D
2.分类
ቤተ መጻሕፍቲ ባይዱ
结构描述 α-helix 310helix π-helix β-strand β-bridge Coil Turn Bend
分类 H G I E B or b C, L or space T S
3. DSSP查询
(1)网址: http://www.sander.embl-heidelberg.de/dssp/
(4)单击RasMol主菜单上的“File/Open”载入“人上皮 细胞calmodulin样蛋白”的结构数据(即1GGZ.pdb)。 (5)蛋白质分子的外观立体结构观察: 利用RasMol主菜单上的“Display”命令中的不同显 示模式来变换分子的三维立体结构的外观。 (6)蛋白质分子的外观立体结构的颜色显示模式: 利用主菜单上的“Colours”命令来选择不同的颜色 显示模式,以进一步更直观、清晰地展示所要观察 的分子的立体结构。
电子教程
5.数据结构
PDB中对于每一个结构记录,包含名 称、参考文献、序列、一级结构、二级结构 和原子坐标等信息。 每条记录有两种序列信息,一种是显式 序列信息(explicit sequence),一种是隐式序 列信息(implicit sequence)。
在PDB文件中,以关键字SEQRES作为 显式序列标记,以该关键字打头的每一行都 是关于序列的信息;PDB的隐式序列即为立 体化学数据,包括每个原子的名称和原子的 三维坐标。
MODEL
多亚基时显示亚基号
ATOM SIGATM ANISOU SIGUIJ TER HETATM ENDMDL CONECT MASTER END
标准基团的原子坐标 标准差 温度因子 各种温度因素导致的标准差 链末端 非标准基团原子坐标 亚基结束 原子间的连通性有关记录 版权拥有者 文件结束
6.结构模型显示软件 RasMol
(7)蛋白质分子三维结构的选择性显示: RasMol主菜单中的“Display”和“Colours”命令主要 用于分子的正常显示,在主菜单上还有一个 “Options”选项命令,可以进行一些非正常的显示。 (8)蛋白质分子三维结构的旋转显示:
①鼠标点击窗口右方与下方的滚卷条,将以X轴或Y轴旋转。
②将鼠标移至主屏幕区,按住鼠标左键,移动鼠标,就可以任意 旋转此分子。按住Shift键,同时按住鼠标的右键,移动鼠标,即可 实现以Z轴旋转。
生物学与化学标签
方法标签
序列标签
几何形状标签
摘要标签
例2:查询“人calmodulin (钙调素蛋白:一种钙结 合蛋白)” (1)登陆PDB网站 (2)单击Advanced search→将Structure Title 限制为 human和calmodulin →单击Evaluate Query (3)得到多个结构数据,其中“PDB ID = 1GGZ”的搜 索结果最符合要求,是人上皮细胞中的钙调素样 蛋白,单击此ID,进入1GGZ的具体界面。
(2)超家族:
超家族中的成员具有远源进化关系,具有 共同的进化源。
(3)折叠:
无论有无共同的进化起源,只要具有相同 排列和拓扑结构的主要二级结构,即将蛋 白质分类为具有相同的折叠。
3. SCOP查询
(1)网址:/scop/
(2)单击
top of the hierarchy
3.数据统计
截止2008年4月,PDB数据库已含有 50277 个结构数据,其中约93%是蛋白质的 结构。
Other 包括 proteins nucleicacids complexes X-ray NMR Microscopy
4.数据查询
PDB中的记录有唯一的PDB-ID,包括4 个字符串,可由大写字母A~Z和数字0~9组 合而成。
结构测定者 修订日期及相关内容 已撤销或更改的相关记录 发表坐标集的文献 有关文献 最大分辨率 用到的程序和统计方法 其他注解
DBREF SEQADV
其他序列库的有关记录 PDB与其它记录的出入
SEQRES MODRES HET HETNAM
残基序列 对标准残基的修饰 非标准残基 非标准残基的化学名称
1.简介
分子模型数据库MMDB (Molecular Modeling Database)是一个关于三维生物分子结构的数据库, 是美国生物技术信息中心(NCBI)所开发的生物信息 数据库集成系统Entrez的一个部分。
MMDB是来源于PDB三维结构的一部分, MMDB重新组织和验证了这些信息,从而保证在化 学和大分子三维结构之间的交叉参考。
PDB和它的镜像站点提供每个PDB记录 的查询,可按一些专门的查询项目(如提交 数据、作者姓名、结构表达)进行检索。
例1:查询“PDB ID = 1ADZ”的结构数据
(1)登陆PDB网站 /pdb/ (2)在上方的搜索栏选中“PDB ID or keyword ” ,在文本框中输入“1ADZ”, 单击Site Search按钮,出现结果。
(1)下载并安装RasMol 2.7.3.1 (/software/rasmol/ ) (2)单击开始→程序→Raswin→Raswin,运行RasMol。
(3)当运行RasMol时,程序首先打开具有黑色背景的主窗口 (显示窗口),同时也会打开另一个窗口,其背景色是白 色的,被称作“命令行窗口”。初始运行时,命令行窗口 通常为最小化状态,用ALT+TAB键切换,即可打开该窗口, 在主显示窗口的菜单中的任何选择和操作,均可在此窗口 中输入命令行实现。
相关文档
最新文档