蛋白质工程 第四章 蛋白质结构预测

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Chapter 4 Bioinformatics Analysis of Protein Structure
第四章 蛋白质结构预测
4
Contents of chapter 4
4.1 常用蛋白质数据库 4.2 蛋白质结构预测
4.1 常用蛋白质数据库
蓝皮本 P164、P165 表6-1 橙皮本 P69 一、蛋白质序列数据库 二、蛋白质结构数据库
42
43
Jpred二级结构预测方法
(1) 进入Jpred首页 (http://www.compbio.dundee.ac.uk/www-jpred/),
(2) 在“Sequence”下的空白处直接输入序列;也可以选择 “Advanced”高级模式,选择Email提交方式或留空为网页结 果显示,输入蛋白质序列或者从电脑文件夹中获取,最后点击 “Make Prediction”; (3) 在电子邮箱中找到结果地址,在弹出的结果显示界面 选择进行简单结果浏览、图形化输出等操作;
EMBL核酸序列数据库,以及美国NCBI的GenBank数据 库,并列为国际上最著名的三大核酸数据库。
一、 蛋白质序列数据库

14
1、从三大核酸数据库查找蛋白序列
GenBank、EMBL、DDBJ

2、从蛋白质序列数据库查找蛋白序列
SWISS-PROT、PIR、TreEMBL及三者合 并而成的UniProt
蛋白质工程
Protein Engineering
2
教学内容
• • • • • • • • • 第一章 第二章 第三章 第四章 第五章 第六章 第七章 第八章 第九章 绪论 蛋白质的结构与功能 蛋白质结构分析技术 蛋白质结构预测 蛋白质的修饰与克隆表达 蛋白质纯化 蛋白质分子设计 蛋白质组学 蛋白质工程的应用

24
蛋白质可视化免费软件Pymol
Pymol是强大的分子图形显示和基本特征测定系统。 Pymol可在http://pymol.org/edu寻找链接下载 Pymol启动后显示双界面,对分子操作的常用命令界面, 多种分析功能界面。
25
蛋白质图形操作和性质测定
1. 图形界面左上侧列出主要的可操作对象并分成几个层 次,包括所选对象、蛋白质、整体等; 2. 每个层次的对象有五种主要操作:动作(A: action)、 显示(S: Show)、隐藏(H: hide)、标记(L: Label)、上色 (C: Color)。 3. Dispaly下拉菜单中可显示蛋白质中每条肽链的序列和 非蛋白质成分 ,鼠标左键单击序列选中特殊待操作的残 基可同时显示对象所在位置 ;还可设置背景(论文中这类 图一般用白色背景,而报告中常用黑色背景以增加视觉效 果); 4. Wizard中有对分子常用性质测定模块,包括距离、电 荷等以及尝试进行蛋白质分子改造的功能。
三、结构域预测
48
SMART
结 构 域 预 测
二、二级结构预测
• Jpred 在线二级结构预测: http://www.compbio.dundee.ac.uk/wwwjpred/ • SOPMA在线二级结构预测: http://npsa-pbil.ibcp.fr/cgibin/npsa_automat.pl?page=npsa_sopma.html
5
三、蛋白质结构分类数据库
一、 蛋白质序列数据库

6
1、从三大核酸数据库查找蛋白序列
GenBank、EMBL、DDBJ

2、从蛋白质序列数据库查找蛋白序列
SWISS-PROT、PIR、TreEMBL及三者合 并而成的UniProt
1、从三大核酸数据库找蛋白序列
(1)NCBI • National Center for Biotechnology Information,
35
http://www.expasy.org/proteomics
36
http://www.expasy.org/proteomics
• 各种Database:序列数据库、结构数据库、 结构分类数据库 • 各种Tools:序列比对、二级结构预测、三 维结构预测、结构域预测等
一、序列比对
在生物信息学研究中,最常用和最经典的一个研 究手段,就是通过序列比对获得有用的信息和知 识。 从核酸及蛋白质的一级结构方面来分析序列的相 同点和不同点,从而能够推测它们的结构、功能 及进化上的联系。
28
29
SCOP:http://scop.mrclmb.cam.ac.uk/scop/
• SCOP(Structural Classification of Protein)数 据库是一个蛋白质结构分类数据库。 • 依据不同蛋白质的氨基酸组成的相似性及三 级结构,分为全螺旋、全折叠、 /等11 个结构类型,再按照折叠、超家族、家族进 一步细分。
7
NCBI,美国国家生物技术信息中心
• http://www.ncbi.nlm.nih.gov/
• GenBank等公共数据库
• 工具:
– PubMed 查找文献 – BLAST 序列比对
8
NCBI主页
9
以鼠伤寒沙门氏菌(Salmonella typhimurium) H-1-i基因为例
人类的拉丁文名:Homo sapiens
1、从三大核酸数据库找蛋白序列
(3)DDBJ
13
• National Institute of Genetics,NIG,日本国立遗传学研究
所 • http://www.nig.ac.jg/ • 是日本遗传学各方面研究的中心研究机构及生命科学所 有领域的研究基地。
• NIG建立的日本DNA数据库(DDBJ)、欧洲EBI维护的
47
SOPMA二级结构预测方法
(1) 进入SOPMA主页(http://npsa-pbil.ibcp.fr/cgibin/npsa_automat.pl?page=/NPSA/npsa_sopma.html);
(2) 在“Paste a protein sequence below”下的空白处 提交蛋白序列(原始序列),可以在参数中进行符合我们要 求的设置,然后点击“SUBMIT”按钮进行分析;
37
一、序列比对
• (1)NCBI的BLAST • http://blast.ncbi.nlm.nih.gov/Blast.cgi
38
一、序列比对
• (2)DNAStar软件的MegAlign:把多序 列存成.seq后缀文件 • (3)ClustalW软件:把多序列存成.txt后 缀文件
39
二、二级结构预测
1、PDB: http://www.rcsb.org/pdb/home/home.do
在结构生物学中占有中心地位,收集蛋白质 和其它大分子的结构数据。
三维结构的呈现:Jmol Viewer、KiNG Viewer、 SWISS-PDB Viewer
Jmol Viewer模式

22
Cartoon:彩带模型,这 种显示法使二级结构折 叠容易辨认。
30
SCOP:http://scop.mrclmb.cam.ac.uk/scop/
31
4.1 常用蛋白质数据库
P164、P165 表6-1
一、蛋白质序列数据库 二、蛋白质结构数据库 三、蛋白质结构分类数据库
32
4.2 蛋白质结构预测
一、序列比对
二、二级结构预测 三、结构域预测
33
四、三维结构预测
物信息学研究所
http://www.ebi.ac.uk/
它是 EMBL 的一部分。 1992 年由欧盟资助建立
在英国的一个非盈利性学术机构,也是生物信 息学研究与服务的欧洲中心。
12Байду номын сангаас

EBI开发多种生物学数据库,包括:
(1)核酸序列数据库(EMBL核酸序列数据库、Ensembl、 ENEST、MitBase Server、EDGP、Parasites等); (2)蛋白质序列数据库(SWISS-PROT、TrEMBL、InterPro 等); (3)基因组数据库; (4)序列结构分类数据库(DSSP、HSSP、DALI等); (5)大分子结构数据库(EBI-MSD等); (6)人类蛋白质数据库(HPI等); (7)序列图谱数据库(RHdb Server、GenomeMaps98等)
17
蛋白质基本性质分析
18
蛋白质基本性质分析 P186
• 如前图所示,在UniPort结果里可看到: (1)Computer pI/MW:蛋白质的等电点和分子量 (2)ProtParam:蛋白质的理化参数 (3)ProtScale:蛋白质的疏水性区域 (4)PeptideMass:蛋白质被特异切割(如胰蛋白 酶、糜蛋白酶、CNBr)的产物
1、从三大核酸数据库找蛋白序列
(2)EMBL • European Molecular Biology Laboratory, EMBL ,欧洲分子生物学实验室
10
• http://www.embl.org/
• EMBL核酸序列数据库,1980年建立
11
(2)EMBL European Bioinformatics Institute,EBI,欧洲生
15
• SWISS-PROT、PIR、TreEMBL见P170-173 • 目前UniProt数据库将以上3个数据库合并在一 起。 • 包括UniProtKB、UniRef和UniParc三部分 • UniProtKB:UniProt Knowledgebase
16
UniPort数据库链接:
http://www.uniprot.org/

Backbone:金属丝模型, 表示出多肽主链的走向, 在比较同一种分子的两 种构象时有用。
Jmol Viewer模式

23
Ball and Stick:球棍 模型,能显示原子水平 上的结构细节。可以估 计原子之间的相对距离, 对于评价氨基酸之间的 相互作用很重要。
CPK:实心球模型,球体 大小对应每个原子的范 德华半径。对评估配体 与结合位点的适合程度 非常有用。
34
蛋白质分析专家系统
Expert Protein Analysis System,ExPASy http://www.expasy.org/ 1994 年由瑞士生物信息学院( Swiss Institute of Bioinformatics,SIB)创建的世界上第一个 分子生物学网站,专门从事蛋白质序列、结构、 功能和蛋白质2D-PAGE图谱等的分析。 通 过 该 网 站 可 以 链 接 到 国 际 上 包 括 ENZYME 、 PROSITE 、 TrEMBL 、 SWISS-PROT 、 SWISS-2DPAGE 、 SWISS-3DIMAGE 等 数 据 库 的 相 关 站 点 , 以 及 SWISS-MODEL等软件工具。
44
(4) 分析结果 H:代表α-螺旋;E:代表β-折叠;-: 代表无规则卷曲。
Jpred二级结构预测
45
SOPMA预测结果
局部结构预测 蓝皮本P187 橙皮本P73
• 跨膜结构预测:TMPRET • 信号肽预测:SignalP • 卷曲螺旋(Coiled coil)预测:Coils
46
• 均可在http://www.expasy.org/proteomics 的Tools下找到相应程序
26
2、MMDB: http://www.ncbi.nlm.nih.gov/Structure
4.1 常用蛋白质数据库
蓝皮本 P164、P165 表6-1 橙皮本 P69 一、蛋白质序列数据库 二、蛋白质结构数据库
27
三、蛋白质结构分类数据库
三、结构分类数据库
• • • • 参见P182 SCOP CATH PDBsum
4.1 常用蛋白质数据库
蓝皮本 P164、P165 表6-1 橙皮本 P69 一、蛋白质序列数据库 二、蛋白质结构数据库
19
三、蛋白质结构分类数据库
二、蛋白质结构数据库

20
1、PDB(Protein Date bBank)

2、MMDB(Molecular Modeling
Database)
21
• • • • 统计学方法:Chou-Fasman法 物理化学方法:Lim法 神经网络和人工智能方法 混合方法
40
• 参见《蛋白质结构预测实验指南》电子版
Chou-Fasman法:根据20种氨基酸形成α螺旋、β-折叠、 β-转角的倾向性(P)来预测 • 20种氨基酸的Chou-Fasman参数
41
相关文档
最新文档