蛋白结构预测
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
度>60%完全可以找到正确的比对
折叠识别法如能找到同一家族的远源
同源蛋白则可得到较好的预测结果
从头预测方法很难产生准确的结构
28
蛋白质结构域分析
29
The End
?
? ?
?
30
对于一目标蛋白,存在远源同源蛋白(序列
相似程度<25%,但结构相似),则通过搜 索与目标蛋白具有相同构象的远源同源蛋白, 从而建立未知蛋白三维结构的大致模型,最 后对模型进行评估
24
从头预测方法
根据序列本身来预测其结构
可以用来预测任何一种蛋白质
是三种方法中难度最大的 基于一种假设-蛋白质折叠为能量
构的蛋白质数量的差距正逐步拉大
3
为什么要研究蛋白质结构?
分析蛋白质结构有助于药物设计
研究
有助于了解蛋白质相互作用,这
对于生物学、医学和药学都是非 常重要
4
蛋白质结构预测
The Holy Grail of bioinformatics
MADWVTGKVTKVQNWTDAL FSLTVHAPVLPFTAGQFTKLG LEIDGERVQRAYSYVNSPDN PDLEFYLVTVPDGKLSPRLAA LKPGDEVQVVSEAAGFFVLD EVPHCETLWMLATGTAIGPYL SILRLGKDLDRFKNLVLVHAA RYAADLSYLPLMQELEKRYE GKLRIQTVVSRETAAGSLTGR IPALIESGELESTIGLPMNKET SHVMLCGNPQMVRDTQQLL KETRQMTKHLRRRPGHMTA EHYW
?
5
蛋白质结构预测
蛋白质序列
结构
生物学功
能 从数学上讲,指蛋白质的氨基酸线 性序列到蛋白质所有原子三维坐标 的映射 自然界存在的蛋白质数目有限,蛋 白质结构预测是可能的
6
蛋白质结构数据来源
X晶体衍射(X-ray 核磁共振(NMR
crystallography)
spectroscopy)
最低的形式
准确率较同源模建法要低(序列相
似性<30%)
25
SwissModel预测
26
RasMol
http://www.rasmol.org Available for: •Windows •Unix/Linux •MacOS
27
预测方法评价
公共蛋白质评测系统CASP
评测表明:
同源建模序列比对是关键,序列相似
PSIPRED
http://bioinf.cs.ucl.ac.uk/psipred/
NNPREDICT
http://www.cmpharm.ucsf.edu/~nomi/nnpredict.html
Chou and Fassman
http://fasta.bioch.virginia.edu/fasta_www/chofas.htm
依据蛋白序列与已经结构蛋白比对信息构建
3D模型
折叠识别法(Threading fold recognition)
寻找与未知蛋白最合适的模板,进行序列与结
构比对,最终建立结构模型
从头预测法(Ab initio/de novo methods)
根据序列本身来从头预测蛋白质结构
20
同源建模法
X射线衍射
电子密度图
9
10
蛋白质结构测定总流程
11
蛋白质二级结构预测
12
二级结构预测
预测的基本依据:每一段相邻的氨
基酸残基具有形成一定二级结构的 倾向
蛋白质中约85%的氨基酸残基处于3
种基本二级结构状态(α螺旋、β折 叠和转角)
13
二级结构预测
二级结构预测的目标是判断每一个
氨基酸残基是否处于α螺旋、β折 叠和转角(或其它状态)之一的二 级结构态,即三态
通常为蛋白质空间结构预测的第一
Байду номын сангаас
步
14
JPred服务器二级结构预测
输入 序列
15
JPred预测结果
α螺旋
β折叠
16
二级结构预测网站
PHD
http://cubic.bioc.columbia.edu/predictprotein/
JPRED
http://www.compbio.dundee.ac.uk/~www-jpred/
22
同源模建步骤
④
构建目标蛋白质的侧链
旋转异构体库搜索方法等
⑤
构建目标蛋白质的环区
从已知的环区构象中选择一最优构象
⑥
优化模型
寻找结构中出现异常的构象
23
线索化方法(折叠识别方法)
定义: 先假设一个特定的蛋白构象,然后对这一构 象进行评估的过程叫线索技术又称折叠识别 技术
线索化的主要思想:
蛋白质三维结构预测的主要方法
任何一对蛋白质,如果两者的序列等
同部分超过30%(序列比对长度大于 80),则它们具有相似的三维结构
蛋白质结构要比序列保守很多
21
同源模建步骤
①
搜索与目标蛋白序列相似的模板 蛋白
BLAST搜索
②
目标序列与模板序列比对
ClustalW/X
③
建立骨架
将模板结构叠加起来,找结构保守区域
17
蛋白质三级结构预测
18
蛋白质三级结构预测
3D预测是可能的,因为:
序列信息决定三级结构
序列相似性 (>30%)倾向于结构相
似性 3D预测是必须的,因为: DNA 序列 蛋白质序列 结构
空间
19
蛋白质三级结构预测三种方法
同源建模法(Comparative homology modeling)
低温电子显微镜(cryo-electron
microscopy)
NMR
显微镜
7
两种主要的结构测定方法
X-射线衍射法 最准确 在体外进行 需要结晶的蛋白 NMR(核磁共振) 较准确 在体内 不需要结晶 限定在小分子量蛋白
8
蛋白质结构数据来源
X射线流程:
克隆/表达/纯化 结晶
蛋白质结构预测
1
蛋白质结构为什么如此重要的?
DNA 序列
转录&翻译
蛋白质序列
折叠
蛋白质结构
氨基酸序列只有折叠成特定的空间结构 才具有相应的活性和相应的生物学功能
2
为什么要研究蛋白质结构?
生物体中许多重要的功能由蛋白质
完成
分析蛋白质结构、功能及其关系是
蛋白质组计划中的一个重要组成部 分
已知序列的蛋白质数量与已测定结