5 蛋白质三级结构预测
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
至于最后建立三维结构模型则是非常困难的
• 线索化的主要思想: 利用氨基酸的结构倾向(如形成二级结构 的倾向、疏水性、极性等),评价一个序 列所对应的结构是否能够适配到一个给定 的结构环境中。
• 建立序列到结构的线索的过程称为线索化, 线索技术又称折叠识别技术。 • 线索化或者折叠识别的目标是为目标蛋白质 U寻找合适的蛋白质模板,这些模板蛋白质 与U没有显著的序列相似性,但却是远程同 源的。
wk.baidu.com
4. 常用建模服务器和软件简介
蛋白质三维结构预测服务通过因特网对公众 免费开放(同源建模):
瑞士生物信息研究所 SWISS-MODEL 丹麦技术大学生物序列分析中心 CPHmodels 比利时拿摩大学 ESyPred3D 英国癌症研究中心 3DJigsaw Accelrys Discovery Studio 软件 InsightII FAMS
预测结果准确率: • 对于具有60%等同的序列,用上述方法所建 立的三维模型非常准确。若序列的等同部分 超过 60% ,则预测结果将接近于实验得到的 测试结果。 • 一般如果序列的等同部分大于 30%,则可以 期望得到比较好的预测结果。
同源建模
数据库搜索
选择模板
依据模板构建骨架模型
环状、侧链的构建,优化
NO
结构合理性评估
YES
结构模型
分子式:pGlu-His-Trp-Ser-Tyr-Gly-Leu-Arg-Pro-Gly-NH
模 板 加模板
同源模建确定一对柔性分子相应功能团可能的空间取向
3. 同源建模法的局限性
传统的比较建模是通过 PSI-BLAST 找到 已知结构的相关蛋白。最近如进行 profile - profile 比较和有效利用结构信息的更加 复杂的方法已不仅显著增加了比对的质量而 且远程同源 (remote homologue) 检测的能力。 因此,比较建模和折叠识别在基于模板的建 模方法中的区别现已十分模糊。开发新的比 较建模和折叠识别的算法导致网上各种预测 方法的出现,这包括结构预测 meta- 服务器。
Thanks for your attention!
The end~
用Swiss-model分析如下序列,进行三级 结构建模,取3个结果,并分析所得模型
• MSSGQCRSANAEDAQEFISDVERAIETLI IKNFHQSYSSVESNLAIGGKESTLTPSEL RDLVTQQLLLKSSKPHLMPSNCGLEEKI ASNLGSCKKNDSKLEEFRSFWAELLIGE AAKKSSVKLERPVRGH;
• 令代表核心折叠C中的环到序列S中空位的 映射,显然是通过线索化而确定的。
令f(t)是进行比对的得分函数,其定义如下:
f(t) = g1 (v,t) + g2 (u,v,t) + g3 (,t)
• g1 (v,t) 评价氨基酸残基v所处的位置 • g2 (u,v,t) 评价残基u和v的相对位置,如果u和v 键合,则得 分高; • g3 (,t)评价环区,根据环区的大小进行打分。
C1, C2,„, Cm为数据库中核心折叠C的m个核心区域 Cij为第i个核心区域第j个氨基酸位置
每一个核心区域由若干个氨基酸残基构成
• 设t是一个从序列到核心折叠的线索,那么t 说明了序列S的哪些元素si,sj,sk,…代表核心 区域C1, C2, C3,…的起始位置。 这实际上是一种从序列S到核心折叠C的比对
1)片段组装法:SWISS-MODEL 2)距离几何法:MODELLER
同源蛋白质结构预测的方法
SWISS-MODEL: http://swissmodel.expasy.org//SWISS-MODEL.html
SWISS-MODEL: http://swissmodel.expasy.org//SWISS-MODEL.html
从头预测法
原子间作用力
蛋白质的势能
能量函数
蛋白质的势能
基于能量最小化的从头预测法 • 基本步骤 选择蛋白质能量函数模型 选择三维结构的表示方法 选择三维结构的评价函数 选择寻找最优结构的优化方法 •关键问题 大规模非线性规划 大量的局部极小点 在计算时间和准确度之间寻找平衡
最优化方法
非线性规划 最速下降法 牛顿法 共轭梯度法
提交查询序列
SWISS-MODEL的工作过程:
模板序列与查询 序列的装载 结构的精细比对
分子骨架的形成
侧链形成和优化 能量最小化、 结构封装
14
加入氢原子、 优化回环
最后的预测结果
15
穿针引线法
蛋白质具有很少的折叠类型(<1000)
• 基本步骤 将目标蛋白质序列与已知的折叠进行比对 将目标序列“安装”到选择的模板结构上 对模型进行优化、调整 检验模型的合理性 • 关键方法 序列-结构比对
• 线索化方法一般有5个基本组成部分: (1)已知三维折叠结构的数据库; (2)一种适合于进行序列-结构比对的三维折 叠信息的表示方法; (3)一个序列-结构匹配函数,该函数对匹配 程度进行打分; (4)建立最优线索的策略,或者是进行序列结构比对的策略; (5)一种评价序列-结构比对显著性的方法。
线索化问题:
对于给定的序列S和核心折叠C,选择一个线索t,使得f(t)的 值最小,即寻找一个从S到C的最佳映射。
穿针引线法 • • • • • 动态规划 人工神经网络 分支定界法 线性规划 Monte Carlo方法
• 理论基础 蛋白质的天然构象是热力学最稳定构象、也是 能量最低构象 • 能量函数 通过原子间作用力计算出的热力学能量 精确,但难以计算 • 伪能量函数 根据已知的三维结构知识得到的势能函数 常见 的结构 → 低能量 • 不常见的结构 → 高能量 • 极罕见的结构 → 极高能量
蛋白质结构预测
肖 飞
蛋白质三级结构预测的方法
1
2 3
方法比较
同源建模(比较建模)
基础 - 相似的序列结构相近 - PDB结构数据库的快速增长 - 结构基因组学的启动 - 发散进化 特点 - 相对精确可靠
• 假设待预测三维结构的目标蛋白质为U (Unknown),利用同源模型化方法建立结 构模型的过程包括下述6个步骤: (1)搜索结构模型的模板(T) (2)序列比对 U T (3)建立骨架 (4)构建目标蛋白质的侧链 (5)构建目标蛋白质的环区 (6)优化模型
• 全局优化方法 遗传算法 分解-结合法 离散化方法
分子动力学
• 方法 对蛋白质中原子间的作用力进行建模 用动力学方程跟踪蛋白质折叠时每个原子的位置 求解这些方程的解析解是极其困难的 用离散动力系统的方法来确定数值解
• 问题 模拟蛋白质折叠过程是非常消耗时间的 模拟 10-9 秒的蛋白质折叠过程大约需要一天时间 蛋白质的实际折叠时间大约在 10-4 秒的数量级或者更 多 需要超级计算机
假设存在有限数目的核心折叠(core folds) • 核心折叠实际上是构成蛋白质空间形状的基 本模式。 • 建立核心折叠数据库 • 预测---- 建立线索 U序列
与数据库核 心折叠比对
取最佳核 心折叠
U结构模型
• 一种基于序列与结构比对的最优线索化算法 令: s1 ,
s2,„, sn为蛋白质序列S的n个元素
新的趋势 混合预测方法 在比较建模法和折叠识别法中使用从头预 测法来预测部分难以找到模板的片断 在从头预测法中使用二级结构预测的结果 和其他已知结构信息辅助建模
• Meta-predictor 使用多个预测方法 对收集的结果进行综合比较和分析 改进收集的结果
本章小结
• 重点介绍一些常用的蛋白质结构分析技术 获取蛋白质结构的实验方法 预测蛋白质结构的理论方法 蛋白质结构比对 蛋白质二级结构预测 蛋白质三级结构预测 • 随着蛋白质分析技术的不断深入,将促进我们从 系统生物学的层次全面了解蛋白质的生物学功能
穿针引线方法(折叠识别方法) • 有很多蛋白质具有相似的空间结构,但它们 的序列等同部分小于25%,即远程同源。
• 对于这类蛋白质,很难通过序列比对找出它 们之间的关系,必须设计新的分析方法。
• 对于一个未知结构的蛋白质(U), 如果找到一个已知结构的远程同源蛋白质 (T), 那么可以根据T的结构模板通过远程同源模型 化方法建立U的三维结构模型。
U T(远程同源)
一个远程同源模型化方法要解决三个问题: (1)检测远程同源蛋白质(T); (2)U和T的序列必须被正确地对比排列; (3)修改一般的同源模型化过程,以应用于相似度 非常低的情况,即处理更多的环区,建立合理的三 维结构模型。 如何解决第一个和第二个问题? 序列→结构比对 • 基本思想是建立一个从U到已知结构T的线索,并通 过一些基于环境或基于知识的势,评价序列与结构 的适应性。