生物大分子的计算机模拟方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

模建(modeling)



蛋白质的三维结构模建是从氨基酸序列出 发理论预测蛋白质的三维结构 基本假设:Anfinsen原理 模建研究的意义

中心法则的延伸—第二遗传密码 蛋白质结构测定的速度远远落后于序列测定的 速度,使理论预测的方法成为一种迫切的需要

到2001年12月,已知的蛋白质序列接近60万条,而 测定了三维结构的蛋白质仅为16917个 蛋白质三维结构的测定已经成为生命科学发展的 “瓶颈”
分子模型的动力学变化研究 大分子体系低能构象的模建 X射线晶体学和NMR中的结构优化

第一节 生物大分子的计算机模 拟

生物大分子的计算机模拟方法 蛋白质三维结构的模建 核酸结构的模拟
蛋白质三维结构的模建





模建(modeling) 蛋白质结构的基本概念 蛋白质结构预测的从头计算 同源和比较模建方法 蛋白质折叠类型识别法 蛋白质二级结构预测 蛋白质结构预测方法准确性的评估 应用实例
c1
N f y
H
O
蛋白质结构预测的从头计算

从头计算法(ab initio)
搜索分子的构象空间,找到最合适的构象 基本假设:天然构象 = 能量最低构象 (?)



搜索构象空间的方法 蛋白质的简化模型
特点:不依赖于已知的结构模式,是一种 普适的解决方法,目前尚处于探索阶段
同源和比较模建方法
计算结果精确度高,限于计算机的计算能力, 能够计算的体系小 从头计算方法:100个原子;半经验计算: 1000-10,000个

目前,生物大分子体系还不能用量子力学方法
分子力学

分子力学是一种近似处理方法

忽略电子的运动,将体系的势能看作是原子核 位置的函数

力场:分子体系的势能函数
分子的势能 = 键伸缩能 + 键角扭曲能 + 扭转 势能 + 非键相互作用项 函数形式和参数 力场是经验的

主要步骤



同源和比较模建方法

影响同源模建质量的因素
序列相似性大小(插入和删除片断)>30% 序列比对的准确性


序列比对(sequence alignment)

将两个或多个序列之间的相似区域和保守性位 点对齐以分析它们的相似程度
在同源模建中非常重要,影响结构预测的准确 性 程序:


特点:
能够计算含有大量原子的体系 简单有效,目前应用得最广泛

分子力学描述的原子间相互作用
分子动力学

分子动力学是建立在牛顿力学基础上的一 种分子模拟方法

将分子体系的运动看作是在势能面中质点的运 动,求解运动方程可得到体系中所有原子的轨 迹,从轨迹中可计算得到各种性质

特点:可以搜索很大的构象空间,模拟时 间在纳秒级 应用
Query: 29 IGIYKWHYSGLNRWHGAGSTADFQKIIQERCDTYTQTIRPGSRSRNCQAIRQAFMSAFIS 88 +G+ W S + G+T I+ RC TYT+ + P R+++C+ I F SAF+S Sbjct: 40 VGVLTWRQSSM-----GATDHVSAIVLGRCLTYTRNMHPELRNQDCKKILNTFTSAFVS 93 Query: 89 KDPCKATKEDYNSLINLAPPTVPCGQQVFWSKTKELAHEYAKRRRLMTLEDTLLGYLAD 147 KDPC TKEDY LI+L TVPC + +FWS++KELAH+Y+ ++ + TLEDTLLGY+AD Sbjct: 94
生物大分子的计算机模拟
生物大分子的计算机模拟

生物大分子的计算机模拟方法 蛋白质三维结构的模建 核酸结构的模拟
生物大分子的计算机模拟方法

Baidu Nhomakorabea
量子力学 分子力学 分子动力学
量子力学


量子力学是微观世界物质运动的普遍规律 一个分子体系的状态可以用Schrodinger方程 来表示,通过求解Schrodinger方程可以得到 分子体系的结构和性质 量子力学方法的特点:

根据蛋白质结构的相似性,以已知蛋白质的结构 为模板构建未知蛋白质的三维结构


在进化过程中蛋白质三维结构的保守性远大于序列的 保守性,当两个蛋白质的序列同源性/相似性高于35% 时,一般情况下它们的三维结构基本相同 同源模建方法是目前最常被采用的也是最成功的结构 预测方法 确定模板 确定未知蛋白质与已知结构蛋白质的序列比对 确定结构保守性的主链结构片断 构建结构变化的区域 侧链模建

蛋白质结构的基本概念

蛋白质的二级结构单元
a螺旋 b折叠股(b-strand)和b折叠片(b-sheet) 环(loop) b-转角(b-turn)


蛋白质的结构可以通过旋转键的扭角来确 定
主链扭角:f, y, w 侧链扭角:c1, c2, …

描述蛋白质结构的扭角
c2
H N w


BLAST http://www.ncbi.nlm.nih.gov/BLAST/
BLAST序列比对的实例
Score = 233 bits (593), Expect = 4e-61 Identities = 118/251 (47%), Positives = 162/251 (64%), Gaps = 9/251 (3%)

蛋白质折叠类型识别法:又名穿针引线法 (threading)

针对那些没有明显的同源性但又采取类似结构的蛋白 质 将一个序列与蛋白质折叠库中的所有结构类型进行匹 配,找出最接近的一种 需要构建非重复的蛋白质折叠模式库



常用的程序
蛋白质三维结构的模建





模建(modeling) 蛋白质结构的基本概念 蛋白质结构预测的从头计算 同源和比较模建方法 蛋白质折叠类型识别法 蛋白质二级结构预测 蛋白质结构预测方法准确性的评估 应用实例
同源和比较模建方法

互联网上的同源模建服务器

SWISS-MODEL http://www.expasy.ch/swissmod/SWISSMODEL.html
蛋白质折叠类型识别法

蛋白质的折叠模式是有限的


自然界中蛋白质家族的数目大约为23100个,现有的蛋 白质结构分属600个家族,其中折叠模式只有约300种 估计蛋白质的折叠模式的总数在几百到一千种
相关文档
最新文档