【核心知识】蛋白质折叠的热力学和动力学
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
蛋白质折叠的热力学和动力学
药学院 10489629 苟宝迪
蛋白质是一种生物大分子,基本上是由20种氨基酸以肽键连接成肽链。肽链在空间卷曲折叠成为特定的三维空间结构。有的蛋白质由多条肽链组成,每条肽链称为亚基,亚基之间又有特定的空间关系,称为蛋白质的四级结构。所以蛋白质分子有非常特定的复杂的空间结构。诺贝尔奖得主Anfinsen认为每一种蛋白质分子都有自己特有的氨基酸的组成和排列顺序,由这种氨基酸排列顺序决定它的特定的空间结构。具有完整一级结构的多肽或蛋白质, 只有当其折叠形成正确的三维空间结构才可能具有正常的生物学功能. 如果这些生物大分子的折叠在体内发生了故障, 形成错误的空间结构, 不但将丧失其生物学功能, 甚至会引起疾病.蛋白质异常的三维空间结构可以引发疾病,疯牛病、老年性痴呆症、囊性纤维病变、家族性高胆固醇症、家族性淀粉样蛋白症、某些肿瘤、白内障等等都是“折叠病”。 蛋白质折叠的研究(图1[1]),是生命科学领域的前沿课题之一。不仅具有重大的科学意义,而且在医学和在生物工程领域具有极大的应用价值。
图1
蛋白质折叠的热力学研究
蛋白质折叠的研究,比较狭义的定义就是研究蛋白质特定三维空间结构形成的规律、稳定性和与其生物活性的关系。这里最根本的科学问题就是多肽链的一级结构到底如何决定它的空间结构?X-射线晶体衍射是至今为止研究蛋白质结构最有效的方法, 所能达到的精度是其它任何方法所不能比拟的. 但是, 蛋白质分离纯化技术要求高, 蛋白质晶体难以培养,
晶体结构测定的周期较长, 从而制约了蛋白质工程的进展. 随着近代物理学、数学和分子生物学的发展, 特别是计算机技术的进步, 人们开始用理论计算的方法, 利用计算机来预测蛋白质的结构. 同源模建方法是最常用、最有效的蛋白质结构预测方法. 但是, 利用同源模建方法预测蛋白质结构时, 需用同源蛋白质的已知结构作为模板. 当缺乏这种模板结构时, 预测则很难奏效. 这是该方法的天生缺陷. 是否能从蛋白质序列出发, 直接预测蛋白质的结构?
从理论上最直接地去解决蛋白质的折叠问题,就是根据测得的蛋白质的一级序列预测由Anfinsen原理决定的特定的空间结构。蛋白质氨基酸序列,特别是编码蛋白质的核苷酸序列的测定现在几乎已经成为常规技术,利用分子生物学技术可以从互补DNA(cDNA)序列可以推定氨基酸序列,大大加速了蛋白质一级结构的测定。目前蛋白质数据库中已经存有大约17万个蛋白的一级结构,但是测定了空间结构的蛋白大约只有1.2万个,这中间有许多是很相似的同源蛋白,已经有人根据基因组的数据用统计方法重新估计了蛋白质折叠类型数目大约为1000种。
“蛋白质结构预测”属于理论方面的热力学问题,蛋白质分子结构本身的复杂性决定了结构预测的复杂性。目前结构预测的方法大致可分为两大类。一类是假设蛋白质分子天然构象处于热力学最稳定,能量最低状态,考虑蛋白质分子中所有原子间的相互作用以及蛋白质分子与溶剂之间的相互作用,采用分子力学的能量极小化方法,计算出蛋白质分子的天然空间结构。第二类方法是利用存入蛋白质数据库的数据进行预测相比,基于同源性的重复循环技术非常可靠地灵敏地进行结构预测。找出数据库中已有的蛋白质的空间结构与其一级序列之间的联系总结出一定的规律,逐级从一级序列预测二级结构,再建立可能的三维模型,根据总结出的空间结构与其一级序列之间的规律,排除不合理的模型,再根据能量最低原理得到修正的结构。但是,第一类方法遇到在数学上难以解决的多重极小值问题,而逐级预测又受到二级结构预测精度的限制。
图2[2]为蛋白质折叠研究的漏斗模型。从能量的角度看,漏斗表面上的每一个点代表蛋白质的一种可能的构象,变性状态的蛋白质构象位于漏斗顶面,漏斗最底部的点表示用X-射线单晶衍射或NMR测定的蛋白质天然构象,而漏斗侧面的斜率用来说明蛋白质折叠路径(图3[1])。
图2
图3蛋白质肽链可能存在的构象似乎是无穷无尽的,事实上,肽链寻求的是能量最低的构象。蛋白质的天然构象不仅主要是肽链内部和肽链之间的相互作用,很大程度上也取决于肽链和水分子的相互作用,应为蛋白质一般处于水环境中。在水中,蛋白质的非极性部分倾向于形成非极性聚集体,也就是疏水作用。现在越来越多的人已认识到, 在肽链序列上相隔较远的氨基酸残基间的疏水作用力对维持和稳定蛋白质分子的构象具有重要影响.疏水作用的影响使得蛋白质折叠模型具有一个疏水核。在预测蛋白质结构时, 面临的困难之一是: 我们所研究的系统要比化学家研究的系统复杂得多. 因而在研究中, 往往要把问题简化. 蛋白质肽链可看成是一个刚性的平面结构. 各个氨基酸侧链之间的差异不仅在于大小和形状, 而且在于它们所具有的理化性质, 特别是侧链所带的电荷以及对水的亲疏性.蛋白质结构预测方法总体上可分为三大类, 即比较建模法、反向折叠法和从头预测法. 近年来, 比较建模法和反向折叠法的研究都已取得重要的进展, 一些商品化计算机软件已投入使用, 并不断被改进. 如Composer 和Threading 等. 这两类方法的共同点是, 在预测目标蛋白质的结构时都要利用已知的结构数据库. 当目标蛋白质找不到同源蛋白质, 或同源性过低时这些方法都无法奏效. 而从头预测法仅利用氨基酸序列和模拟氨基酸间相互作用的模型来预测目标蛋白质的空间结构, 因此具有更大的挑战性. 总体上说, 蛋白质结构的从头预测法涉及三方面的工作[4]. 一是归结出能更好地反映氨基酸间相互作用和环境条件等的数学模型; 其次是建立更有效地区分目标结构正确与否的识别方法; 三是发展更高效的搜索方法用于功能构象的搜索. 适用于蛋白质折叠模拟的具体算法作些介绍, 它们是Monte Carlo 方法、遗传算法和混合遗传算法.
近年来, 蛋白质结构预测, 特别是蛋白质折叠预测方面的研究不断取得新的进展. 从
头预测法用于蛋白质折叠预测获得了很好的结果, 几个研究小组对若干测试蛋白质所作的
预测与X-射线衍射测定的折叠结构已相当接近,见图4[3]。
图4
蛋白质折叠的动力学研究
蛋白质折叠第二个根本的科学问题是具有完整一级结构的多肽链又是如何折叠成为它特定的高级结构?这是一个折叠的动力学的问题,长期以来,主要用体外的实验方法研究,虽然已有四五十年,但至今尚未解决。我们知道,多数蛋白质在体外是不稳定的,外界环境的变化,如温度、酸度等,都可以导致其空间结构的破坏和生物活性的丧失,但却并不破坏它的一级结构,这称为蛋白质的变性。对蛋白质变性作用的认识是我国科学家吴宪在三十年代基于他在国内的工作首先提出来的,长期以来已经为国际上广泛接受。变性的蛋白质往往成为一条伸展的肽链,由于一级结构仍然完整,根据Anfinsen原理它应该可以在一定的条件下重新折叠成原有的空间结构并恢复原有的活性。这就是长时间来在体外研究蛋白质折叠的基本模型。
目前的实验和理论研究多以小分子量、单链蛋白质为模拟体系, 这类蛋白质通常可采用稀释法折叠、复性, 其中研究最多的模型蛋白是溶菌酶[5]。实际上,研究者所采用的蛋白质体系为简单体系, 其折叠过程机理和动力学与实际体系相差甚远。绝大多数蛋白质从一条伸展的肽链,折叠成有其特定结构的、有活性的蛋白质,并不是一步完成的,而要经过许多折叠的中间状态。含有多个亚基的蛋白质分子,亚基间的相互作用使之组装成复杂蛋白分子。研究人员用实验方法,特别是近年来发展的快速测定方法去追踪蛋白质重折叠的全过程,尽可能捕捉折叠过程中的每一个中间状态。不同阶段的折叠速度不同,有的比较慢,比较容易发现和捕捉;但有的非常快,必须要有特殊的设备配合各种测试技术去进行研究。最近有人尝试大幅度降低温度使折叠速度减慢而得以追踪。最终,人们要定量地描述整个折叠的动态过程。图5[6]给出计算机模拟蛋白质折叠轨迹的例子。
图5