蛋白质分子对接方法中分子柔性处理与近天然结构筛选的研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
蛋白质-
杨峰1*,曹立彬1*,龚新奇2,常珊3,
陈慰祖1,王存新1,李春华1
1.北京工业大学生命科学与生物工程学院,北京100124;
2.清华大学生命科学学院,北京100084;
3.华南农业大学信息学院,广州510642收稿日期:2011-04-19;接受日期:2011-04-27
基金项目:国家自然科学基金项目(10974008),北京市自然科学基金项目(4102006),教育部博士点基金项目(200800050003),科技部国际科技合作项目(2010DFA31710),北京市教委科技创新平台-自然基础研究基金资助项目*共同第一作者
通讯作者:李春华,电话:(010)67392724,E-mail :chunhuali@
王存新,电话:(010)67392724,E-mail :cxwang@
摘要:蛋白质-蛋白质分子对接方法是研究蛋白质分子间相互作用与识别的重要理论方法。该方法主要涉及复合物结合模式的构象搜索和近天然结构的筛选两个问题。在构象搜索中,分子柔性的处理是重点也是难点,围绕这一问题,近年来提出了许多新的方法。针对近天然结构的筛选问题,目前主要采用三种解决策略:结合位点信息的利用、相似结构的聚类和打分函数对结构的评价。本文围绕以上问题,就国内外研究进展和本研究小组的工作作详细的综述,并对进一步的研究方向进行了展望。
关键词:蛋白质-蛋白质分子对接;分子柔性处理;结合位点信息;结构聚类;打分函数中图分类号:Q617
DOI :10.3724/SP.J.1260.2012.10065
引言
蛋白质是生命的物质基础,是生命体功能的主要执行者,它参与了生物体内众多生命
活动的过程,包括基因的复制、转录和翻译,细胞周期的调控,生化反应的催化,免疫系统的调节和信号转导等[1,2]。蛋白质功能的发挥往往需要与其它蛋白质分子发生特异性的识别和相互作用,错误的相互作用常常会导致疾病的发生[1]。因此,对于蛋白质分子间专一性识别与相互作用的研究具有重要的科学意义及应用价值。然而,目前通过实验的方法解析蛋白质-蛋白质复合物结构存在诸多困难:在X-射线衍射晶体学结构解析方法中,很多蛋白质复合物难以结晶;核磁共振波谱方法则只能用于解析序列长度不超过150个残基的小蛋白,且对样品的数量和纯度要求较高。因此,发展可靠的预测蛋白质-蛋白质复合物结
生物物理学报2012年1月第28卷第1期:ACTA BIOPHYSICA SINICA Vol.28No.1Jan.2012:15-22
15-22
15
ACTA BIOPHYSICA SINICA |Vol.28No.1|Jan.2012
Assessment of Prediction of Interactions ,网址:/msd-srv/capri )蛋白质复合物结构预测竞赛[3],目前已成功举办了24轮。在该竞赛的推动下,许多分子对接方法涌现出来,大大推动了这一领域的研究进展[4,5]。蛋白质分子对接主要包括两个阶段:复合物构象的采样和近天然结构的筛选。其中,如何合理而有效地处理蛋白质分子的柔性,以及如何准确地筛选复合物近天然结构,是分子对接方法中的重要研究课题,且极具挑战性[6,7]。从2005年CAPRI 第8轮竞赛开始,该竞赛设立了与结构预测平行的近天然结构筛选与打分竞赛,充分显示了发展快速准确的近天然结构筛选方法的迫切性和重要性。这里将结合本研究小组的工作,就蛋白质-蛋白质分子对接中分子柔性的处理,以及近天然结构的筛选问题的国内外研究进展进行系统综述。
对接方法中蛋白质分子柔性的处理
蛋白质分子具有一定的柔性,彼此间结合时,由于相互作用,常常会发生构象上的变化[1]。对于那些在结合前后发生较大构象变化的体系,对接中分子柔性的有效处理是复合物结构成功预测的关键[8,9]。发展柔性对接方法已成为近年来这一领域的主要发展方向。然而,柔性的引入会极大地增加分子的自由度,使得结合自由能曲面变得更加粗糙不平,同时还会引起计算时间的成倍增长,这对计算机的运算能力和近天然结构的识别都提出了严峻的挑战。受限于此,现有的柔性处理方法仅能考虑有限几种类型的分子柔性,且往往仅对两分子之一进行柔性处理。现将目前常用的分子柔性处理方法归纳如下。软化分子表面方法
软化分子表面方法是一类最简单的分子柔性处理方法。该方法通过在分子表面定义一个柔软的壳层,并允许该壳层在对接中发生一定程度的交叠,从而实现对分子表面柔性的处理。一些基于快速傅里叶变换算法的对接程序,如FTDock [10]和ZDock [11]等,采用分子的格点模型,表面具有一定厚度。它们在采样中对分子表面间的接触进行几何互补性加分,来允许表面层的交叠,从而考虑表面残基的柔性。我们小组建立的Softdock [12]和Palma 小组发展的BIGGER [13]对接程序,还通过该方法进一步考虑了分子表面上具有较长侧链的残基(Arg 、Lys 、Asp 、Glu 和Met )的柔性。这种方法虽然简单、容易实现,但也存在缺点。当分子由不同的模型返回到全原子模型时,界面处不可避免地会产生许多原子交叠,为了消除这些交叠,必须进行优化处理。多刚体方法
多刚体方法是一类重要的分子柔性处理方法,在处理大规模的构象变化方面具有其独特的优势。该方法首先对蛋白质分子的结构进行分析,寻找其结构上的铰链区,然后在该处将蛋白质分割成多个独立的刚性结构域;在对接进行中,分别将这些结构域与另一蛋白
16
似的分子柔性处理方法。这类方法的优点是,能够处理结构域之间大范围的构象变化;缺
点是只能考虑一个蛋白质的柔性,且铰链区位置识别的准确性对结果有很大的影响。
构象集合法
构象集合法是基于蛋白质分子间结合的构象选择模型提出来的。该模型认为:在生理
条件下,蛋白质分子在不同的构象之间涨落(其中包含结合态构象),蛋白质在结合中彼此
选择了对方的结合态构象[18,19]。依据这一模型,构象集合对接方法首先对蛋白质分子进行构
象采集,期望得到该分子的结合态结构。然后采用刚性对接方法对集合中的构象进行交叉
对接。构象集合的获得可以通过分子动力学(molecular dynamics,MD)模拟[20]、正则模分
析(normal modes analysis)[21,22]和主成份分析(principal components analysis)[23]等方法来实
现。另外,利用X-射线晶体学和NMR方法解析出来的结构也常常包含在这个构象集合
中。Bates小组[24]提出的对接算法和我们小组开发的BESDock[25]就属于构象集合法。这类方
法的优点是,通过采样获得分子的结合态结构,将柔性对接转化为刚性对接问题,从而简
化了柔性的处理过程。缺点是计算量较大,预测结果的优劣依赖于是否采集到了结合态构
象。另外有研究指出,对于柔性较小的蛋白质体系,该方法不但对结构的预测没有改进,
反而会增加错误结构的比率[26,27]。
均场方法
均场方法是针对蛋白质分子中柔性较大的loop区结构设计的柔性处理方法。该方法首
先获得loop区结构的构象集合,并对其中的每个构象赋予相同的分布权重;然后在对接
中,根据每一次采样所得结构的结合自由能的大小,按照玻尔兹曼分布重新赋予loop区不
同构象的权重;采样结束后,loop区通常会收敛于拥有较大权重的构象。Bastard等人开发
的MC2[28]和Zacharias等人开发的ATTRACT[29]对接程序都采用了这一方法。该方法的优点
是能够突出考虑柔性较大的loop区的构象变化;缺点是,如果受体和配体都有多个loop区
结构,那么分子间loop区结构的不同组合将给采样带来极大的计算量。
除了以上四类分子柔性处理方法外,人们还提出了针对侧链柔性的处理方案。如在RosettaDock[30,31]对接程序中,利用侧链的旋转异构体库(rotamer libraries)产生结合界面上
侧链不同构象的组合,并对这些组合用蒙特卡洛[30](Monte Carlo)方法来优化。Bonvin等
人开发的HADDOCK[32,33]对接程序则是通过模拟退火(simulated annealing)来优化复合物界
面上的侧链构象,同时也优化了主链构象。另外,SCWRL[34]和FireDock[35]对接方法还分别
采用了图论算法和MILP算法来处理侧链的柔性。需要指出的是,蛋白质分子主链柔性的
处理要比侧链柔性的处理更加重要,但却更加困难,目前很多小组都在积极开展这方面的
研究工作。
17
|ACTA BIOPHYSICA SINICA