蛋白质结构的测定、预测和转换
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
蛋白质结构:
蛋白质分子是由氨基酸首尾相连缩合而成的共价多肽链,但是天然蛋白质分子并不是走向随机的松散多肽链。
每一种天然蛋白质都有自己特有的空间结构或称三维结构,这种三维结构通常被称为蛋白质的构象,即蛋白质的结构。
蛋白质结构现在的研究动态
每一种天然蛋白质都有自己特定的空间结构,而研究蛋白质的特定空间结构及结构的特定运动与其生物学功能的关系对阐述生命现象具有重要意义!
蛋白质的序列结构的研究测定
经典的蛋白质的氨基酸序列分析方法有两种:
1液相蛋白质序列仪
2固相和气相的蛋白质序列分析仪
利用以上分析仪方法可分析一段DNA的核苷酸序列,从而转译出与之对应的氨基酸序列,此法现已成为研究含量微的蛋白质的主要方法[1]。
质谱对蛋白质(肽)氨基酸序列的分析
通过串联质谱技术(MS/MS)和源后衰减基质辅助的激光解吸/离子化(PSD-MALDI-MS),人们就可以从质谱分析中获得肽及蛋白质的结构信息[2]。
蛋白质三维结构的研究
X射线单晶衍射分析
X射线单晶衍射分析一直是蛋白质三维空间结构测定的主要方法, X射线衍射法的分辨率可达单个原子的水平,使它可以测定亚基的空间结构、各亚基间的相对拓扑布局,还可清楚的描述配体存在与否对蛋白质的影响。
核磁共振技术(NMR)分析
多维核磁共振波谱技术已成为确定蛋白质和核酸等生物分子溶液三维空间结构的唯一有效手段[3],而且它能对在溶液中和非晶态的蛋白质进行测量。
蛋白质二维结晶及其电子晶体学的结构分析
蛋白质二维结晶及其电子晶体学的结构分析是目前结构生物学最活跃的领域之一。
此法既适用于水溶性蛋白质,也适用于脂溶性膜蛋白的研究。
电子晶体学已发展为X射线晶体学所不能替代的生物大分子空间结构分析的有效手段[4]。
蛋白质溶液构象的光谱技术
紫外-可见差光谱
蛋白质在紫外区的光吸收是由于芳香族氨基酸侧链吸收光引起的,而在可见区的研究则限于蛋白质-蛋白质、酶-辅酶、酶-底物的相互作用以及入生色团等.差光谱的产生是基于生色团经受一定的环境变化时,吸收峰发生位移,吸光度和谱带半宽度也有改变。
根据差光谱的光谱参数,可以推断这些生色团在大分子中是隐藏的、半暴露的还是完全暴露的[5].
荧光探针法
荧光光谱法是研究蛋白质分子构象的一种有效方法,它能提供包括激发光谱、发射光谱、斯托克斯位移、荧光强度、总荧光量、量子产率、荧光偏振和荧光寿命等参数,这些参数从各个角度反映了分子的成键和结构情况。
通过这些参数的测定,不但可以做一般的定量分析,而且还可以推断蛋白质分子在各种环境下的构象变化,从而阐明蛋白质分子在各种环境下的构象变化,进而阐明蛋白质结构与功能之间的关系。
圆二色谱
圆二色性和旋光色散都可用于测定分子的立体结构。
旋光色散利用不对称分子对左、右圆偏振光折射的不同进行结构分析,而圆二色性则利用不对称分子对左、右圆偏振光吸收的
不同进行结构分析[6]. 通过圆二色的测定和计算可以了解蛋白质分子在溶液状态下的二级结构。
圆二色对构象变化敏感, 它可灵敏的检测一些反应引起的构象变化,特别是用于观测蛋白质的变性是非常方便的。
激光拉曼光谱
拉曼光谱是研究分子振动和转动光谱的重要手段,它是没有任何遮蔽效应的不破坏样品的光谱技术之一,可提供的蛋白质结构信息很丰富,还可在生理环境或活体中做实验,能更真实地反映生命过程。
其中,紫外-共振拉曼光谱成功的利用蛋白质在紫外区具有吸收性质,使紫外共振激发蛋白质分子成为可能,在很大程度上提高了拉曼散射截面,而且紫外激发消除了荧光干扰,提高了信噪比[7]。
蛋白质结构测定研究发展动态
质谱在蛋白质氨基酸序列分析中的应用,因近年来,在离子化的技术及仪器方面取得了突破性进展,使得质谱所能测定的分子量的范围大大超出了10ku。
因此,软离子化技术、基质辅助的激光解吸/离子化(MALDI)和电喷雾离子化(ESI)显得尤为有前途。
其中,国际上的研究动向也正是将化学降解法或酶降解法同质谱技术相结合,以开创一种快速、便宜、精度高、灵敏度高而又通用的序列测定技术。
蛋白质结构的预测
蛋白质结构预测的目的在于揭示蛋白质氨基酸序列与蛋白质空间结构之间的关系,进行蛋白质高级结构预测,为进一步的结构与功能研究及分子设计提供基础。
蛋白质结构预测问题是分子生物学的中心法则中尚未解决的内容,被称之为第二代遗传密码问题。
该问题的解决不仅具有理论意义,而且对于生物技术的发展具有重要的指导意义。
蛋白质结构预测研究现状
蛋白质的功能是由蛋白质的结构决定的,为了研究蛋白质分子结构的基本规律,人们用不同的方法,从不同的角度对已知蛋白质进行分类[8.9]。
一方面是基于生物功能,另一方面是基于结构自身,其中也曾将二者结合在一起来进行分类。
蛋白质结构预测的方法
第一类方法是假设蛋白质分子天然构象处于热力学最稳定,能量最低状态,考虑蛋白质分子中所有原子间的相互作用以及蛋白质分子与溶剂之间的相互作用,采用分子力学的能量极小化方法,计算出蛋白质分子的天然空间结构[10.11].
第二类方法是找出数据库中已有的蛋白质的空间结构与其一级序列之间的联系总结出一定的规律,逐级从一级序列预测二级结构,再建立可能的三维模型,根据总结出的空间结构与其一级序列之间的规律,排除不合理的模型,再根据能量最低原理得到修正的结构,这也就是所谓“基于知识的预测方法”。
蛋白质结构预测的理论预测方法
(1)比较建模法[12]。
比较建模法(同源建模法)是基于知识的蛋白质结构预测方法。
这一方法目前主要是指同源结构预测。
它是在未知蛋白质中有同源结构可以参考的情况下应用的一种技术。
它可以根据同源结构中保守的部分搭建出未知蛋白质的结构骨架。
同源蛋白质具有相似的结构和功能。
所以利用结构已知的同源蛋白质可以建立目标蛋白质的结构模型,然后用理论计算方法进行优化。
利用同源模建方法建立的蛋白质模型是以已知的同源蛋白质结构为基础的,所以这是一种基于现代生物学知识的预测方法。
(2)反向折叠法[13].它可以应用到没有同源结构的情况中,且不需要预测二级结构,即可直接预测三维结构,从而可以绕过现阶段二级结构预测准确性不超过的限度,因此是一种有潜力的预测方法。
它的主要原理是把未知蛋白质的序列和已知的这种结构进行匹配,找出一种或几种匹配最好的结构作为未知蛋白质的预测结构。
它的实现过程是总结出已知的独立的
蛋
白质结构模式作为未知结构进行匹配的模板,然后经过对现有的数据库的学习,总结出可以区分正误结构的平均势函数作为判别标准,来选择出最佳的匹配方式。
(3)从头预测法[14]。
它要求方法本身可以指根据蛋白质的氨基酸序列来预测蛋白质的二级结构和高级结构,从理论上讲是最为理想的方法。
从头预测法又可细分为,二级结构预测、超二级结构预测、蛋白质结构类型预测、蛋白质折叠模式预测、详细的三维结构的直接预测等。
从蛋白质序列预测空间结构是蛋白质结构预测的最终目标。
蛋白质结构预测的阶段
蛋白质结构预测可以分为不同阶段,主要包括:根据蛋白质的氨基酸组成和顺序预测蛋白质的结构类型;根据一个多肽链的氨基酸顺序预测其二级结构;预测蛋白质特定的三级结构,进一步预测蛋白亚基组装成完整的具生物活性的蛋白分子,并评测其相关理化特性。
(1)蛋白质结构类型的预测
蛋白质结构类型的预测是指预测未知蛋白质的结构属于全αβ蛋白质,全β类蛋白质(主要由β折叠组成的蛋白质),还是α/β类,或α+β类[15]。
结构类型预测出可以让人们了解蛋白质结构折叠的大致情况外,对二级结构的预测也很有帮助。
现在结构类型预测方法主要有根据光谱数据预测,神经网络预测和Chou与Fasman用氨基酸组成的Mahalanobis距离预测方法。
神经网络预测方法在预测有个蛋白质组成的样本时有0.75的正确率。
(2)二级结构预测
尽管一条多肽链的能采取的构象的数目是相当大的,但在蛋白质分子中,由二级结构组装而形成一定的空间结构的方式却是有限的,因此蛋白质的二级结构预测就成为解决蛋白质的一级序列预测其空间结构这一问题的最关键的步骤。
二级结构预测成功率可以达到0.8的话,就可以基本准确地预测一个蛋白质分子的三维结构。
(3)蛋白质的三维结构预测
三维结构域测指从蛋白质的一级结构出发预测出未知蛋白质的空间结构。
这是蛋白质结构预测的最终目标。
蛋白质的三维结构预测是根据二级结构预测的结果以及蛋白质结构类型和折叠类型预测的结果,考虑到结构间的立体化学性质,亲疏水性质,氢键以及静电相互作用,把可信度较高的二级结构进一步组装,搭建出最后的蛋白质空间结构。
这种方法虽可构建出一些蛋白质结构,不过因为它依赖于前面的预测结果,所以受到的限制太多。
另一个方向是不依赖二级结构预测的结果,直接预测三维结构的方法。
在这个方向中最原始的方法是借用成功的应用小分子构象研究的分子动力学和分子热力学方法。
对蛋白质整个构象空间进行搜索,然后找出能量最低的构象作为最后的预测构象。
蛋白质结构预测中存在的困难
蛋白质结构预测中还存在着许多困难,还有很多理论问题有待解决:
(1)蛋白质分子的二级结构是否主要取决于邻近氨基酸残基间的短程相互作用?
(2)目前的蛋白质数据库是否可以提供足够的有关定域结构的信息?
(3)目前的预测方法是否已成功地提取了现有的所有信息?
(4)根据现有条件如何进一步提高预测成功率?
(5)随着已知空间结构的蛋白质的数目的增加,是否可能进一步提高二级结构的预测成功率?
蛋白质结构预测结果的评判
蛋白质结构预测是否正确,试验测定和结构解析得到的空间结构数据是否准确,都需要作出检验和判断。
在正误构象的判断方面,主要是发展预测中所用的能量函数,这种能量函数共有分子力场、平均势函数和评估函数三类。
分子力场结合一些光谱实验数据,发展一种适合计算蛋白质构象的参数和相应的势能函数形
式。
这类方法虽然研究时间长,但多年来在蛋白质从头预测研究方面的应用一直进展不大,而且很难应用到判断蛋白质整体结构的正误上。
平均势函数是一种对现有蛋白质的各种性质进行统计得出各种性质的分布,然后根据能量按Boltzman分布的原理,反推出一个所谓的能量函数,即平均势函数,然后再以这个函数酸楚能量作为正误判断的标准。
现在用平均势函数判断所测的晶体结构是否合理方面结果很好,它可以找出原来PDB库中结构数据测得不太准确的蛋白质,特别是加入和溶剂有关的能量项后,这种方法非常灵敏。
评估函数是根据蛋白质结构的特点总结出的评估函数,在判断结构好坏是只须计算这种函数值的高低。
有关简单评估函数做得比较好的小组有K.A.Dill小组,George Rose小组,Srin Isreal小组等。
由以上知,目前的蛋白质预测主要由三个因素构成:蛋白质结构模型、蛋白质构象搜索方法以及蛋白质构象好坏的判断或称势能函数。
各种预测方法无非是这三个因素在各个层次上的组合。
蛋白质的结构转换
许多不相关的蛋白质含有相同的短肽序列却形成不同的空间构象. 结构转换广泛存在于蛋白质折叠和功能过程中, 具有重要的生物学意义.。
近年来,由于某些蛋白质结构转换和错误折叠所引起的“构象病”的发现,成了刺激蛋白质构象转换与生物功能关系研究热潮的一个重要原因.这里的结构转换(structural transformation orstructural switch)与通常意义的结构变化(struc-tural change)或构象变化(conformational change)不同.前者指较大程度的结构变化,往往导致三级结构和二级结构的转变;后者则仅仅为蛋白质空间结构的扰动或柔性.
同源肽段的结构转换
蛋白质多肽片段(fragment)在水溶液中具有与原同源肽段(segment)不一定相同的二级结构[16];同一片段在不同的溶剂环境中能进行二级结构的构象转变[17];甚至同一肽段在不同的蛋白质中的二级结构也不一样[18].天花粉蛋白的α螺旋同源片段在水溶液中则形成β折叠结构,可在六氟异丙醇中则转变为典型的α螺旋结构[19,20].蛋白质中肽链序列虽然有一定的构象形成势,但不是绝对的.有时随着环境因素的变化而进行结构的转换.很可能这是蛋白质为了适应生物功能调节和进化的要求所必需的生理转化.
二级结构的转换
丝氨酸蛋白酶抑制剂(serpin)家族是研究蛋白质结构转换的典型范例.体内新合成的或体外再折叠复性的纤溶酶原激活物抑制剂(plasminogenactivator inhibitor)具有蛋白酶抑制剂的活力(active-form, A型), A型抑制剂的活性部位是一段Loop区域,此结构可直接插入靶蛋白酶的活性中心形成复合物从而抑制蛋白酶的活性。
萤光素酶的亚基转换
大肠杆菌萤光素酶(luciferase)是由α和β两亚基组成的异二聚体蛋白(αβ).当β亚基单独存在时能形成非常稳定的同二聚体(β2).如果在β2二聚体和α亚基同时存在时,它们不能重组成有活性的αβ异二聚体.可是,在β亚基的再折叠过程中加入α亚基,则能形成有活性的αβ异二聚体[21].此实验说明,在热力学能量上β2比αβ稳定,而形成αβ的速率大于β2,有活性的αβ异二聚体的形成是由动力学因素控制的.
蛋白质淀粉样化
已有很多事实证明,基因工程产物包涵体的形成和蛋白质淀粉样化(amyloidosis)所引起的疾病都与蛋白质积聚有关[22].蛋白质积聚往往由蛋白质的错误折叠所引起的,而蛋白质构象元件的结构转换是导致蛋白质错误折叠的主要原因.溶菌酶的氨基酸残基突变与人类某些淀粉样化疾病有关.Asp67His突变体的热稳定性下降且易形成纤维状积聚体,其中α螺旋结构明显减少,整个积聚体主要由β折叠结构所构成[23].另外,βAPP蛋白(βamyloid precursor
protein)的剪切和结构转换为β淀粉样肽(βamyloid),并以多肽链间的β折叠形成纤维状沉积物[24].这种由于结构转换引起的淀粉样蛋白沉积与老年痴呆症的发生有关。
问题和展望
蛋白质的结构转换与蛋白质功能和蛋白质积聚问题已开始受到人们的关注.对下列几个疑
难问题的认识,将会对生命科学的发展产生重大影响.
A.蛋白质折叠是受热力学还是动力学控制;
B.结构转换的生物学意义;
C.α/β转换有多大的普遍性,其诱发因素是什么;
D.蛋白质在什么条件下会形成积聚(淀粉样化),它与人类疾病的关系;
E.为什么prion蛋白有传染性,它跟DNA遗传和传染有无关系.
F.基因变异所产生的疾病有多少是与蛋白质折叠有关.
[1] 卞则梁.现代科学仪器[J].1997(3):15-18.
[2] [德]坎普,[希腊]T.乔里-帕帕多普洛编著;施蕴渝译.蛋白质结构分析:制备、鉴定与微量测序[M].北京:科学出版社,2000.3:197-210.
[3] 阎隆飞,孙之荣.蛋白质分子结构[M].北京:清华大学出版社,1997,131-154.
[4] 阎隆飞,孙之荣.蛋白质分子结构[M].北京:清华大学出版社,1997,184-1987.
[5] 郭尧君.分光光度技术及其在生物化学中的应用[M].北京:科学出版社,1987.
[6] 鲁子贤,崔涛.圆二色性和旋光色散在分子生物学中的应用[M].北京:科学出版社,1987.
[7] 鄂书林.双肽、多肽物质和蛋白质的紫外共振拉曼光谱研究现状[J].光散射学报,1998(10):104-108.
[8] 邹承鲁.第二遗传密码[J].科学通报,2000;45(16):1681~1687
[9] Anfinsen C B ,HaberE,Sela M et al.The kinetics of formation of native Ribonuclease during oxidation of the reduced Polypetide chain [J].Proc Natl Acad Sci USA,1961;47:1309~1314
[10] Chen Lu Tson.Folding of the nascent peptide chain during biosynthesis[C].In:Bunn eds.Recent Adv In Biochem, Proceeding of the 5th FAoB Congress,seoul,1989
[11] Gatenby A A.Protein folding and chaperones [J].Plant Mol.Biol,1992;19:677~687
[12] Luo L F.The time scale of protein folding simple model of chaperones[J].Acta SNUN,1994;25:52~56
[13] haknovich E I ,rutin A M.Formation of unique structure in Polypeptide Chains[J].Biophys Chem,1989;34:187~193
[14] Ponnuswamy P K M.Hydrophobic characteristics of folded protein[J].Prog Biophys Mol Biol,1993;59(1)
[15] 罗辽复.蛋白质二级结构预测的统计学途径[J].生物化学杂志(专刊),1993:6~7
[16] 胡红雨,鲁子贤(Hu H Y, Lu Z X).二级结构形成:蛋白质折叠起始的框架模型.生物化学与生物物理进展(Prog BiochemBiophys), 1994,21(6): 508~512
[17] Searle M S, Williams D H, Packman L C. A short linear peptidederived from the N-terminal sequence of ubiquitin folds into awater-stable non-nativeβ-hairpin. Nat Struct Biol, 1995,2(11):999~1006
[18] Wilson I A, Haft D H, Getzoff E D,et al. Identical short peptidesequence in unrelated protein can have different conformations.Proc Natl Acad Sci USA, 1985,82(16): 5255~5259
[19] Hu H Y, Lu Z X, Du Y C. Solution conformation of T18 peptidederived from Trichosanthin by NMR studies and comparison ofT14, TDK and T18 peptides. Chin J
Biochem Biophys, 1996,28(4): 231~239
[20] Hu H Y, Lu Z X, Du Y C. Solution conformation of N-terminalfragments of Trichosanthin small domain (TCS182-200): circulardichroic studies. J Pept Res, 1997,49(2): 113~119
[21] Baldwin T O, Christopher J A, Raushel F M,et al. Structure ofbacterial luciferase. Curr Opin Struct Biol, 1995,5(6): 798~809
[22] Kelly J W. Alternative conformations of amyloidogenic proteinsgovern their behavior. Curr Opin Struct Biol, 1996,6(1): 11~17
[23] Brooth D R, Sunde M, Bellotti V,et al. Instability, unfoldingand aggregation of human lysozyme variants underlying amyloidfibrillogenesis. Nature, 1997,385(6619): 787~793
[24] Lansbury P T, Costa P R, Grifiths J M,et al. Structural modelfor theβ-amyloid fibril based on interstrand alignment of anantiparallel-sheet comprising a C-terminal peptide. Nat Struct Biol,1995,2(11): 990~998。