酶结构的研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

酶结构的研究
(孙冬竹 2009111005 化学基地班)
摘要:解释酶结构的研究内容,包括一级结构、二级结构、三级结构和四级结构。

介绍酶结构的研究方法,先将酶水解,测定蛋白质中氨基酸的序列,而酶的三维结构则通过理论推测的方法求出。

应用这种方法,对拟南芥中PAP特异磷酸酶(AtAHL)进行研究。

通过现有的序列同源性比较、二级结构预测、三维结构预测和模拟方法,得到了拟南芥中PAP特异磷酸酶的三维结构。

这是一种与酵母中的Hal2p蛋白质类似,并且N端为ɑ+β。

C端为ɑ/β结构域的多结构域蛋白质。

关键字:蛋白质三维结构结构预测拟南芥PAP特异磷酸酶(AtAHL)
Enzyme structure
Abstract: explain the research content of enzyme structure, including primary structure, secondary structure, level 3 structure and level 4 structure. Introduces the structure of the enzyme research method of the first enzyme hydrolysis, determination of the sequence of amino acids in proteins, enzymes and 3 d structure is through the theory of the method that can be. Using the method of in arabidopsis thaliana PAP specific phosphatase (AtAHL) for research. Through the existing sequence homology comparison, secondary structure prediction, the three dimensional structure prediction and simulation method, got in arabidopsis thaliana PAP specific phosphatase 3 d structure. This is a kind of and the Hal2p yeast protein are similar, and the N for ɑ + r. The C for ɑ/β structure of domain more protein structure domain.
Key words: 3 d structure protein structure prediction arabidopsis PAP specific phosphatase (AtAHL)
引言:绝大多数的酶是具有催化功能的蛋白质,研究酶的结构化学,首先要了解蛋白质的结构,对蛋白质的初级结构氨基酸、肽链,以及由它们形成的高级结构ɑ-螺旋和β-折叠等空间构型有一定的知识基础。

一、酶结构研究的内容
根据蛋白质分子的组成和盘曲折叠方式,酶可分为一级结构、二级结构、三级结构和四级结构。

一级结构指蛋白质分子中肽链的氨基酸残基的排列顺序,由于半胱氨酸侧链
巯基经氧化后形成—s—s—键,因此在蛋白质分子的链内或链间都有可能形成二硫桥键。

二级结构指蛋白质分子肽链本身的三维空间的规律性。

主要由肽链骨架之间的羰基和亚氨基间形成的氢键来维系。

近年的研究表明,链内键形成螺旋结构(α-螺旋),而链间键形成片状结构(β-折叠)。

一些酶同时包含一定的螺旋区和片状结构区。

α-螺旋结构是一种较稳定的结构,即每隔3.6氨基酸残基肽链向上旋转一圈,二圈之间的距离为5.4埃。

但由于分子中的二硫桥和个别氨基酸(如脯氨酸)的存在,以及一些其他原因,可使螺旋中断。

在一般球蛋白中,α-螺旋占整个肽链的20-50%。

三级结构蛋白质分子又可按照一定方式再盘曲折叠,为三级结构,主要由盐键、氢键、疏水键等所维系。

这样折叠后,蛋白质的肽链虽很长,但由于二、三级结构的存在,多数蛋白质在空间构型上却是紧密的球状分子。

四级结构指由多条各自具有一级、二级、三级结构的肽链通过非共价键连接起来的结构形式。

在某些情况下,个别蛋白质的亚基可结合成有限数目的多聚体。

一个多聚蛋白分子中,有的每一个亚基的一、二、三级结构都彼此相同。

如烟草花叶病毒的外壳蛋白。

有的则是由少数几种不同亚基组成的,如门冬酰胺转氨甲酰酶。

亚基之间主要由各表面暴露的侧链形成的键(如疏水键)所维系。

二、酶结构的研究方法
一级结构①将酶水解,测定蛋白质氨基酸残基的组成,根据蛋白质分子量,计算构成蛋白质各种氨基酸的数量。

②通过测定末端氨基酸残基的物质的量与蛋白质分子量之间的关系,确定多肽链的数目。

③通过加入盐酸胍的方法解离多肽链之间的非共价力。

应用过甲酸氧化法或巯基还原法拆分多肽链间的二硫键。

④一般用酶或溴化氰选择性降解多肽链,产生的肽段用酸水解法完全水解多肽,测定并计算出各种氨基酸的分子比,用Edman降解法分析各肽段的氨基酸顺序。

⑤利用酶选择性降解和溴化氰选择性降解得到的各肽段的氨基酸顺序彼此间交错重叠,拼凑出整条多肽链氨基酸顺序,并确定多肽链中二硫键的位置。

二级结构由于在蛋白质分子中,由二级结构组装而形成的一定的三维结构方式却是有限的。

因此,蛋白质二级结构预测就成为解决由蛋白质的一级序列预测其三维结构这一问题的最关键步骤。

现在一般认为,如果二级结构预测成功率可
达到80%的话,我们就可以基本准确的预测一个蛋白质分子的三维结构。

在过去的20年中,科学家们已经提出了几十种预测蛋白质二级结构的方法。

几乎所有这些方法都假定蛋白质二级结构主要是由邻近残基间的短程相互作用所决定的(这一假定可称为定域假定),然后通过对一些已知三维结构的蛋白质分子进行分析、归纳,制定出一套预测规则,并根据这些规则对其他已知或未知结构的蛋白质分子的二级结构进行预测。

因此,所有这些方法都可归类为基于已有知识的预测方法。

目前3种常用的方法是20世纪70年代分别由Chou、Fasman、Gamier(GOR法)以及Lim提出的方法。

①Chou-Fasman 方法Chou-Fasman方法是统计学的方法,他们首先统计出二十种氨基酸出现在ɑ-螺旋、β-折叠以及无规卷曲三种构象的频率,然后计算出每一种氨基酸出现在三种构象中的构象参数Px。

某个残基A的构象参数定义为:Px=f(Xi)/f(X) (X=ɑ螺旋、β折叠、无规卷曲)其中,f(X)为整个数据库中构象X出现的频率。

因此,构象参数值的大小反映了该种残基出现在某一构象倾向性的大小。

例如,对ɑ-螺旋而言,某个残基的构象参数Pɑ大,则说明该残基形成螺旋的能力强;相反,构象参数Pɑ小,则表明其形成ɑ-螺旋能力弱。

按照构象参数值的大小可以把二十种氨基酸分成六组:Hɑ表示强ɑ螺旋形成残基;hɑ表示ɑ-螺旋形成残基;Iɑ为弱ɑ-螺旋生成残基;iɑ为非ɑ-螺旋生成残基;bɑ为ɑ-螺旋破坏残基;Bɑ为强ɑ-螺旋破坏残基。

Chou 和Fasman制定出一套ɑ-螺旋的成核、延伸和中止规则,用于对一个已知序列的多肽链进行二级结构预测。

例如,在一条多肽链中若连续出现四个ɑ-螺旋形成残基,那么这四个残基可以看成一个形成ɑ-螺旋的核。

一旦ɑ-螺旋形成核确定了,ɑ-螺旋的长度就可以沿着多肽链向两个方向延伸,直到遇到连续几个ɑ-螺旋破坏残基时才中止ɑ-螺旋的延伸。

用类似的方法,Chou-Fasman也可以对β-折叠进行预测。

②GOR方法GOR方法是以信息论为基础的,因而本质上仍属于统计学方法。

GOR方法不仅考虑了被预测位置本身氨基酸残基种类的影响,而且考虑了相邻残基种类对该位置构象的影响。

例如,如果以Xi表示ɑ-螺旋,R表示甘氨酸,则f(Xi,Ri+m)表示第i+m位为甘氨酸残基时,第i位残基出现在ɑ-螺旋构象中的频率。

以f(X)表示ɑ-螺旋出现的频率。

根据信息论可知,log[f(Xi,Ri+m)/f(X)]表示第i+m位为甘氨酸时,给出的关于第i位残基为ɑ-螺旋构象的信息;而log[f(Xiˊ,Ri+m)/f(Xˊ)]则表示当i+m位为甘氨酸时给出的关于第i为残基为非ɑ-螺旋构象的信息。

GOR方法称这两者之差为直接的信息量。

GOR给出了20种氨基酸残基出现在不同位置时的直接信息量表。

假定相邻片段所含的信息可以近似表示为若干个直接信息量的简单加和,根据加和公式和直接信息量表,就可以对一条肽链中任一位置残基的构象进行预测。

③Lim方法Lim方法是物理化学方法,这一方法考虑了氨基酸残基的物理化学性质,如残基的亲水性、疏水性、带电性及体积的大小等,同时考虑了临近残基的相互作用,从而制定出一套预测规则。

Lim方法是三个方法中预测成功率最高的,可达59%。

它对无规卷曲的预测过多,而对β-折叠的预测不足。

对于序列长度小于50个氨基酸残基的多肽链,其预测准确率高达73%。

三级和四级结构①根据基本物理原理,用分子动力学(MD)模拟预测蛋白质的三维结构。

②根据蛋白质同源性预测。

③根据结构类型预测。

分子动力学模拟预测蛋白质结构的方法,现在主要是作为其它预测方法的补充手段和应用于结构优化(refinement)。

X射线晶体衍射法测定蛋白质结构时,当分辨率在0.2―0.25nm以上时,则要用分子动力学模拟帮助求出蛋白质结构。

三、拟南芥中PAP特异磷酸酶(AtAHL)的折叠识别与结构预测
1、方法
采用常规的蛋白质建At模方案来预测A TAHL的结构,用FASTA和BLASTP在PDB和Swiss-Pot中搜索AtAHL的同源类似并且用CLUSTAL进行多序列比对,使用CE检测AtAHL同源类似物的结构邻居。

采用几种现存的方法进行二级结构预测,根据这些结果选择出合适的结构模板蛋白质,由CLUSTAL得到待定结构蛋白质与模板蛋白序列的初步比对。

根据模板蛋白质的二级结构,参照对待定结构蛋白质的二级结构预测,结合A TAHL的生化信息以及保守残基区域,最终得到用于三维结构预测和模拟的序列比对.
2、结果
①A TAHL的同源类似物
用BLASTP搜索PDB得到3组与AtAHL有很强同源性的序列(每组内的序列均
相同)。

从3组序列中选择一个代表,其PDB代码分别是IQGX、1IMA、2HHM,相应的E值分别是1e-42、2e-4、2e-4其中1IMA和2HHM都是属于肌醇一磷酸酶.
同时得到另外2组序列,其与A TAHL的同源性比以上3组弱,其中代表序列PDB 代码分别是1LBZ和1JP4。

这些蛋白质和AtAHL均属于磷酸酶家族,而且都是既含有ɑ螺旋又含有β折叠的多结构域蛋白质E值越低,两个序列同源性越强。

因此,分析以上两种方法搜索的结果,IQGX是AtAHL在PDB中较好的同源类似物。

AtAHL及其同源类似物的结构
②结构邻居与折叠识别
用CE检测AtAHL同源类似物1QGX的结构邻居,发现用FASTA和BLASTP初次鉴定的AtAHL同源蛋白质1IMA、2HHM、1JP4与1QGX是高得分的结构邻居。

将待定结构序列发送到3D-PSSM服务器上进行折叠识别,在具有95%准确性的E值
范围内,得到的结果中包括1QGX。

所有排名在前的蛋白质都是既含有ɑ螺旋又含有β折叠的多结构域蛋白质,其中1QGX排名第1
③二级结构预测
使用各种方法进行二级结构预测,发现ɑ螺旋与β折叠都存在。

而且,这个结构可能含有9-14个ɑ螺旋,11-17个β折叠。

用SMART所作分析表明,我们的序列在SCOP中也被分类为既有ɑ螺旋又有β折叠的多结构域蛋白,而且N端是ɑ+β结构域,C端是ɑ/β结构域。

④模板选择和用于结构预测的序列比对
用MODELLER预测三维结构需要有恰当的三维结构模板及其与待定结构的序列比对。

从上面的分析,发现1QGX是一个合适的三维结构模板。

用CLUSTALW 可以得到AtAHL与1QGX的序列比对。

在将这个比对直接输入MODELLER之前,需要检查比对中插入的空隙。

各种序列比对方法,为了得到最高的序列匹配指标,
都会在序列中加入空隙。

在包含空隙的地方,预示着两个序列的三维结构有较大的区别。

从结构上来看,如果这些空隙发生在模板上连续规则的二级结构中间,这些空隙的加入就可能是不合理的。

应该小心地检查待定结构是否有可能在这些地方发生二级结构的中断。

可以作为判断依据的信息有:模板的二级结构和这些二级结构的堆积方式,待定结构的序列在该区域是否有不形成规则二级结构的倾向,等等。

例如,在β链中插入空隙或插入更多的残基有可能使整个β片层解体;而螺旋的中断可能导致ɑ螺旋的堆积方式改变。

这些都是三维结构的较大变化。

如果对模板结构和待定结构之间的相似性有较大的信心,就应该避免这种变化的发生。

因此,在将序列比对输入MODELLER之前,检查和调整用各种自动方法得到的序列比对是得到可靠结构的必需步骤。

以AtAHL的第80位到第120位的氨基酸序列为例。

在模板蛋白中这段序列对应一个长ɑ螺旋。

CLUSTAL给出的匹配在这段序列的中部加入了几个空隙。

这是否意味着在PAP磷酸酶中这一条螺旋应折为两段?采用各种方法所作二级结构预测都表明方框中的这段序列是一个连续的ɑ螺旋。

没有理由认为在AtAHL中由于序列的改变,这条螺旋会变成不连续两段。

连续的螺旋仍然是最优的选择。

所以在用于结构预测的序列比对中,应把相应的空隙删除。

根据同样类似的步骤,还删除了其他几处空隙。

同时,根据上文提到的多序列比对的结果,在不影响AtAHL序列保守区的序列比对前提下,相应地调整了空隙删除处附近区域的序列比对。

图3示出了经过调整后用于结构预测的序列比对。

AtAHL的预测结构
⑤同源模型的建立与检查
采用Ha12p的结构(1QGX)为模板,配以图3所示的待定结构序列与模板序列的比对,通过MODELLER得到了AtAHL的三维结构。

用PROCHECK检查,这个结构的主链构象有95.3%的残基在最适合区域,4.4%的残基在附加允许区域,可以说这个结构有很好的立体化学指标。

使用CNS进行优化,有小部分的改进。

预测的结构N端是ɑ+β结构域,C端是ɑ/β结构域。

预测结构与Ha12p主链的比较。

与之相比,在已有的理论结构1FLF中80.0%的残基在最适合区域,16.0%在附加允许区域,并且只有很低的二级结构含量,外加一个不大可能形成的结。

这表明,1FLF的立体化学指标没有我们现在通过各种方法详尽分析之后再用MODELLER得到的结果好。

四、根据蛋白质的氨基酸序列,从理论上预测其相应的三维结构可用于研究酶的折叠和设计出新型蛋白质分子,弥补了其他技术在时间和技术上的局限性,具有极其重要理论和实际意义。

参考文献:
(1) CJ萨克林主编。

酶化学——影响与应用. 金道森,童林荟,姚钟麒,吴应文译.
北京: 科学出版社,1991.
(2) Alan Fersht著,酶的结构和作用机制. 杜锦珠,茹炳根,卫新成译校. 北京:
北京大学出版社,1991.
(3) 陈惠黎.1999.生物大分子的结构和功能. 上海:上海医科大学出版社.
(4) 刘次泉,白春礼,张静. 1997. 结构分子生物学北京:高等教育出版社
(5) 阎隆飞,孙之荣. 1999 蛋白质分子结构. 北京:清华大学出版社
(6) 杨铭2002 结构生物学概论北京:北京大学医学出版社
(7) 邹成鲁1997 第二遗传密码——新生肽链及蛋白质折叠的研究长沙:湖
南科学技术出版社
(8) 邹承鲁2000 生物学走向二十一世纪中国科学院院刊,(1):1-5
(9) Gil-Mascarell R;Lopez-Coronado J M;Belles J M The ArabidopsisHAL2-likegene family includes a novel sodium-sensitive phosphatase[外文期刊] 1999(04)
(10) Quintero F J;Garciadeblas B;Rodriguez-Navarro A The SAL1 gene of Arabidopsis, encoding an enzyme with3′(2′),5′-biophosphate nucleotidase and inositol polyphosphate 1-phosphatase activities,increases salttolerance in yeast[外文期刊] 1996(03)
(11) Patel S;Martinez-Ripoll M;Blundell T L Structural enzymology of Li+-sensitive/Mg2+ dependent phosphatases[外文期刊] 2002(05)
(12)Rost B;Sander C Prediction of protein structure at better than 70% accuracy[外文期刊] 1993(02)
(13)Shindyalov I N;Bourne P E Protein structure alignment by incremental combinatorial extension (CE)
of the optimal path[外文期刊] 1998(09)
(14) THOMPSON J D;Higgins D G;Gibson T J CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, positions-specific gap penalties and weight matrix choice[外文期刊] 1994(22)
(15) Murguia J R;Belles J M;Serrano R The yeast HAL2 nucleotidase is an in vivo target of salt toxicity [外文期刊] 1996(46)
(16) PEARSON W R;Lipman D J Improved tools for biological sequence comparison 1988(08)。

相关文档
最新文档