蛋白质结构预测
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实习 5 :蛋白质结构预测
学号20090***** 姓名****** 专业年级生命生技****
实验时间2012.6.21 提交报告时间2012.6.21
实验目的:
1.学会使用GOR和HNN方法预测蛋白质二级结构
2.学会使用SWISS-MODEL进行蛋白质高级结构预测
实验内容:
1.分别用GOR和HNN方法预测蛋白质序列的二级结构,并对比异同性。
2.利用SWISS-MODEL进行蛋白质的三级结构预测,并对预测结果进行解释。
作业:
1. 搜索一条你感兴趣的蛋白质序列,分别用GOR和HNN进行二级结构预测,解释预测结果,分析两个方法结果有何异同。
答:所选用蛋白质序列为>>gi|390408302|gb|AFL70986.1| gag protein, partial [Human immunodeficiency virus]
(1)GOR预测结果:
图1
图1是每个氨基酸在序列中所处的状态,可以看出序列的二级结构预测结果为:
1到9位个氨基酸为无规卷曲,10到33位氨基酸为α螺旋,34到37位为β折叠,38到45位为无规卷曲,46到49位为α螺旋,50到53位为无规卷曲,54到65为α螺旋,66到72位为无规卷曲,73到95位为α螺旋,96到101位为无规卷曲,102到108为β折叠,109到115位为无规卷曲,117位为β折叠。
图2
图2为各种结构在序列中所占的比例,其中Alpha helix占53.85%,Extended strand占11.11%,Random coil占35.04%,无他二级结构。
图3
图3为各个氨基酸在序列中的状态以及二级结构在全序列中二级结构分布情况。
(2)HNN预测:
图4
图4是每个氨基酸在序列中所处的状态,可以看出序列的二级结构预测结果为:
1到6位个氨基酸为无规卷曲,7到34位氨基酸为α螺旋,35到37位为β折叠,38位为α螺旋,39到44位为无规卷曲,45到49位为α螺旋,50到55位为无规卷曲,56到65为α螺旋,66到71位为无规卷曲,72到83位为α螺旋,84到86位为无规卷曲,87到95位为α螺旋,96到102为无规卷曲,103到108位为β折叠,108到117位为无规卷曲。
图5
图5为各种结构在序列中所占的比例,其中Alpha helix占55.56%,Extended strand占7.69%,Random coil占36.75%,无他二级结构。
图6
图6为各个氨基酸在序列中的状态以及二级结构在全序列中二级结构分布情况。
比较异同:
比较图3图6看出,GOR预测结果和HNN预测结果总体相似,但是由图1和图4看出,预测给出的结论中存在差异,主要是在不同的二级结构的边界区域的氨基酸所处在的状态存在差异。比如GOR预测结果中,1到9位个氨基酸为无规卷曲,10到33位氨基酸为α螺旋,但是HNN预测结果中,却是1到6位个氨基酸为无规卷曲,7到34位氨基酸为α螺旋,显示在不同二级结构边界处的预测存在较大差异,这种差异可以由图7的对比截图中很容易看出来。
图7
由于图7所示的差异,所以各种二级结构所占的比例也存在差异:比如GOR预测结果Alpha helix占55.56%,而HNN预测结果则占53.85%;GOR预测结果Extended strand占7.69%,HNN预测结果占11.11%,GOR预测结果Random coil占36.75%,H NN预测结果占35.04%。这两种预测结果的差异性也是有限的,差异仅存在于不同二级结构所占的比例,并没有出现不同二级结构类型的差异。
2. 搜索一条你感兴趣的蛋白质序列,利用SWISS-MODEL先寻找其合适的模板序列,根据找到的模板序列与你的目标序列的相似度,选择全自动模式或比对模式进行三级结构预测,说明操作步骤,解释预测结果。
答:蛋白序列为:
>gi|390408302|gb|AFL70986.1| gag protein, partial [Human immunodeficiency virus]
操作步骤:
打开SWISS-MODEL建模网站/,选择“Template Identification”,提交蛋白质序列进行模板识别,结果如图8所示。
选择模板(Template)“2xt1A”,运用自动同源建模方式:在/页面选“Automated Mode”进行同源建模,输入模板2xt1A,提交任务,获得结果如图9所示。
图8
图8所示为模板识别结果,根据所得结果,选择Gapped Blast方法获得的模板2xt1A进行下一步同源建模。
图9
图9所示为同源建模结果。由Model information看出Sequence Identity [%]: 96.1,Evalue: 3.38e-38,序列相似程度为96.1%,Evalue值为3.38e-38,说明模型与提交的预测蛋白序列匹配性较好,详细信息如图10所示。由Quality information看出,QMEAN Z-Score: -0.02,如图11所示。四级结构信息(Quaternary structure information)显示模型为单链模
型:Template (userX): Unknown,Model: SINGLE CHAIN。其中用户自行设定的模板2xt1A 没有显示出来。由配体信息(Ligand information)看出,模板配体(Ligands in the template)有: GOL: 1,gag蛋白同源建模的模型中没有配体:Ligands in the model: none。
图10
图11