Discovery Studio 2.5操作教程

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

蛋白质结构预测技术简介

简介

蛋白质结构的解析对其功能的理解至关重要。然而,由于技术手段的限制,利用实验方法(主要为X-ray,NMR)解析蛋白质结构投入大、周期长、风险大。对于某些膜蛋白,只利用现有技术条件,其结构甚至无法解析。另一方面,随着分子生物学技术的成熟及高通量测序技术的发展,越来越多的基因序列可以轻松被找到。这造成了现代蛋白质科学中一个奇怪的现象:蛋白质序列数据的累积量及积累速度远远超过蛋白质结构。这种序列与结构间不平衡的现象极大地限制了我们对蛋白质功能及其相关作用机理的理解。所以我们需要一种能够简单、快速且相对准确的技术来确定蛋白质的空间结构。

蛋白质建模技术可以很好的解决上面的问题。该方法利用信息技术的手段,可以直接从蛋白的一级结构(氨基酸序列)预测蛋白质的高级结构(主要为三级结构)。根据最新一届国际建模大赛(CASP)的分类,目前主要的蛋白质建模方法包括两种:基于模板的建模(Template-based Modeling)和自由建模(Free Modeling)。前者又包括两种方法:同源建模法(Homology Modeling)和“穿线法”(Threading)。后者主要以从头计算法(ab initio)为主。所有的建模方法中,以同源建模法(Homology Modeling)使用最为广泛,预测结果的准确性最大。

同源建模的理论基础为蛋白质三级结构的保守性远远超过一级序列的保守性。因此,人们可以通过使用一个或多个已知结构的蛋白(模板蛋白,template)来构建未知结构蛋白(目标蛋白,target)的空间结构。其主要的步骤包括:

1.搜索用于建模的template(s)

2.将target与templates进行比较

3.将步骤(2)中的比较信息用于建模

Discovery Studio为用户提供了一整套利用Homology Modeling方法自动预测蛋白质空间结构的工具。用户只需要提供蛋白质的氨基酸序列就可以轻松完成模型构建及模型可信度评估的工作。DS的Homology Modeling主要基于MODELER程序。目前MODELER已成为使用最为广泛,预测最为准确的同源建模工具之一。其主要的建模步骤包括:

1.使用序列相似性工具BLAST或PSI-BLAST搜寻目标序列的模板

2.使用结构比对方法将模板进行比对,叠合

3.使用序列比对方法将目标序列与模板结构的序列进行比对

4.使用MODELLER产生目标序列的模型

5.模型的评估

本教程中以一个胞外淀粉酶的模型构建过程为例子,展示如何使用DS为该淀粉酶自动构建空间结构,并对所构建的模型进行评估,帮助大家获得Homology Modeling最直观的结果。

识别模板,,比对模板

1识别模板

本教程使用BLAST来搜索templates。进行BLAST搜索时,数据库可以使用Protein Data Bank(PDB)数据库也可以用PDB_nr95(PDB非冗余结构数据库)。为缩短搜索时间,本文使用PDB_nr95数据库来寻找模板。

1.1载入序列

从Files Explorer, 打开Samples | Tutorials | Protein Modeling | P41131.fasta.

数据库,,寻找模板

1.2BALST PDB_nr95数据库

1.2.1 选择target

,双击BLAST Search (DS Server).

文件夹,

在Protocols Explorer, 展开Sequence Analysis 文件夹

在the Parameters Explorer, 点击the Input Sequence parameter ,选择P41131:P41131 Input Sequence中的文件名为sequence window的名字(P41131)与该窗口中的序列名称(P41131)的名字组合。

1.2.2选择BLAST数据库

Input Database选择PDB_nr95

注意:PDB_nr95序列数据库已经安装在DS server上。如果需要BAST其它数据库,用户注意

需要另外安装相应的数据库。

注意:如果改动默认参数或使用不同的(或升级版)的PDB_nr95数据库,BLAST结果可注意

能与本教程的结果不一致。

1.2.3运行Protocol

,等待计算完成.

在Protocols toolbar, 点击运行

运行,

计算完成后,会显示一个“Job Completed”的对话框。点击OK。

1.2.4 查看计算结果

——“ Blast Search DS Server”

在Jobs Explorer中, 双击job栏中完成的计算

栏中完成的计算——

这将打开一个Html的窗口,里面包含Reprot.htm文件(该文件为比对结果报告)

Html 窗口中, Output Files部分, 点击the View Results .

这将打开BLAST搜索找到的序列

注意:由于没有设置结果的保存路径,BLAST的结果保存于默认文件夹My Documents\Discovery Studio Client\Results\BLASTSearchDSServer_

在P41131 - Blast 窗口, 点击该窗口下的Table View tab。

Table View显示了命中的序列。每行表示一条命中的氨基酸序列。在DS中,灰色的cell不能被编辑。

注意:命中的序列按照E值(序列比对的可行度)进行降序排序。E值最低的序列,结果最可靠,排在第一行。

相关文档
最新文档