第五章蛋白质分析及预测方法新
蛋白质的序列分析及结构预测
ratio of an ion.
精品课件
Peptide Fragmentation
Collision Induced Dissociation
H+
H...-HN-CH-CO . . . NH-CH-CO-NH-CH-CO-…OH
(1)直接测序
e.g. Protein Sequencing and Identification by Tandem Mass Spectrometry,
即用串联质谱仪测序
精品课件
串联质谱及其作用
• 两个或更多的质谱连接在一起,称为串联质谱。 •最简单的串联质谱(MS|MS)由两个质谱串联而 成,其中第一个质量分析器(MS1)将离子预分离 或加能量修饰,由第二级质量分析器(MS2)分析 结果。
蛋白质的序列分析及结构预测
精品课件
DNA sequence Protein sequence
Protein structure
精品课件
Protein function
一、蛋白质数据库介绍 二、蛋白质序列分析 三、蛋白质结构预测 四、应用 分子设计
精品课件
一、蛋白质数据库介绍
蛋白质的结构主要分为四级, 一级结构、二级结构、三级结构 以及四级结构。依据这种结构层次, 将蛋白质数据库分为: 1. 蛋白质序列数据库:如PIR、SWISS-PROT、NCBI , 这些 数据库的数据主要以蛋白质的序列为主, 并赋予相应的注释; 2. 蛋白质模体及结构域数据库:如PROSITE、Pfam, 这些数 据库主要收集了蛋白质的保守结构域和功能域的特征序列; 3. 蛋白质结构数据库: 如PDB 等, 这些数据库主要以蛋白质 的结构测量数据为主; 4. 蛋白质分类数据库:如SCOP、CATH、FSSP 等, 这其中有 以序列比较为基础的序列分类数据库以及以结构比较为基础的 结构分类数据库之分。
蛋白质定位预测方法综述及比较分析
蛋白质定位预测方法综述及比较分析引言:蛋白质是细胞中最重要的生物大分子之一,其功能与其所处的亚细胞定位密切相关。
准确预测蛋白质定位是理解蛋白质功能的重要一环。
随着计算机科学和生物学的快速发展,越来越多的蛋白质定位预测方法被提出。
本文将对常见的蛋白质定位预测方法进行综述和比较分析,以期为进一步研究提供参考。
一、蛋白质定位预测的重要性蛋白质在细胞内发挥特定的功能,其定位信息对于理解和研究蛋白质功能至关重要。
准确预测蛋白质的定位可以为进一步研究蛋白质的功能和相互作用提供指导。
二、蛋白质定位预测方法的分类1. 基于氨基酸序列的方法这种方法根据蛋白质的氨基酸序列进行预测。
其中,物化性质(如蛋白质溶解性、亲水性等)、序列模式(如信号肽、跨膜蛋白等)及机器学习算法(如隐马尔科夫模型、支持向量机等)是常用的预测依据。
2. 基于蛋白质相似性的方法这种方法通过比对已知定位的蛋白质序列和待预测的蛋白质序列的相似性来预测其定位。
常用的方法有同源比对、核酸水平的序列相似性等。
3. 基于蛋白质结构的方法这种方法通过预测蛋白质的三维结构来预测其定位。
常见的方法有蛋白质结构模拟、蛋白质结构域预测等。
三、常见蛋白质定位预测方法的综述与分析1. 密集神经网络(DNN)方法DNN方法利用神经网络模型和大量的训练数据来预测蛋白质的定位。
该方法具有较高的准确性和可靠性,但需要大量的训练数据和计算资源。
2. 支持向量机(SVM)方法SVM方法利用训练集中已知定位的蛋白质特征,建立分类模型来预测待测蛋白质的定位。
该方法较为简单,但需要手动提取特征。
3. 隐马尔科夫模型(HMM)方法HMM方法通过使用隐马尔科夫模型对序列数据进行建模,预测蛋白质的定位。
该方法能够捕捉到序列中的潜在模式,但对训练数据的依赖较大。
四、基于机器学习的蛋白质定位预测方法比较分析1. 准确性比较DNN方法在大规模训练数据和计算资源的支持下,具有较高的准确性。
SVM方法相对简单,准确性较低。
蛋白质结构的分析和预测方法
蛋白质结构的分析和预测方法蛋白质是构成生物体质量的基础,具有广泛而重要的生物功能。
研究蛋白质的结构和功能是生物学和药学等领域的重要研究课题。
而蛋白质结构的分析和预测是对蛋白质研究的基础,也是解决人类疾病等领域的重要突破口。
本文将从分析和预测两个方面介绍蛋白质结构的研究方法。
一、蛋白质结构的分析方法1. X射线晶体学蛋白晶体学是最广泛采用的蛋白质结构分析方法之一。
该方法利用X射线探测蛋白质晶体中原子的位置,并通过该信息推断蛋白质的三维结构。
通过X射线晶体学的方法已获得了数万个蛋白质结构,大大提高了蛋白质研究的深度和广度。
2. 核磁共振核磁共振是另一种常用的蛋白质结构分析方法,它利用一个强磁场对蛋白质分子进行瞬时激发,旋转确定的核磁共振信号,通过空间磁场分布的变化揭示分子的三维构造。
此外,核磁共振与分子动力学模拟等计算方法相结合,能够更细致地揭示分子的结构细节,如构象变化、动态性质、生理相关解离构象等。
3. 电镜电子显微镜是一种近期快速发展的方法,它可以在不需要结晶的情况下直接观察蛋白质体系的图像,从而解析它们的立体结构。
这种方法非常适合研究大分子复合物的结构和功能,因为它们相对比较柔软,不太容易得到光学衍射数据。
二、蛋白质结构的预测方法1. 基于结构相似性的预测基于结构相似性的预测是一种利用已知结构的蛋白质来推断其它蛋白质的结构的方法。
这种方法假设结构相似的蛋白质在空间构型上也具有相似性,因此可以通过分析相似结构间的差异性和共性来预测未知结构的蛋白质。
如蛋白质家族、同源模型等就是基于结构相似性预测蛋白质结构的重要手段。
2. 基于能量最小化的预测通过基于物理化学原理设计的力场,在预测过程中能够通过优化相互作用势能最小化的方式,预测蛋白质的结构。
这种方法在预测局部构象、构像变化、蛋白质之间的相互作用以及酶与其底物结合等方面非常重要。
3. 基于模板匹配的预测模板匹配预测是在已知蛋白质结构库中,通过匹配新蛋白质的序列与已知蛋白的结构来预测其结构的方法。
5 蛋白质序列分析
实例分析,使用PHYRE系统 进行 RGDV P2蛋白的折叠识别预测
3.从头预测
• Abinitio prediction:直接从序列本身预测三 维结构。
5.4抗原表位预测分析
• 抗原抗体结合反应中,抗原参与的结合部 位称为抗原表位(epitope)
实例:TargetP对RSvc2蛋白细胞定 位预测
5.2结构与分析及motif搜索
• 结构域(structure domain)是在蛋白质结 构中介于二级结构和三级结构之间的可以 明显区分但又相对独立的折叠单元,每个 结构域自身形成紧实的三维结构,可以独 立存在或折叠,但结构域之间的关系较松 散。 • 常见工具:InterProSan, SMART,Pfam。
实例:使用PROSITE数据库对 RGDV P8 蛋白进行motif搜索。
5.3空间结构预测
• 二级结构预测的意义。 • 在线工具,SSPro 等。
• Amino Acids: MAGKLQDGVAIAKIKETINLFCEYSFGDLVNNRREIVGRVHDARKN AALAWPDLIMNCFLHSASHYGVVKFLLDIALSTRFGDFTLLGVSSQ NYPFYDLHVVMTKAFCNLDFAKDEYLMINDSFSSMMSAFLDEEGV HSAMSMELGIHDIEDRFVLRTKRLFYIIHEYHMSLDEIEPWLEKLPD ASGGTLLNQKSKEQMRVIFSNAKVRIANSINLYVTNNTNSYNEYVR EVAEYVADLWNIQATTNTQGHENELADEDFGVLASSSQMNGTKS ELGDSVIKSDGNEVKLEPAVFTRNDDEEELAGSEFTSLLSDDGRM G Predicted Secondary Structure (8 Class): CCCHHHHHHHHHHHHHHHHHHHHHCHTHHHTTTCEHHHHHHH HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHEHETCE EEEEEECCSCCTCCHHEEEEHHHEECTCCCCCEECCCHHHHHH HHHHHHHHHCCEEEEHEEECECHHHHHHHHHHHHHHHHHHHH HHHHHHHHHHHTCCCTTTTCHHCHHHHHHHHHHHHHHHHHHH HHHHEEEETHHHHHHHHHHHHHHHHHHHHHEEEECCCTCCHH HHHHHHTTEEEECHHCTCCHCHTTCEEEECTTCEEEECCEEEEE CCCHHHHHHHHHHHHHCTTTCCC
蛋白质结构预测与分析方法
蛋白质结构预测与分析方法蛋白质作为生命体中最基本的分子之一,不仅在生物体中发挥着重要的催化、运输、调节、防御、信号传递等功能,同时也受到了科学家们的广泛关注。
因为在蛋白质的分子结构中蕴藏着其生物学功能的秘密。
为了深入理解蛋白质在生物体中的作用,结构预测与分析方法成为了不可或缺的重要手段。
一、蛋白质结构预测方法蛋白质结构预测是指根据蛋白质的氨基酸序列信息,利用计算机模拟和数学建模预测出蛋白质的三维立体结构的技术。
蛋白质结构预测技术的发展历程大致可以分为以下四个阶段。
1.基于序列保守性推断的序列比对方法序列比对法是一种最早传统的结构预测方法之一,主要基于了分子生物学的序列保守性假设,即同族蛋白质序列之间的关系比异族蛋白质序列要更为接近,同时也利用了同源因子结构的技术。
该方法的缺点在于较为依赖生物物种数据库中已知的同源蛋白质序列,并且无法解决折叠状态中序列变异路径不同的问题。
2.基于从头构建法的物理模拟方法从头构建法是指利用高中生物化学、数学及计算机科学相关知识,对蛋白质分子的构成及其相互作用力的原理进行理解,以及从分子结构相空间机构的角度进行蛋白质结构模拟的技术。
该方法可以绕过序列比对路径不同的缺点,但准确率较低、计算时间较长,并且需要较高的数学和物理素养。
3.基于同源建模法的结构对比和补全方法同源建模法是一种结构对比与预测的重要手段,通过利用已知蛋白质结构作为种子结构的替代物,比较它们所共有的氨基酸序列和结构,以此预测蛋白质分子之间的空间排列。
同源建模法适用于那当前有完整的同源确定模板结构的情况,但需要较强的生物学知识支持。
4.基于机器学习的预测方法机器学习是数据挖掘、人工智能和统计学应用领域中的一种技术,并被广泛用于蛋白质的结构预测和设计。
与其他方法相比,机器学习方法具有更好的处理大量数据的能力,准确度更高,并且可以较快的体现出不同环境的影响。
二、蛋白质结构分析方法蛋白质结构分析是指对已有蛋白质结构的进一步分析研究,从而深入探讨蛋白质在生物学功能中所起的角色和机理,目前主要涉及到以下几种方法。
第五章 蛋白质分析及预测方法(新)
常采用参数Q3:Q3=(Pα+Pβ+Pcoil)/T, 其中Pα、Pβ、Pcoil分别代表预测α螺旋、β 折叠和无规则卷曲正确的氨基酸残基数,T 为总氨基酸残基数。
亦有人建议用不同二级结构预测的相关系数
Ci来评估。如Cα表示α螺旋预测相关系数:
C (PN UO) (N U)(N O)(P U)(P O)
三、二级结构预测的准确度 总的来讲,单序列的预测准确度在60%左右, 应用多重序列对比信息的二级结构预测准确 度在65%~85%之间。
从1994年起每两年国际上都要举行一届关于 蛋白质结构预测进展方面的评估(critical assessment of protein structure prediction, CASP)
应用蛋白酶将胶上或膜上分离出的蛋白断裂成肽 片段,通过MALDI-MS或ESI-MS得到肽质指纹图 谱,搜索数据库,可对蛋白质进行鉴定。常用的 在 线 肽 质 指 纹 图 谱 分 析 工 具 有 ExPASy 的 PeptIdent (/tools/peptident.html)
Cuff J. A. and Barton G.(1999) Jones, D. T. (1999)
准确性
作者评测:Q3=57% CASP2:Q3=55.4%(41.9-62.5)
作者评测:Q3=63%
作者评测:Q3=70.1% CASP2:Q3=69.5% [57.3-87.2]
作者评测:Q3=75%
(http://npsa-pbil.ibcp.fr/cgibin/npsa_automat.pl?page=/NPSA/npsa_seccons. html)服务,其二级结构预测可由用户从SOPM、 HNN、DPM、DSC、GOR、PHD、PREDATOR、 SIMPA96等12种方法中任选几种进行预测,然后根 据预测结果汇集整理成一个“一致的结果”
蛋白质的一级结构分析与预测方法
蛋白质的一级结构分析与预测方法蛋白质是一类生物分子,它们在机体中起到了举足轻重的作用。
蛋白质分子结构的研究是生物学、药学等领域的热门研究方向。
在研究蛋白质的结构、功能和特性时,常常需要对其一级结构进行分析和预测。
本文将介绍蛋白质一级结构的分析与预测方法。
一、蛋白质一级结构概述蛋白质的一级结构指的是其氨基酸序列。
蛋白质分子由20种左右的氨基酸组成,通过不同的排列组合构成不同的蛋白质。
氨基酸是一种含有羧基(-COOH)、氨基(-NH2)和一侧链的有机化合物,它们通过肽键相连构成肽链,进而构成蛋白质分子。
蛋白质的一级结构是其二级、三级结构和功能的基础。
因此,研究蛋白质的一级结构对于研究蛋白质的结构和功能具有非常重要的意义。
二、蛋白质一级结构分析方法1. 比对分析法:比对分析法是一种通过比对蛋白质序列进行分析的方法。
这种方法通过比对蛋白质序列与已知蛋白质数据库中的序列进行比较,从而推测出该序列可能具有的功能和结构。
比对分析法具有预测准确率高、速度较快等优点,因此被广泛应用于蛋白质序列的分析领域。
2. 生物物理学方法:生物物理学方法包括了一系列的实验方法,如X射线晶体衍射等,可以用来研究蛋白质的空间构象和形态。
通过对蛋白质分子的实验分析,可以进一步了解其一级结构及其对应的生物学功能。
3. 生物信息学方法:生物信息学方法是一种透过计算机程序对蛋白质序列进行分析的方法。
生物信息学方法可以预测蛋白质的物理化学性质、表观结构和功能等,包括常见的基于机器学习方法的蛋白质结构预测模型和关于序列特征分析、耦合谱分析的小标签搜索技术。
生物信息学方法是当前研究蛋白质的一级结构的热门方法之一。
它以深度学习模型和新算法为手段,对大量的已知蛋白质序列进行训练,然后使用预测模型对新蛋白质进行预测。
生物信息学方法具有速度快、预测准确率高等优点,因此仍在不断发展和完善。
三、蛋白质一级结构预测方法1. 基于比对分析法的蛋白质一级结构预测:由于氨基酸序列是蛋白质一级结构的关键,因此比对分析法也可以被用于预测蛋白质一级结构。
第五章 蛋白质结构预测和分子设计
• TMpred (/software/TMPRED_form.html)
预测蛋白质的跨膜区段和在膜上的取向,它根据来自SWISS-PROT的跨 膜蛋白数据库Tmbase,利用跨膜结构区段的数量、位置以及侧翼信息,通
过加权打分进行预测。
•SignalP (http://www.cbs.dtu.dk/services/SignalP/) 信号肽(signal peptide)是未成熟蛋白质中,可被细胞转运系统识别的 特征氨基酸序列。预测蛋白质序列中信号肽的剪切位点。
级结构则效果很差。
二级结构预测的基本策略: (1)相似序列→相似结构
QLMGERIRARRKKLK
QLMGAERIRARRKKLK
结构?
(2)分类分析
α 螺旋
提取样本
预测….-Gly-Ala-Glu-Phe-….
聚类分析
学习分类规则
二级结构预测的方法:
(1)
经验参数法 又称Chou-Fasman方法,是一种基于单个氨基酸残基统计的经验预测方法。 通过统计分析,获得的每个残基出现于特定二级结构构象的倾向性因子, 进而利用这些倾向性因子预测蛋白质的二级结构。
蛋白质结构预测主要有两大类方法:
(1)理论分析方法
通过理论计算(如分子力学、分子动力学计算)进行结构预测。
这种方法由于折叠前后的能量差太小、蛋白质可能的构象空间庞大和 质折叠的计算量太大等原因不大可行。 (2)统计的方法 对已知结构的蛋白质进行统计分析,建立序列到结构的映射模型, 进而对未知结构的蛋白质根据映射模型直接从氨基酸序列预测结构。
预测每个氨基酸的二级结构类型。 它将蛋白质结构类型分为全α蛋白、
全β蛋白和α/β蛋白,输出结果包括“H”(螺旋)、“E”(折叠)和“-”(转角)。 这个方法对全α蛋白能达到79%的准确率。
蛋白质结构预测与功能分析的方法和挑战
蛋白质结构预测与功能分析的方法和挑战引言:蛋白质是生物体内起着各种重要功能的分子,其结构决定了其功能。
然而,蛋白质的结构预测和功能分析是一个具有挑战性的领域。
本文将介绍蛋白质结构预测和功能分析的方法和挑战,并探讨了当前在此领域的前沿研究。
一、蛋白质结构预测的方法1. 实验方法:实验方法是蛋白质结构预测中最直接的方法。
例如,X射线晶体学、核磁共振等技术可以通过精细的实验来确定蛋白质的三维结构。
然而,实验方法通常需要大量时间、资源和专业设备,并且对于一些复杂的蛋白质结构预测来说,往往不够精确和高效。
2. 计算方法:计算方法是目前蛋白质结构预测的主要方法。
它利用物理化学原理以及计算机模拟技术来预测蛋白质的结构。
常用的计算方法包括蛋白质折叠动力学模拟、基于模板的方法和基于机器学习的方法。
蛋白质折叠动力学模拟是通过模拟蛋白质内部的原子之间的相互作用和运动路径来预测蛋白质的结构。
这种方法可以提供一个原子级别的描述,但是牺牲了计算的效率。
另外,由于折叠模拟需要大量计算,能够进行快速准确的折叠模拟仍然是一个巨大的挑战。
基于模板的方法利用已知的蛋白质结构来寻找与目标蛋白质相似的结构,从而预测目标蛋白质的结构。
这种方法的优势在于速度较快,但是仅适用于已知结构类似的蛋白质。
基于机器学习的方法则依赖于已知蛋白质结构与功能之间的关联,通过训练模型来预测目标蛋白质的结构和功能。
这种方法的优势在于能够处理结构复杂、功能多样的蛋白质,但是对于大规模的蛋白质结构预测和功能分析来说,仍然面临着计算量大和训练集数据不足的挑战。
二、蛋白质功能分析的方法1. 序列比对方法:序列比对是一种常用的蛋白质功能分析方法。
它通过比较目标蛋白质的氨基酸序列与已知功能的蛋白质序列进行比对,从而判断目标蛋白质的功能。
这种方法的优势在于简单、快速,但是对于序列相似性较低的蛋白质来说,准确性会有所下降。
2. 结构比对方法:结构比对是一种基于蛋白质结构的功能分析方法。
蛋白质结构预测与分析技术
蛋白质结构预测与分析技术蛋白质是生命体中最基本和重要的分子之一。
在细胞中,它们承担着许多生物学功能,例如代谢调节、免疫反应、细胞信号传递、运输和细胞骨架的构建等。
蛋白质的结构对于其功能至关重要。
因此,对于蛋白质结构的预测和分析成为许多生物医学领域的研究重点。
蛋白质结构预测是一项用于推测蛋白质三维结构的技术。
由于实验鉴定技术的限制,仅有不到百分之一的蛋白质的结构经过实验鉴定得到。
然而,在基因组学时代,已经发现了数百万个蛋白质,这仍然是一个相当小的比例。
因此,为了了解蛋白质的结构和功能,预测技术巨大的潜在价值得到认识。
蛋白质结构预测技术分为基于序列(sequence-based)和基于结构(structure-based)的方法。
序列分析是一种基于蛋白质序列的预测技术,它利用信息学方法从蛋白质的序列中提取物理性质、化学性质和构象性质等特征。
标准的序列分析方法包括全序列比对、局部序列比对、筛选、分类以及聚类等。
现代蛋白质序列预测不仅仅包含基本的信息学方法,还使用了机器学习方法来解析复杂的序列信息和特征。
其中,支持向量机和神经网络技术是最常用的机器学习技术之一。
序列分析被广泛使用于蛋白质结构和功能的预测,以及蛋白质疾病预测,包括癌症、自身免疫、药物不良反应等。
相比之下,结构预测则是一种利用已知蛋白质的三维结构,以及现代化学物理方法来预测未知蛋白质的三维结构的技术。
基于结构的方法包括分子力学、量子化学、分子动力学等。
这些预测技术需要大量的计算资源,并且需要准确而有效的分子力场、数值计算方法,以及数学算法。
在这些方法中,分子动力学模拟技术可能是最成功的预测方法,它能够模拟蛋白质的动态行为并预测其未知结构。
结构预测技术在药物设计和基因工程等领域中迅速取得了丰硕的成果。
除了结构预测和序列分析之外,蛋白质结构还可以使用其他多种技术进行表征和分析。
其中,X射线晶体学和核磁共振技术可用于确定蛋白质的三维结构。
X射线晶体学需要制备蛋白质晶体以便进行 X射线衍射分析。
第五章 蛋白质分析及预测方法(新)
预测规则简述如下:
α螺旋规则: 沿着蛋白质序列寻找α螺旋核,相 邻6个残基中若有至少4个残基倾向于形成α螺旋, 则认为是螺旋核。然后螺旋核向两端延伸,直至 四肽片断的α螺旋倾向性因子的平均值Pα<1.0为 止。此外,Pro不容许在螺旋内部出现,但可出 现于C末端以及N端的前三位,这也用于终止螺 旋的延伸。最后,将螺旋两端各去掉3个残基, 剩余部分若长于6个残基,而且Pα>1.03,则 预测为螺旋。
应用蛋白酶将胶上或膜上分离出的蛋白断裂成肽 片段,通过MALDI-MS或ESI-MS得到肽质指纹图 谱,搜索数据库,可对蛋白质进行鉴定。常用的 在 线 肽 质 指 纹 图 谱 分 析 工 具 有 ExPASy 的 PeptIdent (/tools/peptident.html)
第八章 蛋白质分析及预测方法
一、分子量及等电点
蛋白质的一些基本性质可直接分析其一级序 列而获得,如蛋白质的氨基酸组成、分子质 量、等电点(pI)、亲水性和疏水性、信号肽、 跨膜区等。
蛋白质的分子量和等电点可用一些本地化的 软件如MacVector、OMIGA、DNAMAN、 BioEdit等分析计算
用ProtScale中Kyte & Doolittle 算法分析人 NPD1蛋白结果示例
ProtScale除能分析蛋白质的亲/疏水性外,还能 计算蛋白质的分子量、极性,预测二级结构等, 共包括了50余种不同的算法。
除ProtScale外,蛋白质序列统计分析 (Statistical Analysis of Protein Sequences, SAPS)是另一个计算蛋白质序列性质的在线工 具(http://www.isrec.isbsib.ch/software/SAPS_form.html),它可给出 查询序列的氨基酸组成、电荷分布(包括正/负 电荷聚集区的位置,强带电或不带电区段,电 荷分布连续性和模式等)、高疏水性和跨膜区 段、重复结构及周期性分析等属性。
蛋白质序列分析
/protscale/
利用BioEdit软件分析 软件分析 利用
5. Coil区分析 区分析 蛋白质中由2-7条 螺旋链相互缠绕形成类似麻花状结 蛋白质中由 条α螺旋链相互缠绕形成类似麻花状结 构的总称; 构的总称; 主要存在形式是2-5条相互缠绕形成的平行或反平行 主要存在形式是 条相互缠绕形成的平行或反平行 同寡聚体或异寡聚体; 同寡聚体或异寡聚体; 是控制蛋白质寡聚化的元件,转录因子、骨架蛋白、 是控制蛋白质寡聚化的元件,转录因子、骨架蛋白、 动力蛋白、膜蛋白、酶等; 动力蛋白、膜蛋白、酶等; 七肽重复区。 七肽重复区。 例,使用COILS服务器分析 使用 服务器分析 /software/COILS_form.html
第五章 蛋白质序列分析
蛋白质序列的基本性质分析
理化性质分析,疏水性分析,跨膜区分析,信号肽预测, 理化性质分析,疏水性分析,跨膜区分析,信号肽预测, Coil区分析,亚细胞定位 区分析, 区分析
结构域分析及motif搜索 搜索 结构域分析及 空间结构预测
二级结构及三级结构预测, 二级结构及三级结构预测,结构预测方法评价
模建评 价
比对、模建、 比对、模建、 模板选择
四级结构 模建日志 配合物模 建日志
通过CPHmodels同源模建 同源模建 通过 http://www.cbs.dtu.dk/services/CPHmodels/
(2)折叠识别 ) 原理:将序列“ 原理:将序列“穿”入已知的各种蛋白质折叠子骨架 内,通过目的蛋白序列与已知折叠子的逐一比对,计 通过目的蛋白序列与已知折叠子的逐一比对, 算出未知结构序列折叠成各种已知折叠子的可能性; 算出未知结构序列折叠成各种已知折叠子的可能性; 折叠子一般包括一个或多个蛋白质超家族; 折叠子一般包括一个或多个蛋白质超家族; 每个折叠子的结构内核有确定的结构特征; 每个折叠子的结构内核有确定的结构特征; 基于序列同源性很低的蛋白质都可能存在结构相同的 折叠子进行预测。 折叠子进行预测。 例,通过PHYRE系统进行折叠识别预测 通过 系统进行折叠识别预测 /~phyre/index.cgi (3)从头预测 )
第五章 蛋白质分析及预测方法(新)
常采用参数Q3:Q3=(Pα+Pβ+Pcoil)/T, 其中Pα、Pβ、Pcoil分别代表预测α螺旋、β 折叠和无规则卷曲正确的氨基酸残基数,T 为总氨基酸残基数。
亦有人建议用不同二级结构预测的相关系数 Ci来评估。如Cα表示α螺旋预测相关系数:
C (PN UO ) ( N U )(N O )(P U )(P O )
四、疏水性
在线可用ExPASy的 ProtScale(/cgibin/protscale.pl )程序。疏水性预测的方法 依赖于疏水性的衡量尺度,这里每个氨基 酸根据其一系列的物理特性(例如,溶解 性、跨越水-汽相时产生的自由能等), 被赋予一个数值以代表其疏水性。
Levin JM, Garnier J (1988) Mehta PK, Heringa J, Argos P (1995)
预测规则简述如下:
α螺旋规则: 沿着蛋白质序列寻找α螺旋核,相 邻6个残基中若有至少4个残基倾向于形成α螺旋, 则认为是螺旋核。然后螺旋核向两端延伸,直至 四肽片断的α螺旋倾向性因子的平均值Pα<1.0为 止。此外,Pro不容许在螺旋内部出现,但可出 现于C末端以及N端的前三位,这也用于终止螺 旋的延伸。最后,将螺旋两端各去掉3个残基, 剩余部分若长于6个残基,而且Pα>1.03,则 预测为螺旋。
(四)、基于多重序列比对的二级结构预测
基于单个序列的二级结构预测方法经过近三十年的发 展,虽然可以利用的实验数据有了数十倍的增长,但 预测准确度提高得不明显。在单个残基基础上的预测 准确度在58%左右。 近年来将同源序列的信息引入二级结构预测中,可以 将二级结构预测的准确度提高到70%左右。基于同源 序列对比的二级结构预测方法有两类:一类是自动程 序算法,如改进的GOR方法及PHD;另一类是专家参 与的多重序列对比,然后进行二级结构预测。随着多 重序列搜寻方法PSI-BLAST的发展,基于PSI-BLAST 多重序列比对的二级结构预测方法PSIPRED也见诸报 道。PSIPRED利用PHD的算法,将PSI-BLAST产生的 多重序列比对用于训练及预测,使预测准确度从70% 提高到77%。
蛋白质结构预测与分析
蛋白质结构预测与分析蛋白质是构成生物体的重要有机分子,具有复杂的结构和多种生物作用。
研究蛋白质的结构预测和分析是生命科学的重要研究领域之一。
本文将从蛋白质结构预测的方法、蛋白质结构的分析和应用方面对蛋白质结构预测与分析进行探讨。
一、蛋白质结构预测的方法蛋白质的结构决定了其生物功能,因此蛋白质结构预测成为生物学研究的重要方向。
目前,通过生物实验手段进行蛋白质结构研究较为困难,而计算机辅助预测方法可以快速准确地预测蛋白质的结构。
常见的蛋白质结构预测方法主要有以下四种:1、模板比对法模板比对法是以已知结构的蛋白质为模板,通过比对该蛋白质和待预测蛋白质的序列相似性,预测待预测蛋白质的结构。
该方法因依赖于已知结构的蛋白质,仅适用于序列相似性较高的蛋白质。
2、剪切组装法剪切组装法是基于“妇女的裙子原理”进行的结构预测方法,通过将蛋白质结构进行剪切,然后组装配对,最终合成蛋白质的整体结构。
该方法适用于蛋白质序列较长的情况。
3、物理场模拟法物理场模拟法是基于物理学的原理进行的结构预测方法,通过模拟氨基酸的位移和环境对结构的影响,来预测蛋白质的最终结构。
该方法机制比较清晰,但需要耗费大量的时间和计算资源。
4、蛋白质构象库法蛋白质构象库法是通过收集已知的蛋白质结构数据进行计算,然后根据各种参数进行结构的匹配和比对,最终得到预测蛋白质的结构。
该方法适用于蛋白质序列比较短的情况。
二、蛋白质结构的分析蛋白质结构的分析是揭示蛋白质性质和生物功能的重要手段。
具体来说,蛋白质结构的分析包括以下几个方面:1、序列分析序列分析是通过分析蛋白质序列来了解其基本属性和功能。
通过对氨基酸序列进行分析,可以推测蛋白质的化学性质、空间构象和分子特征等信息。
序列分析是蛋白质结构基础的关键环节。
2、结构分析结构分析是对蛋白质结构进行深入的解剖,通过分析蛋白质的二级结构、三级结构和四级结构等不同层面的结构信息,了解蛋白质分子内部的氢键、离子键、疏水相互作用等信息,揭示其生物活性和生理功能等方面的信息。
蛋白质立体构型的分析和预测
蛋白质立体构型的分析和预测蛋白质是生命的基础单位,是细胞内最重要的有机分子之一,而蛋白质的立体构型则是其功能发挥的基础。
因此,对蛋白质立体构型的分析和预测一直是生物化学和生物信息学领域的热点研究方向。
一、蛋白质的结构与立体构型蛋白质的基本结构由氨基酸组成,而氨基酸之间通过肽键连接起来形成多肽链。
多肽链通常在生物体内通过一个折叠过程,形成一定的立体构型,即蛋白质的三级结构:一级结构是指氨基酸的线性排列顺序,二级结构则主要由肽链中的氢键和范德华力决定,可以分为α-螺旋、β-折叠片、回旋和卷曲等形式,三级结构则是指蛋白质分子的整体立体构形。
水电平衡、疏水作用、静电互斥等化学性质是控制蛋白质折叠和立体构型形成的主要因素。
二、蛋白质立体构型的表征蛋白质的立体构型可以通过一些物理化学手段进行表征。
例如X-射线晶体学、核磁共振和电子显微镜等,这些技术可以用于获得高分辨率的蛋白质结构和构型信息。
此外,蛋白质立体构型的分子模拟和计算机模拟也可以预测并表征蛋白质的立体构形。
三、蛋白质结构和立体构型的生物功能蛋白质的生物功能与其立体构形息息相关。
因为蛋白质的立体构形决定了它的化学反应能力、结合能力和识别能力等,例如酶催化、配体结合和信号转导等功能都依赖于蛋白质的立体构形。
此外,蛋白质与其他分子之间的相互作用也受到蛋白质立体构型的制约,进一步影响了蛋白质的生物功能。
四、蛋白质立体构型的研究进展随着技术手段的不断改进,对蛋白质立体构型的研究越来越深入,同时也发展出了一系列新型的蛋白质分析方法。
例如,基于蛋白质表面上的二面角参数的预测方法、基于晶体学数据的分子动力学模拟方法、基于核磁共振的立体构象分析方法和基于电子显微镜的蛋白质三维重构方法等。
这些技术的发展,为生物学和医学上的相关研究提供了坚实的基础。
五、结语蛋白质的立体构型是其生物功能的基础,因此研究蛋白质立体构型的分析和预测具有极其重要的科学意义。
随着相关技术的不断提高和新型方法的发现,蛋白质立体构型的研究领域将迎来一个新的发展时期。
蛋白质结构预测及分析方法
蛋白质结构预测及分析方法蛋白质是构成生命体系的基本单位之一。
理解蛋白质的结构和功能对于研究生命科学及制药领域至关重要。
蛋白质结构预测及分析方法的发展,成为实现相关领域重要进展的基础。
一、蛋白质的结构类型蛋白质的结构分为四级:一级结构是氨基酸序列,由20种氨基酸组成;二级结构是α-螺旋和β-折叠;三级结构是蛋白质超级结构的折叠方式,包括α/β、α+β等;四级结构组成具有特定功能的蛋白质复合物。
二、蛋白质结构预测方法蛋白质结构预测是指通过计算机软件和算法,根据氨基酸序列推测出蛋白质的三维结构。
蛋白质结构预测方法包括两大类:基于物理化学原理的方法和基于知识库的方法。
1. 基于物理化学原理的方法此类型方法着眼于蛋白质折叠的物理化学原理,如丝氨酸-脱氨酶算法,Monte Carlo 模拟法,分子动力学模拟法、分子力学优化法(MM),分子动力学(MD)、蒙特卡罗(MC)等。
2. 基于知识库的方法此类型方法是将许多已知蛋白质三维结构的信息整合在一起,来推测目标蛋白质的三维结构,主要分为模板模拟和 threading 方法。
三、蛋白质结构分析方法蛋白质结构分析是揭示蛋白质折叠和功能机制的重要方法。
当前主要技术包括晶体学、核磁共振、质谱、电镜及计算机模拟等。
1. 晶体学晶体学是目前研究蛋白质结构最常用的方法。
它通过形成蛋白晶体,利用X射线衍射技术解析出蛋白质的三维结构。
在核酸蛋白方面,核磁共振技术被广泛应用。
2. 质谱质谱是通过分析蛋白质分子的质量和分子结构,进而解析出分子组成和结构。
质谱 technique 的应用范围非常广泛。
3. 电镜电镜是通过高分辨率电子显微镜技术探测到蛋白质或蛋白质-蛋白质/小分子相互作用下形成的大分子结构。
4. 计算机模拟除了前两种方法外,计算机模拟也是一项重要的分析技术,蛋白质动力学模拟是代表性的计算机模拟方法之一。
四、蛋白质结构预测及分析的应用1. 药物设计药物设计中需要对蛋白质进行结构预测和分析,以了解药物与蛋白质相互作用的机制,为新药物的设计提供依据。
蛋白质的序列分析及结构预测
蛋白质的序列分析及结构预测蛋白质序列分析和结构预测是生物信息学中的一个重要研究领域。
蛋白质是生物体内具有功能的大分子,其结构决定了其功能。
了解蛋白质序列和结构可以帮助我们研究蛋白质的功能和生物过程。
蛋白质序列分析的第一步是进行蛋白质的序列比对。
蛋白质序列比对可以帮助我们找到相似的序列,从而进行进一步的研究。
常用的序列比对方法包括序列比对算法和数据库算法。
序列比对可以通过计算序列之间的相似性来研究蛋白质的进化关系和功能。
在序列比对的基础上,可以进行蛋白质的结构预测。
蛋白质结构预测是确定蛋白质在空间中的三维结构。
蛋白质的结构决定了其功能,所以了解蛋白质的结构对于研究蛋白质的功能和相互作用很重要。
蛋白质结构预测包括以下几种方法。
第一种方法是模板比对。
模板比对是基于已知蛋白质结构库的比对方法。
通过比对蛋白质序列和已知结构的序列,可以预测出蛋白质的结构。
这种方法利用已知结构和序列的对应关系,可以预测出蛋白质的结构。
第二种方法是基于物理性质的结构预测。
这种方法基于蛋白质的物理性质,通过计算蛋白质分子的力学能量和动力学来预测蛋白质的结构。
这种方法较为复杂,需要大量的计算资源。
第三种方法是基于机器学习的结构预测。
机器学习是一种利用算法和统计学方法来训练和预测的方法。
这种方法可以利用蛋白质的序列和结构的关系来预测蛋白质的结构。
利用机器学习方法,可以通过大量的样本和特征来训练模型,从而预测蛋白质的结构。
蛋白质序列分析和结构预测是生物信息学中的重要研究领域。
通过对蛋白质序列和结构的研究,可以揭示蛋白质的功能和生物过程。
这对于研究蛋白质的功能和疾病的机制有重要的意义,并为药物设计和治疗提供了理论基础。
蛋白质功能和结构的预测及验证方法
蛋白质功能和结构的预测及验证方法蛋白质是细胞中最重要的分子之一,它在细胞的生命活动中扮演着重要的角色。
蛋白质功能和结构的预测及验证方法是现代生物学研究的一个重要课题。
本文将介绍蛋白质功能和结构的预测及验证方法。
一、蛋白质功能和结构的预测方法1. 基于序列相似性的预测方法蛋白质序列是蛋白质功能和结构预测的起点,因为它包含了蛋白质的遗传信息。
基于已知蛋白质序列的功能和结构,可以通过比对新的蛋白质序列和已知蛋白质序列的相似性,进行预测。
这种方法被称为基于序列相似性的预测方法。
2. 基于结构相似性的预测方法蛋白质的结构一般由多个氨基酸残基组成的链条折叠而成。
因此,蛋白质的结构相似性被认为是蛋白质功能相似性的一个指示器,基于结构相似性的预测方法被广泛运用。
3. 基于机器学习的预测方法机器学习是一种有效的方法,可用于从大量数据中提取模式并利用这些模式进行预测。
因此,基于机器学习的预测方法在预测蛋白质功能和结构方面发挥着重要作用。
二、蛋白质功能和结构的验证方法蛋白质功能和结构的预测是有局限性的,因此需要验证方法。
以下是蛋白质功能和结构的验证方法:1. 蛋白质生物学实验方法一种常规的方法是直接通过实验来确定蛋白质的功能和结构。
例如,用X射线晶体衍射来确定蛋白质的结构,或者使用质谱分析来确定蛋白质的功能。
2. 生物信息学计算方法现代生物信息学技术发展迅速,引入了许多计算方法用于预测蛋白质功能和结构。
生物信息学方法可以通过分子动力学模拟、结构对比等方式验证预测结果的正确性。
3. 全基因组学方法随着全基因组测序技术的发展,我们可以通过对大量生物样品的基因组分析,发现不同物种、不同基因组之间的相似性和差异性。
利用这些差异,可以预测蛋白质的功能和结构。
三、小结蛋白质功能和结构的预测及验证方法是生命科学的一个重要课题。
虽然各种预测方法都有其局限性,但通过将多种不同的方法结合起来,可以更准确地预测蛋白质的功能和结构。
同时,验证方法也很重要,可以帮助验证预测结果的正确性,促进科学研究的进展。
蛋白质结构预测及功能分析
蛋白质结构预测及功能分析蛋白质是生物体中最重要的分子之一,它们在所有生物过程中都扮演着至关重要的角色。
蛋白质的结构和功能密切相关,因此,了解蛋白质结构和功能的预测方法非常重要。
蛋白质结构预测蛋白质结构预测是指通过计算机模拟尽可能准确地预测蛋白质的三维结构。
蛋白质的三维结构对其功能的发挥具有决定性作用。
目前蛋白质结构预测主要有以下几种方法。
1.同源建模同源建模是目前最常用的蛋白质结构预测方法。
该方法利用已知结构的同源蛋白作为模板,将目标蛋白质的氨基酸序列映射到模板上,并利用该序列与模板的相似性进行模型的构建。
同源建模可分为比对模型和线状模型两类,分别适用于不同的情况。
但是,同源蛋白往往无法为所有蛋白质预测提供足够的结构信息,因此同源建模的成功率有限。
2.蒙特卡罗模拟蒙特卡罗模拟是一种适用于小分子和生物大分子的模拟方法,可预测单个蛋白质分子的结构。
该方法的核心思想是通过对目标蛋白质的氨基酸序列进行随机采样,预测出多种蛋白质结构。
随着模拟次数的增加,优化出最优的模型。
然而,由于蛋白质分子极其复杂,预测准确度较低,蒙特卡罗模拟方法的应用也相对较少。
3.基于物理模型的构象生成这种方法依靠分子力学模拟来计算蛋白质分子的结构。
通常来说,根据目标蛋白质的结构和特征,将其转化为具有物理意义的模型,然后在模型中寻找能量最小的构象。
基于物理模型的构象生成方法能够逼近蛋白质的真实结构,因此准确率相对较高,但计算复杂度也较高。
4.新方法目前,随着新技术的发展,越来越多的预测方法被提出。
例如,利用神经网络来预测结构。
这种方法基于蛋白质序列的嵌合层次结构建立一系列神经网络,并将网络输出与已知的蛋白质结构进行比较。
此外,深度学习等新技术也可以应用于蛋白质结构预测中,为该领域的发展带来了更大的机遇。
蛋白质功能分析蛋白质的功能与其结构密切相关。
通过分析蛋白质的结构,可以预测其可能的功能。
常见的蛋白质功能分析方法如下:1.同源分析同源分析是一种检测蛋白质同源性的方法,通过比较蛋白质序列的相似性和功能,预测蛋白质的功能。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
为了避免需要大量的实验数据,GOR方法将信 息函数分为多项加和形式,并且只考虑双残基 及单残基所携带的信息:一个残基携带其自身 的二级结构信息,同时携带有另一个残基的二 级结构信息,包含不依赖于另一残基类型的和 依赖于另一残基类型的信息。
三、酶切及断裂位点
ExPASy的PeptideCutter (/tools/peptidecutter /)工具可预测蛋白质序列在特定蛋白酶或 化学试剂作用下的断裂位点
PeptideMass (/tools/peptidemass.html)是ExPASy中另一个分析内切产 物的工具,它可计算蛋白质经特定酶水解 得到的肽片段的分子量、理论等电点等。
用ProtScale中Kyte & Doolittle 算法分析人 NPD1蛋白结果示例
ProtScale除能分析蛋白质的亲/疏水性外,还能 计算蛋白质的分子量、极性,预测二级结构等, 共包括了50余种不同的算法。
除ProtScale外,蛋白质序列统计分析 (Statistical Analysis of Protein Sequences, SAPS)是另一个计算蛋白质序列性质的在线工 具(http://www.isrec.isbsib.ch/software/SAPS_form.html),它可给出 查询序列的氨基酸组成、电荷分布(包括正/负 电荷聚集区的位置,强带电或不带电区段,电 荷分布连续性和模式等)、高疏水性和跨膜区 段、重复结构及周期性分析等属性。
(http://npsa-pbil.ibcp.fr/cgibin/npsa_automat.pl?page=/NPSA/npsa_seccons. html)服务,其二级结构预测可由用户从SOPM、 HNN、DPM、DSC、GOR、PHD、PREDATOR、 SIMPA96等12种方法中任选几种进行预测,然后根 据预测结果汇集整理成一个“一致的结果”
常采用参数Q3:Q3=(Pα+Pβ+Pcoil)/T, 其中Pα、Pβ、Pcoil分别代表预测α螺旋、β 折叠和无规则卷曲正确的氨基酸残基数,T 为总氨基酸残基数。
亦有人建议用不同二级结构预测的相关系数
Ci来评估。如Cα表示α螺旋预测相关系数:
C (PN UO) (N U)(N O)(P U)(P O)
北京大学生物信息中心有该网站的镜像: /mirror/predictpro tein/。
3.GOR:网址为
http://molbioቤተ መጻሕፍቲ ባይዱ/compute/GO R.html 。
4、综合分析:位于法国里昂的CNRS(Centre National de la Recherche Scientifique)提供NPS@
第八章 蛋白质分析及预测方法
一、分子量及等电点
蛋白质的一些基本性质可直接分析其一级序 列而获得,如蛋白质的氨基酸组成、分子质 量、等电点(pI)、亲水性和疏水性、信号肽、 跨膜区等。
蛋白质的分子量和等电点可用一些本地化的 软件如MacVector、OMIGA、DNAMAN、 BioEdit等分析计算
三、二级结构预测的准确度 总的来讲,单序列的预测准确度在60%左右, 应用多重序列对比信息的二级结构预测准确 度在65%~85%之间。
从1994年起每两年国际上都要举行一届关于 蛋白质结构预测进展方面的评估(critical assessment of protein structure prediction, CASP)
(四)、基于多重序列比对的二级结构预测
基于单个序列的二级结构预测方法经过近三十年的发 展,虽然可以利用的实验数据有了数十倍的增长,但 预测准确度提高得不明显。在单个残基基础上的预测 准确度在58%左右。
近年来将同源序列的信息引入二级结构预测中,可以 将二级结构预测的准确度提高到70%左右。基于同源 序列对比的二级结构预测方法有两类:一类是自动程 序算法,如改进的GOR方法及PHD;另一类是专家参 与的多重序列对比,然后进行二级结构预测。随着多 重序列搜寻方法PSI-BLAST的发展,基于PSI-BLAST 多重序列比对的二级结构预测方法PSIPRED也见诸报 道。PSIPRED利用PHD的算法,将PSI-BLAST产生的 多重序列比对用于训练及预测,使预测准确度从70% 提高到77%。
Cuff J. A. and Barton G.(1999) Jones, D. T. (1999)
准确性
作者评测:Q3=57% CASP2:Q3=55.4%(41.9-62.5)
作者评测:Q3=63%
作者评测:Q3=70.1% CASP2:Q3=69.5% [57.3-87.2]
作者评测:Q3=75%
第二节 蛋白质二级结构预测
预测方法可以分为三类: 统计/经验算法,其中最为著名的有基于经
验统计规则的Chou-Fasman方法及基于信息 论算法的GOR方法;
物理—化学方法,基于对于蛋白质结构的物 理及化学原理的预测,如Lim方法;
机器学习方法,致力于将前两种方法的优点 结合起来。
一、二级结构预测方法:
30℃ 0.001 0.01 SP S P
97 66
45
30 20
Effect of temperature on the expression of PG1605 gene
Compute pI/Mw对pI的确定基于早期Bjellqvist等的 实验,该实验根据多肽在含高浓度(9.2~9.8mol/L) 尿素缓冲液中,酸性pH梯度(pH4.5至pH7.5)电 泳中的迁移率来计算其pK值和pI值,然后根据氨基 酸序列和pI关系来预测,因此在计算碱性蛋白质的 理论pI值时可能不准确。
ProtParam可计算蛋白质分子量、理论等电点、氨 基酸组成、各原子组成、在280nm附近的吸光系数、 估计半衰期、稳定指数等,但如蛋白质中含翻译后 修饰过的氨基酸残基,则不计算在内。
二、蛋白质辨识
(一)、基于组成的蛋白质辨识
可利用ExPASy的AA CompIdent (/tools/aacomp/)去检索
(一)、Chou-Fasman方法 Chou-Fasman方法曾经是现在仍然是最为普
遍应用的方法。 其基本出发点在于对于蛋白质20种不同的氨
基酸残基在不同的二级结构中出现的几率进 行统计分析得出在不同二级结构中出现的倾 向性。利用这种倾向性,加之周围残基的信 息,在一定规则的指导下就可以进行预测了。
β折叠规则 相邻5个残基中若有3个倾向于形 成β折叠,则认为是折叠核,折叠核向两端延 伸直至4个残基的平均折叠倾向性因子Pβ<1.0。 若延伸后的片断Pβ>1.05,则预测为β折叠。
转角规则 四肽片断,若位置专一性转角形成 几率f i+1·f i+2·f i+3·f i+4> 0.75×10-4 ,Pt > 1.0,并大于Pα和Pβ,则预测为转角。
预测规则简述如下:
α螺旋规则: 沿着蛋白质序列寻找α螺旋核,相 邻6个残基中若有至少4个残基倾向于形成α螺旋, 则认为是螺旋核。然后螺旋核向两端延伸,直至 四肽片断的α螺旋倾向性因子的平均值Pα<1.0为 止。此外,Pro不容许在螺旋内部出现,但可出 现于C末端以及N端的前三位,这也用于终止螺 旋的延伸。最后,将螺旋两端各去掉3个残基, 剩余部分若长于6个残基,而且Pα>1.03,则 预测为螺旋。
四、疏水性
在线可用ExPASy的 ProtScale(/cgibin/protscale.pl )程序。疏水性预测的方法 依赖于疏水性的衡量尺度,这里每个氨基 酸根据其一系列的物理特性(例如,溶解 性、跨越水-汽相时产生的自由能等), 被赋予一个数值以代表其疏水性。
应用蛋白酶将胶上或膜上分离出的蛋白断裂成肽 片段,通过MALDI-MS或ESI-MS得到肽质指纹图 谱,搜索数据库,可对蛋白质进行鉴定。常用的 在 线 肽 质 指 纹 图 谱 分 析 工 具 有 ExPASy 的 PeptIdent (/tools/peptident.html)
二、二级结构在线预测
1.PSIPRED:基于多重序列比对算法,服 务器网址为
/psipred/。
2.PredictProtein: 基于PHD算法,网址: /predictprotein
在线可通过ExPASy的Compute pI/Mw (/tools/pi_tool.html) 或ProtParam(/tools/ protparam.html)计算。
Temperature IPTG(mM)
M
22℃ 0.001 0.1 S PS P
(三)、神经网络方法
神经网络学习系统是一组有相互联系强度的 非线性的单元。用于二级结构预测的神经网 络多为误差回传式反馈网络。用于二级结构 预测的神经网络方法有许多种,其中代表性 的为最早发表的Qian和Sejnowski方法以及广 泛应用的PHD方法。相对而言神经网络方法 便于应用,有较高的预测准确度。最大的缺 点是没有明确的物理化学意义。
其中,Pα为预测是α螺旋且预测正确的残基数 (positive),Nα为非α螺旋预测正确残基数 ( negative ) , Oα 为 非 α 螺 旋 却 被 错 误 预 测 为α螺旋的残基数(false positives),Uα为 是α螺旋却未预测出的残基数(miss)。
算法 GOR1
GOR3 DSC
作者 Garnier J, Osguthorpe DJ, Robson B
(1978) Gibrat JF, Robson B, Garnier J (1987)
King RD, Sternberg MJE (1996)
PREDATOR Yi & Lander
NNSSP
Frishman D, Argos P (1996) Yi TM, and Lander S (1993) Salamov AA, Solovyev VV (1995)