生物信息学 第六章 蛋白质结构预测及分子设计
生物学中的蛋白质结构预测与设计技术
![生物学中的蛋白质结构预测与设计技术](https://img.taocdn.com/s3/m/da564f122bf90242a8956bec0975f46527d3a7c9.png)
生物学中的蛋白质结构预测与设计技术蛋白质是生命体中最为基本的生物大分子,其包括抗体、酶、激素、肌肉和细胞骨架等。
生物体的各种功能和结构都与蛋白质密切相关。
因此,研究蛋白质的结构和功能具有重要的生物学意义。
在过去的几十年中,生物学家们已经成功地结晶并测定了大量的蛋白质结构,这些结构的解析为研究蛋白质的结构与功能提供了很好的工具。
但是,这一方面的进展却是相对缓慢的,这是因为现有的实验方法困难重重,许多大分子结构决定问题难以解决。
因此,研究蛋白质结构预测和设计技术就显得极为重要。
蛋白质结构预测蛋白质的功能与其空间结构密切相关,因此,研究蛋白质结构预测技术就是尝试通过计算与模型来预测蛋白质的三维结构。
现在,有许多方法可以用来预测蛋白质的结构,这些方法大致可以分为三种类型:基于序列的预测、基于结构的预测和混合型预测。
基于序列的预测是从蛋白质序列信息中分析并预测蛋白质的结构;基于结构的预测是根据类似的已知结构寻找相似的结构,然后将它们重新组合来预测新蛋白质的结构;混合型预测则是结合序列和结构来进行预测,其中序列是预测的基础,而结构预测则提供附加的信息。
在这些预测技术中,最常用的方法是基于相似度的方法,例如,蛋白质结构比对和蛋白质折叠研究。
这些技术基于不同的理论和算法,包括分子动力学、蒙特卡洛模拟和量子力学计算等。
然而,这些方法无法预测所有类型的蛋白质结构。
另一个预测技术是基于机器学习,其利用人工神经网络和其他机器学习算法来预测蛋白质的结构。
这些方法要求很少的实验数据,可以快速地进行数据训练和预测,但是在处理大型蛋白质结构方面可能还存在问题。
蛋白质设计蛋白质设计是指将新的蛋白质结构与新的功能结合起来,以满足具体的应用需求。
这一领域的目标是设计出具有特定结构和功能的分子,并且能够稳定存在于化学环境中。
蛋白质设计一直是科学家们长追不舍的研究课题。
这项工作的关键在于构建蛋白质而非破坏它,这在很多方面都需要精心的设计。
生物信息学中的蛋白质结构预测技术使用技巧
![生物信息学中的蛋白质结构预测技术使用技巧](https://img.taocdn.com/s3/m/bc72537130126edb6f1aff00bed5b9f3f90f72ec.png)
生物信息学中的蛋白质结构预测技术使用技巧蛋白质是生物体内最关键的分子之一,它们扮演着许多生物学过程中的重要角色。
蛋白质的结构决定了其功能和相互作用方式,因此解析蛋白质的结构对于理解生物学的基本原理以及开发药物等应用具有重要意义。
然而,实验方法解析蛋白质的结构非常耗时和昂贵,因此,生物信息学中的蛋白质结构预测技术应运而生。
本文将介绍一些蛋白质结构预测技术的使用技巧。
1. 基于模板的方法基于模板的方法是最常用的蛋白质结构预测技术之一。
这种方法通过将目标蛋白质序列与已知结构的蛋白质序列进行比对,从而推测出目标蛋白质的结构。
在使用这种方法时,一些关键的技巧包括选择适当的模板蛋白质、进行正确的多序列比对以及修正结构模型的精度。
在选择模板蛋白质时,应优先选择与目标蛋白质序列相似度较高的结构。
同时,还需考虑模板蛋白质与目标蛋白质的结构和功能相似性。
较高相似性的模板蛋白质往往能提供更准确的结构预测。
多序列比对是生成准确结构模型的关键步骤之一。
在进行比对时,应评估比对的准确性,并进行相应的修正。
此外,合并多个比对结果,利用一些软件工具进行加权平均,可以提高模型的准确性。
修正结构模型的精度是进一步优化预测结果的关键步骤。
通过使用分子动力学模拟等方法,可以对结构模型进行优化和改进。
在进行结构修正时,还需评估修正后的模型与已知实验结构之间的相关性。
2. 基于物理原理的方法基于物理原理的方法使用物理学和化学原理来预测蛋白质的结构。
这些方法基于蛋白质的物理性质和相互作用力学原理,通过计算预测蛋白质的结构。
常用的方法包括分子力学、模拟退火和Monte Carlo等技术。
在应用基于物理原理的方法时,一个重要的技巧是选择合适的势能函数。
势能函数是在计算过程中描述蛋白质内部和外部相互作用能量的模型。
合适的势能函数可以提高结构预测的准确性。
此外,参数化和采样策略也是使用基于物理原理的方法的重要技巧。
参数化涉及到调整模型中的参数,使其更符合实验数据。
生物信息学中的蛋白质结构与功能预测
![生物信息学中的蛋白质结构与功能预测](https://img.taocdn.com/s3/m/b6b0af3826284b73f242336c1eb91a37f111328e.png)
生物信息学中的蛋白质结构与功能预测蛋白质是生物体内的重要分子,它们在维持生命活动中起着至关重要的作用。
了解蛋白质的结构和功能对于深入理解生物学过程、疾病发展以及药物设计具有重要意义。
然而,实验测定蛋白质的结构及其功能是一项耗时费力且成本高昂的工作。
为了解决这一问题,生物信息学中的蛋白质结构与功能预测成为一种有效的方法。
蛋白质结构预测是生物信息学中的重要研究领域之一。
根据蛋白质的氨基酸序列,结合生物化学、物理化学以及计算机科学的方法,可以建立一系列模型和算法,预测蛋白质的三维结构。
蛋白质的结构是决定其功能的基础,通过结构预测可以揭示蛋白质的功能和相互作用,为后续进一步的研究提供指导。
在蛋白质结构预测中,常用的方法有同源建模、折叠动力学模拟和密度泛函理论等。
同源建模是基于已知蛋白质结构和与待预测蛋白质具有较高相似性的蛋白质序列进行模拟和比对,从而预测待预测蛋白质的结构。
折叠动力学模拟则模拟蛋白质在空间中折叠成稳定结构的过程,通过分子力学和数值计算方法,获得预测蛋白质结构的可能构型。
而密度泛函理论则是利用量子力学的计算方法,建立不同蛋白质结构和功能之间的关联,实现蛋白质结构预测和功能预测的目的。
除了蛋白质结构预测,生物信息学中的蛋白质功能预测也是一个重要领域。
蛋白质功能是指蛋白质在生物体内扮演的具体角色,如催化反应、运输分子以及信号传导等。
通过分析蛋白质的序列、结构、水平和进化等特征,可以预测蛋白质的功能。
常见的蛋白质功能预测方法包括序列比对、结构域分析和机器学习等。
序列比对是常用的蛋白质功能预测方法之一,它通过比对待预测蛋白质序列与已知功能蛋白质序列的相似性,推断待预测蛋白质的功能。
对于已知功能蛋白质序列,可以通过蛋白质数据库的检索和分析来获取。
结构域分析则是基于蛋白质中的功能结构域来预测其功能。
功能结构域是指蛋白质中识别和结合特定物质的功能区域,可以通过各种软件工具进行识别和注释。
机器学习是一种颇有潜力的蛋白质功能预测方法,它借助计算机算法和统计模型,通过对已知功能蛋白质的训练,预测待预测蛋白质的功能。
生物信息学中的蛋白质结构预测与分析方法研究
![生物信息学中的蛋白质结构预测与分析方法研究](https://img.taocdn.com/s3/m/6fbcf15b876fb84ae45c3b3567ec102de3bddf44.png)
生物信息学中的蛋白质结构预测与分析方法研究生物信息学是将计算机科学、数学和生物学相结合的交叉学科,旨在利用计算机技术和算法来解决生物学中的问题。
在生物信息学领域中,蛋白质结构预测与分析一直是研究的热点之一。
蛋白质是生物体内执行生化功能的重要分子,其结构对其功能起着至关重要的作用。
因此,对蛋白质结构的预测和分析不仅有助于理解蛋白质的功能机制,还有助于药物设计和疾病治疗。
蛋白质结构预测方法主要分为多种:比对法、建模法和模拟法。
比对法是根据已知的结构相似蛋白质来预测目标蛋白质的结构,其中最常用的是同源建模方法。
同源建模方法通过寻找已知结构与目标蛋白质相似度高的结构模板,然后将模板结构与目标蛋白质序列进行比对,从而推断目标蛋白质的结构。
建模法是通过数学建模和计算方法来预测蛋白质的结构,其中较为常用的方法是蛋白质折叠模型和蒙特卡洛模拟法。
模拟法则是通过分子动力学模拟来模拟蛋白质的结构和动力学过程,从而预测蛋白质的结构。
在蛋白质结构分析方面,一些常用的方法包括结构比较、功能预测和网络分析。
结构比较是通过比较不同蛋白质的结构来揭示它们之间的相似性和差异性,从而探索其功能和进化关系。
功能预测则是根据已知结构和功能蛋白质的特征,来推断目标蛋白质的功能。
网络分析是通过建立蛋白质相互作用网络,来研究蛋白质在细胞内的相互作用关系和信号传递机制。
近年来,随着计算能力的不断提高和生物信息学算法的日益完善,蛋白质结构预测与分析方法也取得了长足的进步。
例如,深度学习技术在蛋白质结构预测中的应用不断扩大,通过训练大规模的数据集,可以有效地提高预测的准确性和可靠性。
另外,结合多种方法进行融合预测,如比对法和建模法的结合,也可以提高结构预测的准确性。
总的来说,蛋白质结构预测与分析方法的研究在生物信息学领域扮演着重要的角色,它不仅促进了对蛋白质功能的理解,还为药物设计和疾病治疗提供了有力的支持。
未来随着生物信息学技术的不断发展和创新,我们相信蛋白质结构预测与分析方法将会取得更大的突破,为生命科学领域的发展带来更多的可能性。
生物信息学对蛋白质结构预测和功能分析的研究
![生物信息学对蛋白质结构预测和功能分析的研究](https://img.taocdn.com/s3/m/6e0761efac51f01dc281e53a580216fc700a53c6.png)
生物信息学对蛋白质结构预测和功能分析的研究蛋白质是生命中重要的基础物质,具有重要的生物学功能,如酶、激素、抗体等,因此对蛋白质的结构预测和功能分析研究尤为重要。
这方面的研究需要利用多种方法和技术,而生物信息学则是其中一种重要的手段。
基于序列相似性的蛋白质结构预测蛋白质的结构与其功能密切相关,因此预测蛋白质结构是分子生物学与生物信息学研究的重要课题。
最直接的方法是通过分析蛋白质的X射线晶体结构来得出其三维结构,但这种方法需要大量时间和成本。
此外,许多蛋白质没有形成可晶化的结构,因此无法通过晶体学方法解析其结构。
为了突破这些困难,研究人员采用了生物信息学方法来预测蛋白质的结构。
这种方法基于序列相似性原理,即类似的蛋白质结构也具有相似的序列。
因此,通过对比目标蛋白质与已知结构相似的蛋白质序列,可以预测出其可能的结构。
这种方法称为序列比对,是一种常见的生物信息学技术。
利用模拟和机器学习的蛋白质结构预测除了基于序列相似性的方法,还有许多其他生物信息学技术可用于蛋白质结构预测。
例如,利用分子模拟技术可以通过模拟蛋白质分子的力学性质来预测其结构。
另外,也可以使用机器学习算法来进行结构预测。
这些方法不仅能为蛋白质结构的预测提供一种新的思路,而且为更精确地预测蛋白质的结构提供了新的可能性。
基于生物信息学的蛋白质功能分析蛋白质的结构与功能之间存在着紧密的关系,因此对蛋白质功能的分析也是生物信息学研究的重要内容。
在生物信息学领域,存在许多可用于预测蛋白质功能的工具。
例如,BLAST、HMMer 等可用于查找与已知蛋白质相似的序列,以推断其可能具有的功能和结构。
同时,生物信息学还涵盖了分子动力学模拟、系统生物学和蛋白质与小分子间相互作用等方面的研究,为蛋白质的功能研究和药物设计提供了重要的支持。
结论综上所述,生物信息学是预测蛋白质的结构和功能的重要工具之一。
基于序列比对、模拟、机器学习和其他技术的研究为预测蛋白质结构和功能提供了多样化的途径。
生物信息学中的蛋白质结构预测
![生物信息学中的蛋白质结构预测](https://img.taocdn.com/s3/m/7e2c7f7ece84b9d528ea81c758f5f61fb736283b.png)
生物信息学中的蛋白质结构预测蛋白质是生命活动中最为重要的一类生物大分子。
蛋白质的结构不仅决定了它的生物学功能,也决定了它与其他物质的相互作用。
因此,准确预测蛋白质的三维结构对于理解蛋白质生物学功能和设计新型药物具有重要意义。
蛋白质结构预测是生物信息学的重要研究领域之一。
整个蛋白质分子是由许多氨基酸残基组成的,而蛋白质的三维结构是由这些氨基酸残基的相对位置和某些其他的化学性质所决定的。
根据氨基酸序列来预测蛋白质的结构是一项十分复杂的任务,也是一个具有挑战性的问题。
目前,预测蛋白质结构的方法主要包括实验方法和计算方法两大类。
实验方法包括X射线衍射法、核磁共振法、电子显微镜等。
虽然实验方法可以得到高精度的蛋白质结构,但是时间和成本较高,且不适用于大规模的蛋白质结构的预测。
计算方法预测蛋白质结构是从氨基酸序列出发,通过分析氨基酸残基之间的相互作用力和空间构型来预测蛋白质的结构。
计算方法又可以分为基于比对的方法和基于物理力学的方法。
基于比对的方法是通过查找已知的蛋白质结构库,找到相似氨基酸序列的蛋白质结构,从而推测待预测蛋白质的结构。
这种方法可以获得结构精度较高的结果,但是对于新蛋白质的结构预测效果较差,因为其依赖于库中已有蛋白质的结构。
基于物理力学的方法是通过计算能量最小化来推测蛋白质的可能结构。
这种方法依赖于物理模型的建立,包括能量函数、模拟系统、模拟算法等。
能量函数是指一个复杂的计算模型,用来预测蛋白质的相互作用类型和强度。
模拟系统是指计算机模拟蛋白质分子的环境,包括水分子、离子等。
模拟算法是指用来求解最小能量状态的方法,如蒙特卡罗法、分子动力学法等。
在计算方法中,深度学习技术的应用为蛋白质结构预测带来了新的思路。
深度学习技术是一种通过训练神经网络来识别和分类数据的方法。
通过深度学习技术,可以从大量的结构数据中学习特征,并通过神经网络对蛋白质结构进行预测。
深度学习技术在蛋白质结构预测中的应用,可以通过提高结构预测的精度和速度,来为药物设计和生物学研究提供更多信息。
蛋白质结构预测与设计技术的研究与应用
![蛋白质结构预测与设计技术的研究与应用](https://img.taocdn.com/s3/m/a1162bb2bdeb19e8b8f67c1cfad6195f312be8a5.png)
蛋白质结构预测与设计技术的研究与应用近年来,蛋白质结构预测与设计技术逐渐成为生物信息学领域研究的热门话题,因其对于了解蛋白质的功能、结构和相互作用机制等方面的意义重大,也对药物研发、基因工程、生物制造等领域的发展起到重要的推动作用。
下面将介绍蛋白质结构预测与设计技术的研究与应用。
一、蛋白质结构预测技术蛋白质结构预测是指根据蛋白质序列信息,预测蛋白质折叠成稳定的三维结构的技术。
不同于普通的分子动力学(MD)模拟等实验手段,蛋白质结构预测利用计算机软件进行模拟和计算。
基于能量最小化、机器学习、统计学等方法,目前已有多种蛋白质结构预测算法开发出来。
其中比较有代表性的包括:1. RosettaRosetta是著名科学家David Baker及其团队开发的一款蛋白质结构预测软件。
该软件基于排斥相互作用原理、骨架碎片拼接技术和Monte Carlo退火模拟等算法,通过对结构多样性的探索,逐步寻找最佳的结构能量最小值,实现高精度的蛋白质结构预测。
2. AlphaFoldAlphaFold是由DeepMind研究团队开发的蛋白质结构预测软件,其特点是采用了深度学习技术,并且在2018年拿下了CASP13的蛋白质结构预测大赛的冠军。
AlphaFold的结构预测精度和准确性都非常高,能够以较快的速度预测出二级结构、域结构、全局结构的信息。
3. I-TASSERI-TASSER是基于蛋白质序列拼装的一款结构预测软件,其优点是具有高速、高效、准确的优点。
I-TASSER通过采用自适应模板拼贴和先进的物理力场优化算法,实现了一系列的分子建模和模拟操作,并将获得的结构导出为pdb格式文件。
第二、蛋白质结构设计技术蛋白质结构设计是指通过人工干预蛋白质质量、构件和环境,控制蛋白质折叠成特定结构的过程,从而改变其性质或功能的技术。
与蛋白质结构预测相比,蛋白质结构设计技术更具有操作性和可控性。
蛋白质结构设计技术可以应用于药物设计、酶催化、材料科学等领域,可实现人工设计“特异性结构”以及“新功能酶”等目标。
生物信息学中的蛋白质结构预测与分析
![生物信息学中的蛋白质结构预测与分析](https://img.taocdn.com/s3/m/f1691da4534de518964bcf84b9d528ea81c72fa8.png)
生物信息学中的蛋白质结构预测与分析蛋白质是生物体内的重要组分,负责多种生物功能的实现。
在生物信息学领域,蛋白质结构预测与分析是一个重要任务。
本文将介绍蛋白质结构预测与分析的基本概念、方法和应用。
蛋白质结构预测是指通过计算机模拟和理论推断等方法,预测出蛋白质的三维空间结构。
这对于了解蛋白质的功能和作用机制具有重要意义。
蛋白质的结构决定其功能,而蛋白质结构预测可以帮助科学家们理解蛋白质的功能和结构与功能之间的关系。
蛋白质结构预测的方法可以分为基于实验和基于计算两类。
基于实验的方法主要包括X射线晶体学和核磁共振等技术,可以直接确定蛋白质的原子级结构。
然而,由于实验条件的限制和技术的复杂性,直接实验法仅能获得少量蛋白质结构信息。
相比之下,基于计算的方法则更加高效、经济。
基于计算的方法主要包括序列比对、拓扑结构预测、折叠模拟等,可以提供大量的蛋白质结构预测信息。
序列比对是蛋白质结构预测的基础。
蛋白质的氨基酸序列决定了其最终的结构。
通过比对已知结构的蛋白质序列与目标蛋白质序列之间的相似性,可以预测目标蛋白质的结构。
拓扑结构预测是一种常用的方法,它利用蛋白质序列中存在的序列特征(如氨基酸窗口、氨基酸特异性突变等)来推断蛋白质的二级结构,并通过二级结构的拓扑关系来预测蛋白质的整体结构。
折叠模拟是一种较为高级的方法,通过模拟蛋白质氨基酸链的折叠过程,预测蛋白质的三维结构。
这些方法不仅可以单独应用,还可以相互结合,提高预测的准确性。
蛋白质结构预测的应用领域广泛,涵盖了生物学、医学、农业等多个领域。
在生物学研究中,蛋白质结构预测可以帮助科学家们理解蛋白质的功能和相互作用网络,探索生命的本质。
在药物研发中,蛋白质结构预测可以帮助科学家们设计更精确的药物靶点,并预测药物与靶点之间的相互作用方式。
在农业领域,蛋白质结构预测可以帮助科学家们改良作物,增加产量和抗病性。
此外,蛋白质结构预测还可以应用于食品科学、环境保护等多个领域。
生物信息学 第六章 蛋白质结构预测及分子设计
![生物信息学 第六章 蛋白质结构预测及分子设计](https://img.taocdn.com/s3/m/12803ad6d15abe23482f4d0a.png)
将protein.txt蛋白质序列 粘贴在文本框中
返回结果
氨基酸数目 相对分子质量
氨基酸组成
正/负电荷残基数
原子组成
分子式 总原子数 消光系数
E(Prot) = Num(Tyr)*Ext(Tyr) + Num(Trp)*Ext(Trp) + Num(Cystine)*Ext(Cystine) proteins in water measured at 280 nm: Ext(Tyr) = 1490, Ext(Trp) = 5500, Ext(Cystine) = 125 Absorb(Prot) = E(Prot) / Molecular_weight
蛋白质跨膜区特性
▪ 典型的跨膜螺旋区主要是由20~30个疏水性氨基酸(Leu、Ile、Val、Met、Gly、
Ala等)组成;
▪ 亲水残基往往出现在疏水残基之间,对功能有重要的作用; ▪ 基于亲/疏水量和蛋白质跨膜区每个氨基酸的统计学分布偏好性。
跨膜蛋白序列“边界”原则
▪ 胞外末端:Asp(天冬氨酸)、Ser(丝氨酸)和Pro(脯氨酸) ▪ 胞外-内分界区:Trp(色氨酸)
半衰期
不稳定系数
<40 stable >40 unstable
脂肪系数
总平均亲水性
注意: ProtParam 没有考虑蛋白质翻译后修饰、蛋白质多聚体等情况,故用 户在预测和分析此类特定蛋白质的基本理化性质时需要仔细审视反馈结果。
蛋白质结构预测
一、跨膜区分析
跨膜区预测:膜蛋白是一类结构独特的蛋白质,在各种细胞中普遍存在,同时发
蛋白家族(family)
检测(2D-PAGE,质谱仪,蛋白质芯片) 研究方法 基因组测序 蛋白预言
蛋白质结构预测与设计方法
![蛋白质结构预测与设计方法](https://img.taocdn.com/s3/m/5f28c826793e0912a21614791711cc7931b77812.png)
蛋白质结构预测与设计方法随着生物信息学和基因工程技术的发展,蛋白质结构预测和设计成为了重要的研究领域。
蛋白质是生命体中极其重要的一类分子,它不仅是生物体内激素、抗体和酶等生物功能大分子,同时还是生物化学研究中的重要探针。
因此,研究蛋白质结构预测与设计方法,对于理解生物化学和生物医学等领域具有十分重要的意义。
本文将从蛋白质结构与功能、蛋白质结构预测与设计原理、常用的蛋白质结构预测与设计方法等方面进行论述。
一、蛋白质结构与功能从化学结构上来看,蛋白质是一类高分子碳水化合物,是由氨基酸以肽键相连形成的长链分子。
其化学结构的特点是: 在分子中存在大量的氢键、离散键、与烷基相互作用等影响蛋白质结构的重要因素,这些因素使得蛋白质结构非常复杂,蛋白质的空间构象很有规律但也非常灵活。
蛋白质能够完成生命体内的各种功能是因为它的结构对相关生物分子的识别和互作起着至关重要的作用。
蛋白质的功能直接取决于它的三维结构:在结构基础上,蛋白质能够稳定地与其他生物分子发生相互作用。
这种作用在生物体内具有不可替代的作用,如酶的催化过程、神经传导、免疫反应等,这些生物学过程的承担者往往就是各种蛋白质。
二、蛋白质结构预测与设计原理生物中的蛋白质结构具有很高的多样性,但却难以被实验记录下来。
从这个意义上来看,蛋白质结构预测和设计的意义就显得尤为重要了。
蛋白质结构预测和设计的目的在于确定蛋白质的三维结构,并根据结构和功能间的关系进行分析和设计。
与传统的研究方法不同的是,蛋白质结构预测和设计方法是通过计算模拟分析确定蛋白质的可能结构和功能。
蛋白质结构预测和设计的方式是根据比较理性的原理进行的,即参照已知的蛋白质结构确定未知蛋白质的结构。
在比较的过程中,应选择最相似的结构模板,使模板结构适应于预测的蛋白质序列。
这样,就可以用已知结构的物质为通准存储器,在此基础下为预测或设计目标型蛋白质求数学解,进而为找到合适的解答方案提供重要的基础。
三、常用的蛋白质结构预测与设计方法(1)同源建模法同源建模法是最常用的蛋白质结构预测方法,在大量已知蛋白质结构模板中,通过序列比较找到最相似的结构模板,对预测蛋白质的三维结构进行模拟并预测其结构。
生物信息学中的蛋白质结构预测与分析
![生物信息学中的蛋白质结构预测与分析](https://img.taocdn.com/s3/m/23c03d633a3567ec102de2bd960590c69ec3d89b.png)
生物信息学中的蛋白质结构预测与分析生物信息学是一个研究生物学中的信息处理和分析的交叉学科,在生物科学领域中扮演着重要的角色。
其中,蛋白质结构预测与分析是生物信息学中的一个重要领域。
蛋白质是生物体内最基本的功能分子,其结构与功能密切相关。
因此,了解蛋白质的结构信息对于理解其功能和启示药物设计具有重要意义。
蛋白质结构可以分为四个层次:一级结构、二级结构、三级结构和四级结构。
一级结构是指蛋白质的氨基酸序列,即由哪些氨基酸组成;二级结构是指蛋白质中氨基酸之间的空间关系,包括α-螺旋、β-折叠等;三级结构是指蛋白质整体的空间构型,由氨基酸之间的相互作用决定;四级结构是指由多个蛋白质组成的聚合体,例如蛋白质复合物。
了解蛋白质的结构有助于我们理解蛋白质的功能和机制。
蛋白质结构预测是指通过计算模型和算法,预测未知蛋白质的结构。
由于实验方法尚未能够确定所有蛋白质的结构,因此蛋白质结构预测具有重要的研究意义。
在蛋白质结构预测中,可以采用多种方法,如基于机器学习的方法、蒙特卡罗模拟等。
其中,基于机器学习的方法是目前较为常用的方法之一。
通过将已知蛋白质的结构信息输入机器学习算法中,对未知蛋白质进行结构预测。
这种方法能够通过学习已有的蛋白质结构信息,从而预测未知蛋白质的结构。
蛋白质结构预测对于生物学研究和药物设计有着重要的应用价值。
蛋白质结构分析是在蛋白质的结构已知的情况下,对其结构进行深入研究和分析。
蛋白质结构分析可以从多个角度进行,如结构功能关系、动力学研究等。
其中,结构功能关系是蛋白质结构分析中的重要方面。
通过研究蛋白质的结构信息,可以理解蛋白质的功能和作用机制。
这对于生物学的研究和药物设计具有重要意义。
此外,蛋白质的动力学研究也是蛋白质结构分析中的重要内容之一。
蛋白质在生物体内不断发生构象变化,了解蛋白质的动力学行为对于理解其功能和机制具有重要意义。
蛋白质结构预测与分析在生物信息学中扮演着重要的角色。
通过蛋白质结构预测和分析,我们可以了解蛋白质的结构和功能,为生物学研究和药物设计提供重要的启示。
生物信息学研究的蛋白质结构预测
![生物信息学研究的蛋白质结构预测](https://img.taocdn.com/s3/m/b7957c20fd4ffe4733687e21af45b307e971f96f.png)
生物信息学研究的蛋白质结构预测蛋白质是生命体内最重要的分子之一,它们在细胞功能的调控、信号传导、代谢调节等方面发挥着至关重要的作用。
蛋白质的功能与其结构密切相关,因此,了解蛋白质的结构对于揭示其功能和研究生命活动具有重要意义。
然而,实验方法获得蛋白质的结构是一项复杂而耗时的任务,因此,生物信息学研究中的蛋白质结构预测成为了一种重要的辅助手段。
蛋白质结构预测是指通过计算方法和算法来推测蛋白质的三维结构。
这项研究涉及到许多领域,如计算机科学、数学、生物学等。
目前,蛋白质结构预测主要分为三个层次:一级结构、二级结构和三级结构的预测。
一级结构预测是指预测蛋白质的氨基酸序列。
对于已知的蛋白质序列,可以通过比对已知的蛋白质数据库来推测其功能和结构。
此外,还可以利用一些算法来预测蛋白质的二级结构,如α-螺旋、β-折叠等。
这些算法通常基于统计学方法和机器学习算法,通过训练数据集来建立模型,然后对未知的蛋白质序列进行预测。
二级结构预测是指预测蛋白质中局部结构的排列方式。
二级结构预测是蛋白质结构预测中的一个重要环节,因为它能够提供蛋白质的一些重要信息,如螺旋和折叠的位置、长度等。
目前,常用的二级结构预测方法包括基于规则的方法、统计学方法和机器学习方法。
其中,机器学习方法在蛋白质结构预测中得到了广泛应用,如支持向量机、神经网络等。
三级结构预测是指预测蛋白质的空间结构。
蛋白质的空间结构是由氨基酸的序列所决定的,因此,蛋白质的空间结构预测是蛋白质结构预测中最具挑战性的任务之一。
目前,常用的三级结构预测方法包括基于比对的方法、基于模板的方法和基于物理化学性质的方法。
其中,基于模板的方法是最常用的方法,它通过比对已知的蛋白质结构来预测未知蛋白质的结构。
生物信息学研究的蛋白质结构预测在许多领域都有广泛的应用。
首先,蛋白质结构预测可以帮助科学家理解蛋白质的功能和机制,从而推动药物研发和治疗方法的改进。
其次,蛋白质结构预测还可以用于预测蛋白质的折叠速度和稳定性,为蛋白质工程和设计提供理论依据。
生物信息学中的蛋白质结构预测方法与实验验证
![生物信息学中的蛋白质结构预测方法与实验验证](https://img.taocdn.com/s3/m/414ba7a980c758f5f61fb7360b4c2e3f572725b3.png)
生物信息学中的蛋白质结构预测方法与实验验证蛋白质是生物体中不可或缺的分子机器,它们承担着多种生物学功能,包括催化反应、传递信号和维持细胞结构。
为了全面理解蛋白质的功能和作用机制,准确预测蛋白质的结构是非常关键的。
蛋白质的三维结构决定了其功能,包括蛋白质的折叠状态、活性位点和结合区域。
然而,通过实验手段来解析蛋白质的结构是一项非常费时、费力和昂贵的工作。
因此,利用生物信息学方法进行蛋白质结构预测成为一种重要的替代方案。
在生物信息学中,蛋白质结构预测主要可分为两个层次:一级结构预测和二级/三级结构预测。
一级结构预测主要是预测蛋白质的氨基酸序列,即蛋白质的线性排列顺序。
该预测可以利用多种方法进行,其中最常见的是基于序列相似性的比对方法。
例如,BLAST和PSI-BLAST是广泛使用的一级结构预测工具,它们通过将待预测的蛋白质序列与已知蛋白质序列库进行比对,结合统计学方法来推断出待预测蛋白质的氨基酸组成。
二级/三级结构预测更为具有挑战性,因为它们涉及到蛋白质的空间构象。
二级结构是指蛋白质分子中氨基酸残基间H键的相互作用,可以分为α-螺旋、β-折叠和无规卷曲等几种结构类型。
三级结构是指蛋白质分子中氨基酸残基之间的空间排列。
预测二级/三级结构可以通过多种方法实现,包括基于统计学模型、机器学习算法和物理模型。
其中,基于统计学模型的方法主要是基于已知蛋白质结构库的统计分析,通过比对序列和已知结构之间的关联来预测未知蛋白质的结构。
例如,DSSP和STRIDE等工具可以根据氨基酸序列和相邻氨基酸的空间关系来推测出蛋白质的二级结构。
机器学习算法是目前蛋白质结构预测中最热门的方法之一。
这些算法通过对已知蛋白质结构的特征进行学习,然后基于这些学习结果来预测未知蛋白质的结构。
这些特征可以包括一级结构信息、残基间的相互作用和物理化学性质等。
例如,基于神经网络的DeepMind的AlphaFold就是一个基于机器学习算法的蛋白质结构预测工具,在最近的CASP14比赛中取得了非常突出的成绩。
生物信息学中的蛋白质结构预测与功能分析
![生物信息学中的蛋白质结构预测与功能分析](https://img.taocdn.com/s3/m/a692406f443610661ed9ad51f01dc281e53a56a0.png)
生物信息学中的蛋白质结构预测与功能分析蛋白质是生物体内最重要的分子之一,它们在细胞的结构和功能中起到关键作用。
蛋白质的结构决定其功能,因此了解蛋白质的结构和功能对研究生命科学非常重要。
然而,实验室实验方法通常耗时且成本高昂。
在这种情况下,生物信息学中的蛋白质结构预测和功能分析成为了一种重要的手段。
一、蛋白质结构预测蛋白质结构预测是指根据蛋白质的氨基酸序列来预测其三维结构的方法。
由于蛋白质的结构十分复杂,传统的实验手段很难解决这个问题。
因此,许多生物信息学方法被提出来进行蛋白质结构预测。
(一)同源建模同源建模是通过将待预测蛋白质与已知结构的相关蛋白质进行比对,然后预测其结构。
主要利用了蛋白质序列与结构之间的保守关系,即认为在进化的过程中,氨基酸序列相似的蛋白质的结构也相似。
同源建模的可信度和准确性取决于对已知样本的比对准确性。
(二)螺旋转移螺旋转移根据已知的蛋白质结构学习到的螺旋或折叠模型,将这些模型应用于待预测的蛋白质序列,选择最适合的模型并进行调整,最终得到待预测蛋白质的结构。
(三)碳-氮相位空间搜索碳-氮相位空间搜索是通过在碳和氮原子的相位空间进行搜索来预测蛋白质的结构。
该方法利用了氨基酸序列中Cα原子的位置信息,并通过优化搜索来寻找满足物理约束条件的最佳结构。
这种方法对于小规模的蛋白质结构预测表现较好。
二、蛋白质功能分析蛋白质的功能与其结构密切相关,因此通过蛋白质结构的预测可以为功能分析提供重要线索。
蛋白质功能分析的主要方法包括功能模拟和功能注释。
(一)功能模拟功能模拟是通过计算机模拟方法来探索蛋白质功能的方法。
其中,分子动力学模拟是最常见的方法之一,它可以模拟蛋白质的运动和变化,从而揭示其功能机制。
此外,还有基于结构的药物设计方法,可以通过模拟蛋白质与候选药物的相互作用来寻找新的药物靶点。
(二)功能注释功能注释是根据蛋白质序列、结构、进化关系以及与其他蛋白质的相互作用等信息来预测其功能的方法。
第六章利用蛋白质进行预测的方法
![第六章利用蛋白质进行预测的方法](https://img.taocdn.com/s3/m/919d60f1915f804d2a16c13d.png)
5. 蛋白质功能结构的分析流程
09.04.2021
6. 蛋白质预测免费工具
NCBI: BLAST提供的工具(已介绍) ExPASy: Expert Protein Analysis System
/ 瑞士生物信息院提供的蛋白质在线分析工具,包括: 蛋白数据库(SWISS-PROT) 蛋白分析工具:蛋白质辨识、蛋白序列、结构分析、 同源性分析、DNA-蛋白质转换、一级结构分析、二 级结构分析、三级结构分析、跨膜序列预测、信号肤 等。
如果是后者,PeptideMass工具还能利用SWISSPROT库中的信息进行改进计算:除去信号序列、在剪 切之前引入已知的翻译后的修饰等。
然后用户在“Select an enzyme,,一项中选择想要的 酶。
PeptideMass工具将输出的结果列成表格,其中包括 输入蛋白的pI理论值和分子量,SWISSPROT库中相关 变种的分子量、位点、修饰后的分子量和信息,肽片段 的序列。
因此,利用二级结构和折叠类型的预测工具可 以预测出序列折叠成α-螺旋和β -折叠的能力、 可能存在的基序以及功能结构域。
09.04.2021
二级结构和折叠类型
蛋白质二级结构的预测方法与核酸序列预测类 似, 大多采用了“神经网络”算法,在计算过程 中,通过已知数据库中数据作为训练样本进行 学习,然后进行预测。
蛋白质RRF-ECOLI(P16174)EMAIL结果实例
注意:零分表明查询序列与提出的序列完全相符, 打分越低相似性越高。
09.04.2021
2. AACompSim
与AACompIdent以实验室所得的氨基酸组成 为依据进行搜索不同,AACompSim使用 SWISS-PROT蛋白质的序列为依据,将用户要 查询的蛋白与SWISS-PROT数据库中的蛋白 质的序列进行比较、辨识,检测蛋白质之间的 微弱关系。
生物信息学中的蛋白质结构预测与分析指南
![生物信息学中的蛋白质结构预测与分析指南](https://img.taocdn.com/s3/m/e536323b5bcfa1c7aa00b52acfc789eb172d9eec.png)
生物信息学中的蛋白质结构预测与分析指南生物信息学在现代生命科学中发挥着重要的作用,它结合了计算机科学和生物学,通过数据分析和模拟,帮助科学家们更深入地了解生物系统的功能和特性。
在生物信息学中,蛋白质结构预测与分析是一个重要的研究领域,能够为药物设计、酶催化机制等方面的研究提供有力的支持。
本文将为您介绍生物信息学中蛋白质结构预测与分析的指南。
蛋白质是生命体中功能最丰富、最重要的生物大分子之一,其功能多样,如酶催化、信号传导、结构支持等。
了解蛋白质的结构和功能对于研究生物学中的各种问题具有重要意义。
然而,实验测定蛋白质的结构是一个困难且费时的过程。
因此,预测蛋白质的三维结构成为了一项备受关注的任务。
蛋白质结构预测的方法主要分为两大类:比较模型和抗体模型。
比较模型是通过已知的结构来预测待测蛋白质的结构,而抗体模型则是利用物理和化学原理来预测蛋白质的结构。
在选择预测方法时,需要考虑预测的精确性、计算速度以及可靠性等因素。
对于蛋白质结构预测的初学者来说,建议使用一些常用的在线工具和软件来开始预测。
例如,Swiss-Model是一个广泛使用的在线工具,可以通过比对已知的同源结构来预测待测蛋白质的结构。
还有I-TASSER和ROSETTA等软件也提供了相似的功能。
这些工具和软件都有用户友好的界面,并且提供了详细的帮助文档和教程,方便初学者快速上手。
除了使用在线工具和软件,蛋白质结构预测也需要掌握一些基本的预测原理和算法。
首先是蛋白质的序列分析,蛋白质的氨基酸序列是预测结构的重要信息。
通过对序列的保守性分析和功能域的识别,可以帮助预测蛋白质的结构。
此外,还可以利用蛋白质的二级结构预测结果,结合物理和化学性质对蛋白质的结构进行预测。
在蛋白质结构分析中,对预测结果的验证和评估是非常重要的。
验证方法主要分为实验验证和计算验证两种。
实验验证包括X射线晶体学和核磁共振等技术,可以直接获得蛋白质的结构信息。
计算验证则是通过计算方法来评估预测的准确性和可靠性。
生物信息学中的蛋白质结构预测和分子模拟
![生物信息学中的蛋白质结构预测和分子模拟](https://img.taocdn.com/s3/m/3cbccd5ea66e58fafab069dc5022aaea998f41d5.png)
生物信息学中的蛋白质结构预测和分子模拟蛋白质是构成生命体的重要组成部分之一,它们担负着许多重要的生物学功能。
蛋白质结构的研究是生物信息学研究的不可或缺的一部分,因为蛋白质结构与其生物学功能之间密不可分。
蛋白质结构预测和分子模拟是蛋白质结构研究领域的两个重要分支,本文将从两者的定义、方法和应用等方面进行探讨。
一、蛋白质结构预测蛋白质结构预测是指通过计算方法、机器学习模型等手段预测蛋白质结构的三维空间构型。
蛋白质结构预测旨在预测蛋白质天然构象,解决了传统实验方法费时费力的问题,因此备受关注。
1. 蛋白质结构预测方法蛋白质结构预测方法主要包括基于模板的方法、基于物理力学的方法和基于进化信息的方法。
(1)基于模板的方法基于模板的方法是基于同源蛋白质或蛋白质结构库中已知蛋白质的结构,预测目标蛋白质的结构。
此方法需要具有相似序列和结构的模板蛋白质作为参考,然后使用序列比对、模板构建和模板优化等方法进行预测。
(2)基于物理力学的方法基于物理力学的方法是通过计算机模拟分子间相互作用力的变化,依据能量最小化原则,预测蛋白质的结构。
此方法主要有分子力学、分子动力学等方法。
(3)基于进化信息的方法基于进化信息的方法是利用大量蛋白质序列内在的进化信息和保守模式,预测目标蛋白质的结构。
该方法主要包括利用序列分析的方法和利用信息理论的方法。
2. 蛋白质结构预测应用蛋白质结构预测的应用主要有以下两个方面:(1)基础研究方面通过预测蛋白质的三维结构,有助于深入研究蛋白质结构和功能的关系,例如研究蛋白质折叠过程和功能机制等。
(2)药物研发方面蛋白质结构预测可用于设计新药物的研发。
通过预测药物与目标蛋白质之间的相互作用,有助于筛选出具有高亲和力的化合物。
二、分子模拟分子模拟是指利用计算机模拟分子现象的一种方法,其核心是模拟分子结构和动力学过程,以解析它们之间的相互作用。
分子模拟在蛋白质结构研究中是一种非常有效的手段,可以分析蛋白质的物理、化学和动力学特性。
生物信息学的蛋白质结构预测
![生物信息学的蛋白质结构预测](https://img.taocdn.com/s3/m/4a0d0711f11dc281e53a580216fc700aba685245.png)
生物信息学的蛋白质结构预测蛋白质结构预测在生物信息学领域中扮演着至关重要的角色。
由于蛋白质的结构与其功能密切相关,因此准确地预测蛋白质的结构对于了解其功能、药物设计以及疾病研究具有重要意义。
本文将从蛋白质结构预测的方法和技术、蛋白质结构数据库以及结构预测的应用等方面进行探讨。
一、蛋白质结构预测的方法和技术蛋白质结构预测的方法主要分为实验方法和计算方法。
实验方法包括X射线晶体学、核磁共振和电子显微镜等,这些方法可以得到高分辨率的蛋白质结构,但耗时耗力且成本较高。
相比之下,计算方法则是利用计算机模拟和预测来完成蛋白质结构的预测。
在计算方法中,蛋白质结构预测可以分为三个层次:一级结构(氨基酸序列)、二级结构(α螺旋、β折叠等)和三级结构(蛋白质的整体折叠形态)。
一级结构的预测主要基于序列对齐和序列比对的方法,通过比较已知的蛋白质序列与未知序列找出相似性,并预测出未知序列的结构特征。
二级结构的预测则利用机器学习、神经网络等算法进行,通过学习已知蛋白质的二级结构信息,对未知蛋白质进行预测。
三级结构的预测是最具挑战性的,常用的方法包括基于模板的建模、蛋白质折叠模拟等。
二、蛋白质结构数据库蛋白质结构数据库是储存和管理已知蛋白质结构信息的平台,为蛋白质结构预测提供重要参考。
目前最重要的蛋白质数据库是Protein Data Bank(PDB),它是全球最大的蛋白质结构数据库,提供了大量已知蛋白质的结构信息,为蛋白质结构预测研究提供宝贵资源。
在蛋白质结构数据库中,蛋白质结构的组织方式主要分为两类:实验决定的结构和模型预测的结构。
实验决定的结构是通过实验手段得到的高分辨率的蛋白质结构,具有较高的可信度。
而模型预测的结构则是基于计算方法预测得到的,可信度相对较低。
在蛋白质结构数据库中,我们可以通过检索已有的结构来寻找与我们要研究蛋白质相似的结构,以便于进行结构预测和功能分析。
三、蛋白质结构预测的应用蛋白质结构预测在多个领域中具有广泛的应用。
生物信息学中的蛋白结构预测研究
![生物信息学中的蛋白结构预测研究](https://img.taocdn.com/s3/m/8816067382c4bb4cf7ec4afe04a1b0717fd5b3a8.png)
生物信息学中的蛋白结构预测研究蛋白质是生命体中不可或缺的重要组成部分,它具有各种功能,包括催化、传导、结构支持等。
蛋白质的生物学功能与其三维结构密切相关。
因此,预测蛋白质的三维结构是生物信息学领域的一个重要研究方向。
本文将介绍蛋白结构预测的方法和挑战。
一、蛋白结构预测方法蛋白结构预测方法可以分为基于相似性的模板建模和基于物理化学原理的从头构建两种。
基于相似性的模板建模方法是最常用的蛋白质三维结构预测方法。
该方法利用已知蛋白质模板来预测目标蛋白质的结构。
这种方法的关键是找到合适的蛋白质模板。
当目标蛋白质在数据库中找到与其序列相似性大于30%的蛋白质时,就可以使用模板建模方法进行结构预测。
该方法用在蛋白质的结构预测上已成为了非常成熟的技术。
基于物理化学原理的从头构建方法是预测蛋白质结构的另一种方法。
该方法不使用任何已知的蛋白质结构作为模板来预测目标蛋白质的结构,而是通过研究蛋白质结构如何稳定以及蛋白质中各种化学键的作用机制,来预测目标蛋白质的结构。
这种方法利用了虚拟的力场对蛋白质分子的构象进行搜索,然后采用分子动力学模拟方法对搜索到的构象进行筛选和优化。
二、蛋白结构预测的挑战蛋白质结构预测的挑战在于,即使是使用现代计算机进行模拟,蛋白质结构预测的算法和计算成本仍然存在很大的挑战。
在这个过程中,需要考虑的因素非常多,其中一些因素可以预测,而另一些因素则需要实验数据的支持。
因此,在蛋白质结构预测过程中,数据的质量和数量非常重要。
其次,蛋白质结构预测是一项高维问题。
蛋白质分子中的原子数巨大,计算量极大。
由于需要在完全没有先验知识的情况下对这些原子之间的化学作用和空间排列进行建模,因此需要花费大量的计算时间和资源。
为了提高预测的准确性,需要使用多种方法进行验证,例如使用基于机器学习的方法进行模型验证等。
另外,蛋白质本身的复杂性也给蛋白质结构预测带来了很大的挑战。
蛋白质分子的复杂性包括不同规模的结构层次、动态性以及功能等方面。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4、点击”Go” 5、点击感兴趣的结果(1W36,进入MMDB) 结果列表中包含相关蛋白(powered by BLAST)、文献、结构域 (domain)、配体(ligand)、3D缩略图、三维查看器
在MMDB看搜到蛋白的结构(NCBI)
ProtParam 工具简介
基于蛋白质序列的组分分析 氨基酸亲疏水性等分析为高级结构预测提供参考 Expasy 开发的针对蛋白质基本理化性质的分析:
▪ ProtParam 工具
计算以下物理化学性质: •相对分子质量 •氨基酸组成 •等电点(pI) •消光系数 •半衰期 •不稳定系数 •总平均亲水性 ……
▪ MMDB (Molecular Modeling Database): NCBI的大分子三维结构 数据库,数据来自PDB
▪ 打开的单个蛋白的页面中包括 ▪ 文献、简单描述、入库日期、物种(taxonomy) ▪ 该蛋白的PDB, VAST链接(entire chain/View 3D Alignment) ▪ 三维查看器(Cn3D) ▪ 分子成分(图): chain, 3D domain, classification/family, ligand
氨基酸数目 相对分子质量
氨基酸组成
返回结果
正/负电荷残基数
原子组成 分子式
总原子数 消光系数
半衰期
E(Prot) = Num(Tyr)*Ext(Tyr) + Num(Trp)*Ext(Trp) + Num(Cystine)*Ext(Cystine) proteins in water measured at 280 nm: Ext(Tyr) = 1490, Ext(Trp) = 5500, Ext(Cystine) = 125 Absorb(Prot) = E(Prot) / Molecular_weight
蛋白质的结构
▪ 一级结构(primary):氨基酸序列 ▪ 二级结构(secondary):α螺旋、β片层、... ▪ 三级(维)结构(tertiary):亚基,结构域 ▪ 四级结构(quaternary):亚基之间特定的空间关系
蛋白结构与人类疾病 (重要性)
一些单氨基酸(aa)突变可引起蛋白结构的重大变化 CFTR的ΔF508突变改变螺旋结构,从而改变其功能 另一些变化则不明显 一些蛋白引起的疾病 囊肿性纤维化(cystic fibrosis): CFTR 镰刀性贫血: 血红蛋白 疯牛病: 朊蛋白 阿尔兹海默氏征: 淀粉样前体蛋白
构,PDP域 更多外部链接(对于RecBCD多达26个)
更多有用的链接
▪ PDB的外部链接中Compute pI Mw点击Chain B (可计算各链分子 量)
▪ 在打开的Compute pI/Mw页面中点击EX5B_ECOLI (ExPASy,大 量信息,链接)
▪ 在打开的UniProtKB/Swiss-Prot页面中点击EcoCyc:EG10824MONOMER (biocyc,参与的反应/路径图)
点击其中的PDB (RCSB)链接,显示
▪ 三维结构实验数据 ▪ 蛋白分类
SCOP链接: 结构域(家族,超家族) CATH链接: 域, Class, Architecture, Topology, Homology GO链接: 功能,过程,细胞组成 ▪ 更多信息 生化性质,配体,SNP (Sequence Details)图形显示各域的分布,类别,DSSP二级结
生物信息学 第六章 蛋白质结构预测 及分子设计
单个蛋白 涉及的问题 结构预测(2D, 3D) 物理化学性质 功能 空间位置 研究方法 提取 纯化 制作晶体,决定结构 理解机制,功能
引子
多个蛋白 涉及的问题 表达过程(DNARNA蛋白,调控网络) 相互作用(yeast two-hybrid,亲和层析) 蛋白家族(family) 检测(2D-PAGE,质谱仪,蛋白质芯片) 研究方法 基因组测序 蛋白预言 计算机分析结构 理解机制,功能
蛋白结构的主要仓库 – PDB
▪ 始建于1971 ▪ >32000个结构数据(其中约3万是蛋白)
读取PDB文件的门户网站 Swiss-Prot, NCBI, EMBL
PDB
CATH, Dali, SCOP, FSSP 解释PDB文件的数据库
用”PubMed”搜蛋白结构(NCBI)
1、进入”PubMed” 2、选择”Structure”
▪ 如果分析Swiss-Prot和TrEMBL数据库中序列 ▪ 直接填写Swiss-Prot/TrEMBL AC号(accession number)
▪ 如果分析新序列: ▪ 直接在搜索框中粘贴氨基酸序列
输入Swiss-Prot/TrEMBL AC号
将protein.txt蛋白质序列 粘贴在文本框中
实验数据
数据库搜索
结构域匹配
已知结构的 同源蛋白?
有
同源 建模
无 二级
结构预测 有
串线法
三维结构模型
可用的折 叠模型?
无
从头 预测
蛋白质的基本性质
蛋白质的基本性质:
相对分子质量 氨基酸组成 等电点(pI) 消光系数
半衰期
不稳定系数 总平均亲水性 …….
工具 AACompldent
Compute pI/Mw
蛋白质结构预测及分析的主要内容
蛋白质结构分析
蛋白质基本理化性质分析
蛋白质一级结构
蛋白质亲疏水性分析
蛋白质二级结构 蛋白质超二级结构
蛋白质跨膜区结构预测
蛋白质二级结构预测 (α螺旋,β折叠等)
蛋白质结构域分析
蛋白质三级结构
蛋白质三维结构模拟
蛋白质结构预测过程
蛋白质理化性质 和一级结构
ORF翻译 蛋白质序列
ProtParam
PeptideMass SAPS
蛋白质理化性质分析工具
网站
备注
利用未知蛋白质的氨基酸组成确 认具有相同组成的已知蛋白
计算蛋白质序列的等电点和分子 量
对氨基酸序列多个物理和化学参 数(分子量、等电点、吸光系数 等)进行计算
计算相应肽段的pI和分子量
利用蛋白质序列统计分析方法给 出待测蛋白的物理化学信息
不稳定系数
脂肪系数 总平均亲水性