生物信息学原理与方法-第九讲蛋白质序列分析与预测29页PPT

合集下载

生物信息学讲义 第九章 蛋白质序列分析与结构预测

生物信息学讲义 第九章 蛋白质序列分析与结构预测

第九章 蛋白质序列分析与结构预测一种生物体的基因组规定了所有构成该生物体的蛋白质,基因规定了组成蛋白质的氨基酸序列。

虽然蛋白质由氨基酸的线性序列组成,但是,它们只有折叠成特定的空间构象才能具有相应的活性和相应的生物学功能。

了解蛋白质的空间结构不仅有利于认识蛋白质的功能,也有利于认识蛋白质是如何执行其功能的。

确定蛋白质的结构对于生物学研究是非常重要的。

目前,蛋白质序列数据库的数据积累的速度非常快,但是,已知结构的蛋白质相对比较少。

尽管蛋白质结构测定技术有了较为显著的进展,但是,通过实验方法确定蛋白质结构的过程仍然非常复杂,代价较高。

因此,实验测定的蛋白质结构比已知的蛋白质序列要少得多。

另一方面,随着DNA测序技术的发展,人类基因组及更多的模式生物基因组已经或将要被完全测序,DNA序列数量将会急增,而由于DNA序列分析技术和基因识别方法的进步,我们可以从DNA推导出大量的蛋白质序列。

这意味着已知序列的蛋白质数量和已测定结构的蛋白质数量(如蛋白质结构数据库PDB中的数据)的差距将会越来越大。

人们希望产生蛋白质结构的速度能够跟上产生蛋白质序列的速度,或者减小两者的差距。

那么如何缩小这种差距呢?我们不能完全依赖现有的结构测定技术,需要发展理论分析方法,这对蛋白质结构预测提出了极大的挑战。

20世纪60年代后期,Anfinsen首先发现去折叠蛋白或者说变性(denatured)蛋白质在允许重新折叠的实验条件下可以重新折叠到原来的结构,这种天然结构(native structure)对于蛋白质行使生物功能具有重要作用,大多数蛋白质只有在折叠成其天然结构的时候才能具有完全的生物活性。

自从Anfinsen提出蛋白质折叠的信息隐含在蛋白质的一级结构中,科学家们对蛋白质结构的预测进行了大量的研究,分子生物学家将有可能直接运用适当的算法,从氨基酸序列出发,预测蛋白质的结构。

本章主要着重介绍蛋白质二级结构及空间结构预测的方法。

生物信息学中的蛋白质序列分析与预测研究

生物信息学中的蛋白质序列分析与预测研究

生物信息学中的蛋白质序列分析与预测研究蛋白质是生命体中至关重要的分子,它们在细胞功能和结构的调控中发挥着重要的作用。

蛋白质的序列决定了其结构和功能,因此蛋白质序列的分析和预测成为生物信息学研究的重要方向之一。

本文将重点介绍蛋白质序列分析和预测的方法与技术,以及在生物学研究中的应用。

蛋白质序列的分析是指根据蛋白质的氨基酸序列,通过一系列的计算和分析方法,对其结构和功能进行研究的过程。

蛋白质序列分析的方法有很多,其中最常用的包括:比对分析、同源建模、序列特征分析和亚细胞定位预测。

首先,比对分析是蛋白质序列分析的基础方法之一。

通过将待分析的蛋白质序列与已知的蛋白质序列数据库进行比对,可以找到与之相似的序列,进而推测蛋白质的结构和功能。

比对分析常用的工具有BLAST和PSI-BLAST等,它们通过比较序列之间的相似性和一致性,确定序列的保守区域和结构域,从而揭示蛋白质的功能。

其次,同源建模是一种根据已知蛋白质的结构来预测未知蛋白质的结构的方法。

在同源建模中,通过比对已知蛋白质的结构与待预测蛋白质的序列,找到与之相似的蛋白质结构作为模板,并利用模板的结构信息,预测待预测蛋白质的结构。

同源建模的常用工具有SWISS-MODEL和Phyre2等。

同源建模不仅可以预测蛋白质的三维结构,还可以提供结构功能的启示,从而推测其功能。

另外,序列特征分析也是蛋白质序列分析的重要方向之一。

序列特征分析通过对蛋白质序列中的特定模式、保守区域和功能位点进行分析,揭示蛋白质的结构和功能。

常用的序列特征分析方法包括信号肽预测、跨膜区域识别、功能位点预测和蛋白质域识别等。

这些方法通过分析蛋白质序列中的特定特征,揭示蛋白质的功能和结构。

最后,亚细胞定位预测是蛋白质序列分析的一个重要方向。

蛋白质在细胞中的定位决定了其在细胞内发挥的功能,因此准确预测蛋白质的亚细胞定位对于理解其功能至关重要。

亚细胞定位预测通过分析蛋白质序列中的亚细胞定位信号和保守区域,预测蛋白质的亚细胞定位位置。

医学专业生物信息学第9章

医学专业生物信息学第9章

PPT文档演模板
医学专业生物信息学第9章
•一、蛋白质的指纹特征
1.蛋白质的指纹即肽质量指纹谱具有特征性


由于每种蛋白质的氨基酸序列(一级结构)
都不同,蛋白质被识别特异酶切位点的蛋白酶水
解后,产生的肽片段序列也各不相同,其肽混合
物质量数亦具有特征性,称为肽质量指纹谱
(peptide mass fingerprinting,PMF),即蛋
进行分类和鉴定,并分析蛋白质间的相互作用和
功能。
1.一种称为“竭泽法”,即采用高通量的蛋白质组 研究技术分析生物体内尽可能多乃至接近所有的 蛋白质。
2.另一种策略称为“功能法”,即研究不同时期细 胞蛋白质组成的变化,如蛋白质在不同环境下的 差异表达,以发现有差异的蛋白质种类为主要目 标。
•蛋白质组学的研究范围:
PPT文档演模板
医学专业生物信息学第9章
•一、蛋白质的指纹特征
•3. 肽质量指纹谱可用作其他测定参数
• 测定不同物种间的保留特性,从而推断分子的功能。 由生物多样性和进化上远离引起的氨基酸残基取代, 显示了蛋白中的特征功能区。
• 在一个蛋白消解物中,用来检测在化学或酶处理前 后的“非匹配”(即和预测片段不符)的肽,从而表 征蛋白的修饰。
PPT文档演模板
医学专业生物信息学第9章
•功能蛋白质组学(functional proteomics)” • 研究细胞或个体在某一特定时间所表达或与 某个功能相关的蛋白质集合体。
• 功能蛋白质组学能够在细胞和生命有机体的 整体水平上阐明生命现象的本质和活动规律。 •功能蛋白质组学的研究可为食品改造、疫苗开发 和生物制药等提供重要依据。
蛋白质组学(proteomics),是以细胞内全部蛋 白质的存在及其活动方式作为研究对象,注重研 究参与特定生理或病理状态的所有蛋白质种类及 其与周围环境(分子)的关系。

蛋白质测序ppt课件.ppt

蛋白质测序ppt课件.ppt

出了890C, 890M.型.
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
每次测定的样品用量从最初的250nmol到二十世纪九十年 代只需几十pmol左右。仪器工作的基本原理主要经过以下 几步: (1) 将待测的蛋白质加入到仪器的旋转杯中。 (2) 在一定的条件下进行Edman降解, 经偶联-裂解-获得 ATZ氨基酸。 (3) 旋转杯一边旋转,一边抽真空,除去Edman降解时残 留的溶剂后, 降解的蛋白质和从蛋白质N末端断裂下来的 ATZ—氨基酸形成薄膜, 贴在旋转杯内壁上。 (4) 从蛋白质N—末端断裂下来的ATZ—氨基酸经氯丁烷 抽提出来。
(1)
高负的,因此,篮球比赛的计时计分系统是一种得分类型的系统
将PTH-氨基酸, 通过高效薄层层析(如聚酰胺薄膜层析)分离, 每一种
PTH—氨基酸在一定的展层剂的条件下,其迁移率是一定的,在薄
膜上的坐标的位置就可以确定。然后与标准的PTH—氨基酸在薄膜
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
1.2蛋白质序列测定的重要意义 蛋白质序列测定主要可以提供以下几种参数:
(1) 为DNA 序列分析找出探针, (2) 作为蛋白质和肽类纯度鉴定 (3) 研究蛋白质的结构及功能之间的关系及蛋白质结构的 同源性。 (4) 确定蛋白质生物活性部位,酶与底物结合及催化位点 (5) 确定核酸密码中与蛋白质序列的起始位点及结束位点 (5) 可以科学的解释蛋白质晶体结构, 蛋白质分子进化的分 支点, 分子遗传疾病发病机理,分子免疫的机理。
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统

蛋白质的序列分析及结构预测课件PPT

蛋白质的序列分析及结构预测课件PPT
(2) 翻译编码的DNA序列 ORF Finder 由英国伦敦帝国理工学院维护,其数据库中含有9864个蛋白折叠结构
药物保护正常细胞免受化学药物的侵害,可以提高化学治疗的剂量。 而 Asp 、Glu 和 Pro 在β折叠片中则很低。
(3)在数据库中搜索 99 Da = ‘V’
http://www. 用HMM法搜索蛋白质远源同源序列 全平行结构域、反平行结构域、α+β结构域、 α/β结构域及其他折叠类型。
优点:
• 可以避免底物分子产生的干扰,大大降低背景噪音。 • 其次,可使分子离子通过与反应气的碰撞来产生断裂。 • 因此能提供更多的结构信息,所以串联质谱特别适合 于复杂组分体系且干扰严重的样品中低含量组分分析测 定,具有比GC-MS和LC-MS等一级质谱更高的选择性和灵 敏度。
Masses of Amino Acid Residues
Protein backbone
H...-HN-CH-CO-NH-CH-CO-NH-CH-CO-…OH
N-terminus
Ri-1
Ri
Ri+1
C-terminus
AA residuei-1 AA residuei AA residuei+1
General for sequencing
Breaking Protein into Peptides and Peptides into Fragment Ions
蛋白质的序列分析及结构预测
DNA sequence Protein sequence Protein structure Protein function
一、蛋白质数据库介绍 二、蛋白质序列分析 三、蛋白质结构预测 四、应用 分子设计

蛋白质序列分析精品课件.ppt

蛋白质序列分析精品课件.ppt
(/) ▪ FSSP 基于蛋白质结构-结构比对的折叠分类
(Fold classification based on Structure-Structure alignment of Proteins)
(http://ekhidna.biocenter.helsinki.fi/dali)
(profile),能更敏感地发现序列中的信息。
/prosite/
Pfam(蛋白质家族序列比对蛋白质结构数据库PDB
(/pdb/home/home.do) PDB包括蛋白质、核酸、蛋白质-核酸复合体以及病毒等生物 大分子结构数据,主要是蛋白质结构数据
➢ 能依据这些特征、属性快速可靠地鉴定出一个未知功能蛋 白质序列属于哪个蛋白质家族,
➢ 即使在蛋白质序列相似性很低的情况下,可以通过搜索隐 含的功能结构模体(motif)来鉴定
➢ 因此,是一个有效的序列分析数据库。
PROSITE中涉及的序列模式
➢ 酶的催化位点 ➢ 配体结合位点 ➢ 金属离子结合位点 ➢ 二硫键、小分子或者蛋白质结合区域等 ➢ PROSITE还包括由多序列比对构建的序列特征谱
第一行为该区域出现的氨基酸,每一行为蛋白序列 中一个位置,在该位置对各种氨基酸的保守情况都给出 一个分值,分值越高表示出现概率越大
PROSITE 使用注意事项
▪ Pattern主要可以用来预测某些生物活性位 点,如磷酸化位点、甲基化位点。profile 预测可靠性高,可以用来对新蛋白进行分 类和提供功能提示。
第六章 蛋白质序列分析
主讲人:胡银岗 西北农林科技大学农学院遗传组
第一节 蛋白质数据库
1.数据库的分类
▪ 蛋白质的功能主要是由它的结构所决定的,蛋白质的结构主要分为四级, 依据这种结构层次,将蛋白质数据库分为:

生物信息学原理与方法第九讲 蛋白质序列分析与预测

生物信息学原理与方法第九讲 蛋白质序列分析与预测

8. Secondary structure prediction 二级结构预测
8-1 AGADIR – 预测肽链螺旋结构算法。 8-2 APSSP –高级蛋白质二级结构预测服务器。 8-3 GOR – Garnier1996年开发的蛋白质二级结构预测。 8-4 HNN – 神经网络方法预测蛋白质二级结构。 8-5 Jpred –趋同法预测蛋白质二级结构。 8-6 JUFO –神经网络法从序列预测蛋白质二级结构。 8-7 nnPredict -蛋白质二级结构预测。 8-8 PredictProtein -蛋白质二级结构预测。 8-9 Prof –利用Cascaded Multiple Classifiers进行蛋白质
2-3Graphical Codon Usage Analyser –以图形方式显 示密码子偏向性
2-4BCM search launcher – 以六种框架翻译DNA序 列
2-5Backtranslation – 将蛋白质序列翻译成DNA序列
2-6Genewise – 比较蛋白质序列与基因组的DNA序 列,允许内含子和读框错误
二级结构预测。 8-10PSA -蛋白质二级结构预测。 8-11SOPMA -蛋白质二级结构预测。 8-12SSpro –利用双向重复神经网络预测蛋白质二级结构。
1-19PFMUTS -由MALDI提供,显示肽片段中可能出现的单氨 基酸或两氨基酸突变。
1-20CombSearch -一种试验性的的蛋白质识别工具集成系统。
2.DNA -> Protein 将DNA序列 翻译成蛋白质序列

2-1Translate - 将DNA序列翻译成蛋白质序列。 2-2Transeq – 使用EMBOSS 软件包将DNA序列翻译 成蛋白质序列。

生物信息学原理与方法蛋白质序列分析与预测

生物信息学原理与方法蛋白质序列分析与预测
1-4 PeptIdent –以肽指纹数据识别蛋白质、等电点、实验测定的分子量、 以Swiss-Prot中所有蛋白质的理论肽来比较使用者指定的肽质谱,提 供数据库的注释。
1-5 TagIdent以等电点、分子量和序列特征识别蛋白质,并检出与所给等 电点和分子量最接近的蛋白质序列列表。
1-6 FindMod –预测可能的蛋白质翻译后修饰及肽中单个氨基酸可能被取 代。将实验测定的肽质谱与指定的Swiss-Prot序列中的理论肽或用户 输入的序列作比较,质谱的差异以作出更佳的蛋白质特征描述。
6.Topology prediction 空间结构预测 7.Primary structure analysis 一级结构分析 8. Secondary structure prediction 二级结构预测 9.Tertiary structure 三级结构预测 10. Sequence alignment 序列比对(已讲) 11. Biological text analysis 生物学文本分析(不讲)
1-7 GlycoMod -以实验测定的质谱预测蛋白质可能出现的寡多醣结构。
1-8 GlycanMass - 以寡多醣结构预测其质谱。
1-9FindPept -由实验质谱识别蛋白质中的肽,并考虑到人工化学修饰、 翻译后修饰以及蛋白酶自体溶解等因素。
1-10PeptideMass-以Swiss-Prot 、TrEMBL 条目或用户提供的序列來预测其 肽质谱及翻译后修饰。
1-19PFMUTS -由MALDI提供,显示肽片段中可能出现的单氨 基酸或两氨基酸突变。
1-20CombSearch -一种试验性的的蛋白质识别工具集成系统。
2.DNA -> Protein 将DNA序列 翻译成蛋白质序列

蛋白质序列分析和结构预测 生物信息学

蛋白质序列分析和结构预测 生物信息学

蛋白质序列分析和结构预测【实验目的】1、掌握蛋白质序列检索的操作方法;2、熟悉蛋白质基本性质分析;3、熟悉基于序列同源性分析的蛋白质功能预测,了解基于motif、结构位点、结构功能域数据库的蛋白质功能预测;4、了解蛋白质结构预测。

【实验内容】1、使用Entrez信息查询系统检索人瘦素 (leptin)蛋白质序列;2、使用EXPASY中有关工具对上述蛋白质序列进行分子质量、氨基酸组成等基本性质分析;3、对瘦素蛋白质序列进行基于NCBI/Blast软件的蛋白质同源性分析;4、对瘦素蛋白质序列进行motif结构分析、翻译后修饰等的预测【实验方法】1、瘦素蛋白质序列的检索:(1)调用Internet浏览器并在其地址栏输入Entrez网址/Entrez(2)选择protein;(3)在输入栏输入homo sapiens leptin;(4)点击search后显示序列接受号及序列名称;(5)点击序列接受号后显示序列详细信息;(6)将序列转为FASTA格式保存;2、进入EXPASY网站使用有关软件进行蛋白质序列分析和结构预测。

(1)选择Protparam程序对蛋白质序列进行分子质量、氨基酸组成和等电点等基本性质分析;(2)蛋白质的同源性搜索分析,NCBI的BLAST;(3)在Pattern and profile searches中选择interPro Scan 进行结构域或motif搜索以及有关结构域的结构分析(4)在post-translational modification prediction 选择signalP 对蛋白质序列进行信号肽预测分析【作业】提交使用上述软件对瘦素蛋白质序列进行基本性质分析、同源性分析、motif 结构分析以及信号肽折叠位点预测的结果附:【实验方法】1、瘦素蛋白质序列的检索:(1)调用Internet浏览器并在其地址栏输入Entrez网址(/Entrez);(2)选择protein;(3)在输入栏输入homo sapiens leptin;(4)点击go后显示序列接受号及序列名称;(5)点击序列接受号后显示序列详细信息;(6)将序列转为FASTA格式保存;2、进入EXPASY网站http://www.expasy.ch/tools/使用有关软件进行蛋白质序列分析和结构预测。

蛋白质的序列分析及结构预测

蛋白质的序列分析及结构预测

蛋白质的序列分析及结构预测蛋白质序列分析和结构预测是生物信息学中的一个重要研究领域。

蛋白质是生物体内具有功能的大分子,其结构决定了其功能。

了解蛋白质序列和结构可以帮助我们研究蛋白质的功能和生物过程。

蛋白质序列分析的第一步是进行蛋白质的序列比对。

蛋白质序列比对可以帮助我们找到相似的序列,从而进行进一步的研究。

常用的序列比对方法包括序列比对算法和数据库算法。

序列比对可以通过计算序列之间的相似性来研究蛋白质的进化关系和功能。

在序列比对的基础上,可以进行蛋白质的结构预测。

蛋白质结构预测是确定蛋白质在空间中的三维结构。

蛋白质的结构决定了其功能,所以了解蛋白质的结构对于研究蛋白质的功能和相互作用很重要。

蛋白质结构预测包括以下几种方法。

第一种方法是模板比对。

模板比对是基于已知蛋白质结构库的比对方法。

通过比对蛋白质序列和已知结构的序列,可以预测出蛋白质的结构。

这种方法利用已知结构和序列的对应关系,可以预测出蛋白质的结构。

第二种方法是基于物理性质的结构预测。

这种方法基于蛋白质的物理性质,通过计算蛋白质分子的力学能量和动力学来预测蛋白质的结构。

这种方法较为复杂,需要大量的计算资源。

第三种方法是基于机器学习的结构预测。

机器学习是一种利用算法和统计学方法来训练和预测的方法。

这种方法可以利用蛋白质的序列和结构的关系来预测蛋白质的结构。

利用机器学习方法,可以通过大量的样本和特征来训练模型,从而预测蛋白质的结构。

蛋白质序列分析和结构预测是生物信息学中的重要研究领域。

通过对蛋白质序列和结构的研究,可以揭示蛋白质的功能和生物过程。

这对于研究蛋白质的功能和疾病的机制有重要的意义,并为药物设计和治疗提供了理论基础。

蛋白质序列分析PPT课件

蛋白质序列分析PPT课件
氨基酸是组成蛋白质的基本单pdb数据库蛋白质晶体结构资料数据库pdbproteindatabank是美国brookhaven实验室1971年建立的大分子结构数据库内容包括由全世界生物学家和生物化学家上传的蛋白质或核酸的x光晶体衍射或者nmr核磁共振结构数据其维护由结构生物信息学研究合作组织researchcollaborationstructuralbioinformaticsrcsb负mmdb数据库分子模型数据库mmdbmolecularmodelingdatabase是一个关于三维生物分子结构的数据库是美国生物技术信息中心ncbi所开发的生物信息数据库集成系统的一个部分
27
⑶TMHMM结果如下
TMHMM 2.0预测结果显示:绵羊BMPR-1B蛋 白的1-126位氨基酸位于细胞膜表面(outside),在 127-149位氨基酸之间形成一个典型的跨膜螺旋区 (TMhelix),150-502位氨基酸位于细胞膜内 (inside)。结果与该蛋白的疏水性区域分析结果一 致,表明BMPR-1B蛋白可能是一个与细胞信号传导有 关的膜受体蛋白,与文献报道BMPR-1B参与TGF-β等 信号转导通路一致。
32
图中C score表示剪切位点分值(C值), S score表示信号肽分值(S值),Y score表 示综合剪切分值(Y值)。n-region prob.表 示N-region的分值,h-region prob.表示Hregion的分值,c-region prob.表示C-region 的分值。
12
1 理化性质分析 蛋白质的理化性质分析是蛋白质序
列分析的基本内容之一。根据组成蛋白 质的20多种氨基酸的物理和化学性质, 可以对其基本特征(参数)进行分析, 一般包括分子量、分子式、理论等电点 (pI)、氨基酸组成、消光系数、稳定 性等理化特征。

蛋白质结构与功能预测 ppt课件

蛋白质结构与功能预测 ppt课件

主要选项/参数
• 如果分析SWISS-PORT和TrEMBL数据库中序列
– 直接填写Swiss-Prot/TrEMBL AC号(accession number)
• 如果分析新序列:
– 直接在搜索框中粘贴氨基酸序列
输入Swiss-P将蛋白质序列
基于轮廓(profile)的神经网络算法预测残 基溶剂可及性
基于多序列比对预测跨膜区位置和拓扑结构
识别二级结构中构型变化的氨基酸 识别卷曲螺旋
识别革兰氏阴性菌膜Beta桶蛋白结构 搜索序列中保守基序 过滤序列中低复杂区域
基于实验数据预测序列核定位区域
识别序列中二硫键位置
基于折叠结构识别远源蛋白序列 预测单链中原子残基接触性
PROFacc(默认)
PHDhtm(默认)
ASP(默认) COILS(默认)
PROFtmb ProSite(默认)
SEG(默认) PredictNLS(默认) DISULFIND(默认)
AGAPE PROFcon ProDom(默认) CHOP ConSeq
基于轮廓(profile)的神经网络算法预测蛋 白质二级结构
• 胞外末端-Asp(天冬氨酸)、Ser(丝氨酸)和Pro(脯 氨酸)
• 胞外-内分界区域-Trp(色氨酸) • 跨膜区-Leu(亮氨酸)、Ile(异亮氨酸)、Val(缬氨酸
)、Met(甲硫氨酸)、Phe(苯丙氨酸)、Trp(色氨酸 )、Cys(半胱氨酸)、Ala(丙氨酸)、Pro(脯氨酸) 和Gly(甘氨酸) • 胞内-外分界区域-Tyr(络氨酸)、Trp(色氨酸)和Phe (苯丙氨酸) • 胞内末端-Lys(赖氨酸)和Arg(精氨酸)
基于多序列比对来预测跨膜 区的程序 基 于 HMM 方 法 的 蛋 白 质 跨 膜区预测工具 基 于 对 TMbase 数 据 库 的 统 计分析来预测蛋白质跨膜区 和跨膜方向
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
目录
一、基本方法 二、基本方法
二、ExPASy 系统简介
1.Protein identification and characterization 蛋白 质识别与特证描述 2.DNA -> Protein 将DNA序列翻译成蛋白质序列 3.Similarity searches 序列类似性检索(已讲) 4.Pattern and profile searches 模式的搜索 5.Post-translational modification prediction 翻译 后修饰预测
1-19PFMUTS -由MALDI提供,显示肽片段中可能出现的单氨 基酸或两氨基酸突变。
1-20CombSearch -一种试验性的的蛋白质识别工具集成系统。
2.DNA -> Protein 将DNA序列 翻译成蛋白质序列
2-1Translate - 将DNA序列翻译成蛋白质序列。
2-2Transeq – 使用EMBOSS 软件包将DNA序列翻译 成蛋白质序列。
1.Protein identification and characterization 蛋白质识别与特证描述
1-1 AACompIdent - 以氨基酸组织识别蛋白质
1-2 AACompSim -比较Swiss-Port条目与其他条目的差异
1-3 MultiIdent -以等电点、分子量、氨基酸组成、序列特征及肽指纹数 据识别蛋白质。
4.Pattern and profile searches 模式的搜索
4-1 InterPro Scan - 在PROSITE, Pfam, PRINTS及其他家族和功能域数据库中集 成检索。
4-2 ScanProsite - 对PROSITE或Swiss-Prot 和TrEMBL的模式序列进行搜索。 4-3 MotifScan - 对蛋白质模式数据库中的序列(包括PROSITE)进行搜索。 4-4 Frame-ProfileScan -对蛋白质模式数据库中的序列(包括PROSITE)进行短的
1-4 PeptIdent –以肽指纹数据识别蛋白质、等电点、实验测定的分子量、 以Swiss-Prot中所有蛋白质的理论肽来比较使用者指定的肽质谱,提 供数据库的注释。
1-5 TagIdent以等电点、分子量和序列特征识别蛋白质,并检出与所给等 电点和分子量最接近的蛋白质序列列表。
1-6 FindMod –预测可能的蛋白质翻译后修饰及肽中单个氨基酸可能被 取代。将实验测定的肽质谱与指定的Swiss-Prot序列中的理论肽或用 户输入的序列作比较,质谱的差异以作出更佳的蛋白质特征描述。
1-7 GlycoMod -以实验测定的质谱预测蛋白质可能出现的寡多醣结构。
1-8 GlycanMass - 以寡多醣结构预测其质谱。
1-9FindPept -由实验质谱识别蛋白质中的肽,并考虑到人工化学修饰、 翻译后修饰以及蛋白酶自体溶解等因素。
1-10PeptideMass-以Swiss-Prot 、TrEMBL 条目或用户提供的序列來预测其 肽质谱及翻译后修饰。
2-3Graphical Codon Usage Analyser –以图形方式显 示密码子偏向性
2-4BCM search launcher – 以六种框架翻译DNA序 列
2-5Backtranslation – 将蛋白质序列翻译成DNA序列
2-6Genewise – 比较蛋白质序列与基因组的DNA序 列,允许内含子和读框错误
6.Topology prediction 空间结构预测 7.Primary structure analysis 一级结构分析 8. Secondary structure prediction 二级结构预测 9.Tertiary structure 三级结构预测 10. Sequence alignment 序列比对(已讲) 11. Biological text analysis 生物学文本分析(不讲)
2-7FSED – 读框错误检测
2-8LabOnWeb -使用Compugen LEADS clusters延伸 EST、表达模式及ESTs序列分析。
2-9List of gene identification software sites 列出基
3.Similarity searches 相似搜索
DNA序列搜索。 4-5 Pfam HMM search-在Washington University及Sanger Centre对Pfam数据库
进行搜索。
4-6 FingerPRINTScan - 对PRINTS 数据库进行蛋白质指纹搜索。 4-7 FPAT - 蛋白质数据库中的表达搜索。 4-8 PRATT - EBI 及ExPASy的识别蛋白质保守模式 4-9 PPSEARCH - EBI的对PROSITE进行序列搜索。 4-10 PROSITE scan – PBIL的对PROSITE进行序列搜索。 4-11 PATTINPROT - 在PBIL搜索一段蛋白质序列或蛋白质数据库中的模式。 4-12 SMART – EMBL的简单分子结构研究工具。 4-13 TEIRESIAS - IBM的从不匹配的(unaligned)蛋白质或DNA序列生成蛋白
1-11PeptideCutter –由所提供的蛋白质序列来预测可能的蛋 白酶剪切位点或化学剪切位点。
1-12IsotopIdent –预测肽、蛋白质、多核苷酸或化学组成的理 论同位分布
1-13PepMAPPER-由英中的UMIST提供的肽质谱分析工具。
1-14Mascot –由Matrix Science Ltd.,提供的序列搜索、MS/MS离 子及肽质谱识别。
1-15PepSea -由Protana, Denmark提供的从肽质谱和肽序列识别 蛋白质。
1-16PeptideSearch -由EMBL Heidelberg提供的肽质谱识别工具。
1-17ProteinProspector -由UCSF提供的多种质谱分析工具。
1-18PROWL -由Rockefeller和NY Universities提供蛋白质化学性 质及质谱仪资源。
3-1 BLAST 3-2 Bic ultra -Smith/Waterman序列搜索 3-3MPsrch - EBI的Smith/Waterman序列比对。 3-4DeCypher – Smith/Waterman序列搜索 3-5Fasta3 – EBI的FASTA version 3 3-6FDF - Smith/Waterman序列搜索 3-7PropSearch –使用氨基酸组成来进行结构同源搜索。
相关文档
最新文档