生物信息学原理与方法第九讲 蛋白质序列分析与预测
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.Protein identification and characterization 蛋白质识别与特证描述
1-1 AACompIdent - 以氨基酸组织识别蛋白质
1-2 AACompSim -比较Swiss-Port条目与其他条目的差异
1-3 MultiIdent -以等电点、分子量、氨基酸组成、序列特征及肽指纹数 据识别蛋白质。
3-1 BLAST 3-2 Bic ultra -Smith/Waterman序列搜索 3-3MPsrch - EBI的Smith/Waterman序列比对。 3-4DeCypher – Smith/Waterman序列搜索 3-5Fasta3 – EBI的FASTA version 3 3-6FDF - Smith/Waterman序列搜索 3-7PropSearch –使用氨基酸组成来进行结构同源搜索。
8. Secondary structure prediction 二级结构预测
8-1 AGADIR – 预测肽链螺旋结构算法。 8-2 APSSP –高级蛋白质二级结构预测服务器。 8-3 GOR – Garnier1996年开发的蛋白质二级结构预测。 8-4 HNN – 神经网络方法预测蛋白质二级结构。 8-5 Jpred –趋同法预测蛋白质二级结构。 8-6 JUFO –神经网络法从序列预测蛋白质二级结构。 8-7 nnPredict -蛋白质二级结构预测。 8-8 PredictProtein -蛋白质二级结构预测。 8-9 Prof –利用Cascaded Multiple Classifiers进行蛋白质
结构。
6-6SOSUI -预测跨膜区。 6-7TMAP – 基于多序列比对的跨膜区预测。 6-8TMHMM -预测蛋白质的跨膜螺旋。 6-9TMpred -预测蛋白质的跨膜区及蛋白质方向。 6-10TopPred 2 -膜蛋白的空间结构预测。
7.Primary structure analysis 一级结构分析
6.Topology prediction 空间结构预测 7.Primary structure analysis 一级结构分析 8. Secondary structure prediction 二级结构预测 9.Tertiary structure 三级结构预测 10. Sequence alignment 序列比对(已讲) 11. Biological text analysis 生物学文本分析(不讲)
1-11PeptideCutter –由所提供的蛋白质序列来预测可能的蛋 白酶剪切位点或化学剪切位点。
1-12IsotopIdent –预测肽、蛋白质、多核苷酸或化学组成的理 论同位分布
1-13PepMAPPER-由英中的UMIST提供的肽质谱分析工具。
1-14Mascot –由Matrix Science Ltd.,提供的序列搜索、MS/MS离 子及肽质谱识别。
1-19PFMUTS -由MALDI提供,显示肽片段中可能出现的单氨 基酸或两氨基酸突变。
1-20CombSearch -一种试验性的的蛋白质识别工具集成系统。
2.DNA -> Protein 将DNA序列 翻译成蛋白质序列
2-1Translate - 将DNA序列翻译成蛋白质序列。 2-2Transeq – 使用EMBOSS 软件包将DNA序列翻译 成蛋白质序列。
Cluster Analysis)点阵图 7-17Protein Colourer –给氨基酸序列着色工具 7-18Three To One –将三码的氨基酸序列转换成一码氨基酸序
列工具。
7-19Colorseq –将所选择的蛋白质序列以红色突出。 7-20HelixWheel / HelixDraw –用蛋白质片段表示环状螺旋结构 7-21 RandSeq –随机蛋白质序列生成器
7-4REP –搜索蛋白质重复片段。 7-5REPRO –检测蛋白质序列的重复片段。 7-6 Radar -检测蛋白质序列的重复片段。 7-7SAPS –蛋白质序列的统计学分析。 7-8Coils –蛋白质的卷曲预测。 7-9Paircoil –蛋白质两级卷曲螺旋预测。 7-10Multicoil –蛋白质两级或三级卷曲螺旋预测。
二级结构预测。 8-10PSA -蛋白质二级结构预测。 8-11SOPMA -蛋白质二级结构预测。 8-12SSpro –利用双向重复神经网络预测蛋白质二级结构。
4.Pattern and profile searches 模式的搜索
4-1 InterPro Scan - 在PROSITE, Pfam, PRINTS及其他家族和功能域数据库中集 成检索。
4-2 ScanProsite - 对PROSITE或Swiss-Prot 和TrEMBL的模式序列进行搜索。 4-3 MotifScan - 对蛋白质模式数据库中的序列(包括PROSITE)进行搜索。 4-4 Frame-ProfileScan -对蛋白质模式数据库中的序列(包括PROSITE)进行短的
1-15PepSea -由Protana, Denmark提供的从肽质谱和肽序列识别 蛋白质。
1-16PeptideSearch -由EMBL Heidelberg提供的肽质谱识别工具。
1-17ProteinProspector -由UCSF提供的多种质谱分析工具。
1-18PROWL -由Rockefeller和NY Universities提供蛋白质化学性 质及质谱仪资源。
2-7FSED – 读框错误检测
2-8LabOnWeb -使用Compugen LEADS clusters延伸 EST、表达模式及ESTs序列分析。
2-9List of gene identification software sites 列出基
3.Similarity searches 相似搜索
来自百度文库
7-112ZIP -亮氨酸拉链的预测。 7-12PESTfind –PEST区域的预测。 7-13HLA_Bind –预测MHC type I (HLA) peptide binding。 7-14SYFPEITHI -预测MHC type I and II peptide binding。 7-15ProtScale –氨基酸比例图(疏水性及其相关参数等) 7-16Drawhca –蛋白质序列疏水性聚类分析HCA (Hydrophobic
1-4 PeptIdent –以肽指纹数据识别蛋白质、等电点、实验测定的分子量、 以Swiss-Prot中所有蛋白质的理论肽来比较使用者指定的肽质谱,提 供数据库的注释。
1-5 TagIdent以等电点、分子量和序列特征识别蛋白质,并检出与所给等 电点和分子量最接近的蛋白质序列列表。
1-6 FindMod –预测可能的蛋白质翻译后修饰及肽中单个氨基酸可能被取 代。将实验测定的肽质谱与指定的Swiss-Prot序列中的理论肽或用户 输入的序列作比较,质谱的差异以作出更佳的蛋白质特征描述。
6.Topology prediction 空间结构预测
6-1PSORT – 预测蛋白质次细胞的位置。 6-2TargetP -预测蛋白质次细胞的位置。 6-3DAS -利用Dense Alignment Surface法预测原核
生物的跨膜区。
6-4HMMTOP -预测蛋白质的跨膜螺旋及空间结构。 6-5PredictProtein -预测蛋白质的跨膜螺旋及空间
7-1ProtParam -蛋白质序列的物化性质分析(氨基酸、原子组 成、等电点….等)
7-2Compute pI/Mw -以Swiss-Prot或TrEMBL条目或用户的序 列计算理论的等电点和分子量。
7-3MW, pI, Titration curve –计算等电点及组成并可见其滴 定曲线图。
质模式。
4-14 Hits – 蛋白质序列与motifs的关系。
5.Post-translational modification prediction 翻译后修饰预测
5-1 ChloroP - 叶绿体转换肽的预测。 5-2 LipoP - Gram阴性细菌脂蛋白质和信号肽的预测 5-3 MITOPROT – 预测线粒体的目标序列。 5-4 PATS –预测apicoplast的目标序列 5-5 PlasMit- 预测Plasmodium falciparum的线粒体转换肽 5-6 Predotar –预测线粒体和质体的目标序列 5-7 PTS1 –预测peroxisomal targeting signal 1 containing proteins 5-8 SignalP – 预测信号肽剪工切位点。 5-9 NetOGlyc – 预测哺乳动物粘蛋白的糖化位点。 5-10NetNGlyc – 预测人类N型蛋白质糖化位点。 5-11DictyOGlyc – 预测粘菌O型蛋白质糖化位点。 5-12YinOYang - 真核生物蛋白质序列的O-beta-GlcNAc的粘附位点。 5-13big-PI Predictor -预测GPI的修饰位点 5-14DGPI - 预测GPI的锚合点和剪刀切位点(鏡像站)。 5-15NetPhos - 预测真核生物蛋白质上Ser, Thr 及 Tyr phosphorylation位点。 5-16NetPicoRNA - 预测picornaviral proteins上蛋白质剪切位点。 5-17NMT –预测N-terminal N-myristoylation 5-18Sulfinator – 预测酪胺酸硫化位置。 5-19 SUMOplot – 预测SUMO蛋白质附着位置。
DNA序列搜索。 4-5 Pfam HMM search-在Washington University及Sanger Centre对Pfam数据库
进行搜索。
4-6 FingerPRINTScan - 对PRINTS 数据库进行蛋白质指纹搜索。 4-7 FPAT - 蛋白质数据库中的表达搜索。 4-8 PRATT - EBI 及ExPASy的识别蛋白质保守模式 4-9 PPSEARCH - EBI的对PROSITE进行序列搜索。 4-10 PROSITE scan – PBIL的对PROSITE进行序列搜索。 4-11 PATTINPROT - 在PBIL搜索一段蛋白质序列或蛋白质数据库中的模式。 4-12 SMART – EMBL的简单分子结构研究工具。 4-13 TEIRESIAS - IBM的从不匹配的(unaligned)蛋白质或DNA序列生成蛋白
1-7 GlycoMod -以实验测定的质谱预测蛋白质可能出现的寡多醣结构。
1-8 GlycanMass - 以寡多醣结构预测其质谱。
1-9FindPept -由实验质谱识别蛋白质中的肽,并考虑到人工化学修饰、 翻译后修饰以及蛋白酶自体溶解等因素。
1-10PeptideMass-以Swiss-Prot 、TrEMBL 条目或用户提供的序列來预测其 肽质谱及翻译后修饰。
2-3Graphical Codon Usage Analyser –以图形方式显 示密码子偏向性
2-4BCM search launcher – 以六种框架翻译DNA序 列
2-5Backtranslation – 将蛋白质序列翻译成DNA序列
2-6Genewise – 比较蛋白质序列与基因组的DNA序 列,允许内含子和读框错误
生物信息学
原理与方法
第二讲 蛋白质序列分析与预测
目录
一、基本方法 二、在线工具--ExPASy 系统简介
一、基本方法
二、ExPASy 系统简介
1.Protein identification and characterization 蛋白 质识别与特证描述 2.DNA -> Protein 将DNA序列翻译成蛋白质序列 3.Similarity searches 序列类似性检索(已讲) 4.Pattern and profile searches 模式的搜索 5.Post-translational modification prediction 翻译 后修饰预测