蛋白质结构预测和序列分析软件
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
蛋白质结构预测和序列分析软件蛋白质数据库及蛋白质序列分析
第一节、蛋白质数据库介绍
一、蛋白质一级数据库
1、 SWISS-PROT 数据库
SWISS-PROT和PIR是国际上二个主要的蛋白质序列数据
库,目前这二个数据库在EMBL和GenBank数据库上均建
立了镜像 (mirror) 站点。
SWISS-PROT数据库包括了从EMBL翻译而来的蛋白质序
列,这些序列经过检验和注释。该数据库主要由日内瓦大
学医学生物化学系和欧洲生物信息学研究所(EBI)合作维
护。SWISS-PROT的序列数量呈直线增长。
2、TrEMBL数据库:
SWISS-PROT的数据存在一个滞后问题,即
进行注释需要时间。一大批含有开放阅读
了解决这一问题,TrEMBL(Translated E
白质数据库,它包括了所有EMBL库中的
质序列数据源,但这势必导致其注释质量
3、PIR数据库:
PIR数据库的数据最初是由美国国家生物医学研究基金
会(National Biomedical Research Foundation, NBRF)
收集的蛋白质序列,主要翻译自GenBank的DNA序列。
1988年,美国的NBRF、日本的JIPID(the Japanese
International Protein Sequence Database日本国家蛋
白质信息数据库)、德国的MIPS(Munich Information
Centre for Protein Sequences摹尼黑蛋白质序列信息
中心)合作,共同收集和维护PIR数据库。PIR根据注释
程度(质量)分为4个等级。
4、 ExPASy数据库:
目前,瑞士生物信息学研究所(Swiss I
质分析专家系统(Expert protein anal
据库。
网址:
我国的北京大学生物信息中心(www.cbi.
三、蛋白质二级结构预测网站(数据库)
5、DSSP (Definition of Secondary S 蛋白质二级结构构象参数数据库
DSSP的网址:http://www.cmbi.kun.nl 6、FSSP (Families of Structural Si 蛋白质家族数据库
FSSP的网址:http://www.embl-ebi.ac 7、HSSP(Homology Derived Secondary 同源蛋白质数据库
HSSP的网址: http://www.cmbi.kun.n 在前面已经述说过了。
同步法实质是把给定的所有序列同时进行
其基本思想是将一个二维的动态规划矩阵的序列数。这类方法对于计算机的系统资对.
3)、步进法
这类方法中最常用的就是Clustal,它是和Doolittle,1987)。由于对于实际的不太现实,因此大多数实用的多序列比对
Clustal的基本思想是基于相似序列通常有的序列进行两两比对并计算它们的相似干组,并在每组之间进行比对,计算相似到得到最终比对结果。比对过程中,相似列添加在后面。作为程序的一部分,Clu