蛋白质的功能与结构预测

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

蛋白质模体及结构域数据库
PRINTS(蛋白质模体指纹数据库):
基 础 生 物 信 息 学 及 应 用
A fingerprint is a group of conserved motifs used
to characterise a protein family; its diagnostic power is refined by iterative scanning of a SWISSPROT/TrEMBL composite. Usually the motifs do not overlap, but are separated along a sequence, though they may be contiguous in 3D-space.. http://bioinf.man.ac.uk/dbbrowser/PRINTS/
基 础 生 物 信 息 学 及 应 用
蛋白质模体及结构域数据库
SMART (Simple Modular Architecture Research
基 础 生 物 信 息 学 及 应 用
Tool):
Contains HMM profiles constructed from manually
SMART (Simple Modular Architecture Research
基 础 生 物 信 息 学 及 应 用
Tool):
The
database may be of better quality than Pfam with more extensive functional annotations. Compared to Pfam, the SMART database contains an independent collection of HMMs, with emphasis on signaling, extracellular, and chromatin-associated motifs and domains. Sequence searching in this database produces a graphical output of domains with well-annotated information with respect to cellular localization, functional sites, superfamily, and tertiary structure.
http://blocks.fhcrc.org/blocks.
检测和鉴定蛋白质模体,有BLOCK search、Get Blocks和Block Maker工

A query sequence can be used to align with precomputed profiles in the database to select the highest scored matches.
derived from sequences in SWISSPROT and TrEMBL. Each motif or domain is represented by an HMM profile generated from the seed alignment of a number of conserved homologous proteins. http://pfam.janelia.org/
A domain may or may not include motifs within its boundaries.
Examples,transmembrane domains, ligand-binding domains.
蛋白质模体及结构域数据库
Identification of motifs and domains
Alignments are further checked and refined by human annotators before HMM profile construction.
Protein functions are also manually curated.
蛋白质模体及结构域数据库
PROSITE还包括根据多序列比对而构建的序列统计特征,能更敏感地发现一 个(未知)序列是否具有相应的特征。 The functional information of these patterns is primarily based on published literature.
基 础 生 物 信 息 学 及 应 用 To search the database with a query sequence, PROSITE uses exact matches to the sequence patterns.
The Pfam database is composed of two parts
Pfam-A involves manual alignments
Pfam-B, automatic alignment in a way similar to ProDom( PSI-BLAST ). The functional annotation of motifs in Pfam-A is often related to that in PROSITE. Pfam-B only contains sequence families not covered in Pfam-A.
蛋白质模体及结构域数据库
模体(motifs)和结构域 (domains):
基 础 生 物 信 息 学 及 应 用
Biologists can gain insight of the protein function
Βιβλιοθήκη Baidu
based on identification of short consensus sequences related to known functions. These consensus sequence patterns are termed motifs and domains.
基 础 生 物 信 息 学 及 应 用
heavily relies on multiple sequence alignment as well as profile and hidden Markov model (HMM) construction
蛋白质模体及结构域数据库
PROSITE(蛋白质家族及结构域数据库):
Because of the automatic nature, Pfam-B has a much larger
coverage but is also more error prone because some HMMs are generated from unrelated sequences.
基础生物信息学及应用
李裕强
2009.09
第Ⅲ部分 生物分子信息的分析
基 础 生 物 信 息 学 及 应 用
第十章 蛋白质的功能与结 构预测
本章内容:
基 础 生 物 信 息 学 及 应 用
蛋白质家族和结构域数据库 蛋白质功能预测
蛋白质结构预测
第一节 蛋白质家族和结构域数据库
基 础 生 物 信 息 学 及 应 用
A typical motif, such as a Zn-finger motif, is ten to twenty amino acids long.
蛋白质模体及结构域数据库
基 础 生 物 信 息 学 及 应 用
A domain is also a conserved sequence pattern, defined as an independent functional and structural unit.
A motif is a short conserved sequence pattern associated with distinct functions of a protein or DNA.
It is often associated with a distinct structural site performing a particular function.
基 础 生 物 信 息 学 及 应 用
The first established sequence pattern database
www.expasy.org/prosite/
是蛋白质家族和结构域数据库,包含具有生物学意义的位点、模式、可
帮助识别蛋白质家族的统计特征。
PROSITE中涉及的序列模式包括酶的催化位点、配体结合位点、与金属离子 结合的残基、二硫键的半胱氨酸、与小分子或其它蛋白质结合的区域等。
Blocks:ungapped multiple alignments derived from the most conserved, ungapped regions of homologous protein sequences. The blocks, which are usually longer than motifs, are subsequently converted to PSSMs. Because blocks often encompass motifs, the functional annotation of blocks is thus consistent with that for the motifs
提供蛋白质同源性分析,蛋白质模体指纹分析,系统发生
和序列进化分析,以及微阵列分析,并提供生物信息学和 PRINTS数据库数据下载。
基 础 生 物 信 息 学 及 应 用
蛋白质模体及结构域数据库
BLOCKS:
基 础 生 物 信 息 学 及 应 用
A database of blocks
本节内容:
蛋白质模体及结构域数据库
蛋白质家族数据库
蛋白质结构数据库
其它生物大分子数据库
1、蛋白质模体及结构域数据库
基 础 生 物 信 息 学 及 应 用

模体和结构域 PROSITE数据库 PRINTS数据库 BLOCKS数据库 ProDom数据库 Pfam数据库 SMART数据库 InterPro数据库 Conserved Domain数据库 CDART
提供相似性搜索、来自SWISSPROT相关结构域的多序列比对
蛋白质模体及结构域数据库
Pfam(Protein families database of alignments and HMMs)
基 础 生 物 信 息 学 及 应 用
A database with protein domain
refined protein domain alignments. http://smart.embl-heidelberg.de/
Alignments in the database are built based on
tertiary structures whenever available or based on PSI-BLAST profiles.
Domains are normally longer than motifs. A domain consists of more than 40 residues and up to 700 residues, with an average length of 100 residues.
基 础 生 物 信 息 学 及 应 用
蛋白质模体及结构域数据库
ProDom
基 础 生 物 信 息 学 及 应 用
Domain database
ProDom is a comprehensive set of protein domain families automatically generated from the SWISS-PROT and TrEMBL sequence databases The domains are built using recursive iterations of PSIBLAST. http://prodom.prabi.fr/prodom/current/html/home.php
相关文档
最新文档