生物信息学

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

已知蛋白质序列往往进行如图所示的一系类列的分析

下面用pfam软件进行结构域的简单分析:

结构域的分析(pfam)

•结构域(structure domain)

蛋白质三级结构中介于二级和三级结构之间的可以明显区分但又相对独立的折叠单元。

•25~300个氨基酸残基组成。

•五种类型:全平行结构域,反平行结构域,α+β结构域,α/β结构域,其他折叠类型。

蛋白质通常由一个或多个功能区域,通常称为域。不同领域的出现在不同的组合在不同的蛋白质产生不同的曲目在自然界发现的蛋白质。识别领域存在于一种蛋白质可以提供见解,蛋白质的功能。

Pfam软件简介:

Pfma数据库是一个收藏的大量蛋白质域的家庭。每个家庭由多个序列校准,以及“隐藏式马尔科夫模型(HMMS)。

有两个等级的品质,pfam家庭:一个和Pfma b。Pfma a条目包含了许多来自底层序列数据库,称为Pfam seq,这是由最近发布的UniProtKB在给定的时间点。Pfam a家庭由许多一个策划种子含有少量的对齐代表家族成员,剖面隐马尔可夫模型(HMMS)由种子对齐和一个自动生成的全排列,其中包含所有蛋白质序列检测属于家庭定义为HMM搜索数据库的主序列。

Pfam b家庭联合国注释和低质量为他们从集群自动生成非冗余的最新加入释放。尽管低的质量,pfam b家庭可以用于识别功能守恒的地区没有发现了pfam a一个条目。

•利用pafm进行蛋白质结构域及功能位点分析

MSRQAWIETSALIECISEYGTKCSFDTFQGLTINDISTLSNLM NQISV ASVGFLNDPRTPLQAMSCEFVNFISTADRHAYMLQK NWFDSDV APNVTTDNFIATYIKPRFSRTVSDVLRQVNNFALQ PMENPKLISRQLGVLKAYDIPYSTPINPMDV ARSSANVVGNV SQRRALSTPLIQGAQNVTFIVSESDKIIFGTRSLNPIAPGNFQI NVPPWYSDLNVVDARIYFTNSFLGCTIQNVQVNA VNGNDPV ATITVPTDNNPFIVDSDSVVSLSLSGGAINVTTA VNLTGYAIAI EGKFNMQMNASPSYYTLSSLTIQTSVIDDFGLSAFLEPFRIR LRASGQTEIFSQSMNTLTENLIRQYMPANQA VNIAFVSPWY RFSERARTILTFNQPLLPFASRKLIIRHLWVIMSFIA VFGRYY TVN

keywor d sea

Significant Pfam-A Matches Show or hide all alignments.

Description Entry

type

Clan

Envelope Alignment

Start End Start End

efhand_like Phosphoinositide-specific

phospholipase C, efhand-like

Domain C L0220 245 318 250 318

PI-PLC-X Phosphatidylinositol-specific

phospholipase C, X domain

Family CL0384 322 465 322 465

SH2SH2 domain Domain n/a550 639 550 639 SH2SH2 domain Domain n/a668 741 668 741 SH3_1SH3 domain Domain C L0010 797 843 797 843

PI-PLC-Y Phosphatidylinositol-specific

phospholipase C, Y domain

Family CL0384 952 1070 952 1070

C2C2 domain Domain C L01541090 1177 1092 1176 nsignificant Pfam-A Matches Show or hide all alignments.

Family Description Entry

type

Clan

Envelope Alignment HMM

Bi

sco

Start End Start End From To

PH PH domain Domain C L026634 142 40 139 8 101 24.

nsignificant Pfam-A Matches Show or hide all alignments.

EF_hand_4EF-hand

domain

Domain C L0220 156 192 157 183 2 28 10.

PH PH domain Domain C L0266 489 575 490 533 2 38 13.

PH PH domain Domain C L0266 842 931 873 929 44 102 16. Pfam-B Matches Show or hide all alignments.

Pfam-B_12554n/a n/a n/a37 232 45 164

#HMM kPKfcpfrLssDesaLiWyskkkeKr..lkLSsvsriiiGqrTavFery....lrpeke #MATCH +P f++ +++++W + + + + + + +i +G+ + F ry + + #PP 5777788888888*****9996555566*********************5443223468 #SEQ R PERKTFQVKLETRQITWSRG ADKIEga IDIREIKEIRPGKTSRDFDRY qedpAFRPD Q

Comments or questions on the site? Send a mail to pfam-help@

相关文档
最新文档