蛋白质的序列分析及结构预测

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• Mass Spectrometer measure mass/charge
ratio of an ion.
精品课件
Peptide Fragmentation
Collision Induced Dissociation
H+
H...-HN-CH-CO . . . NH-CH-CO-NH-CH-CO-…OH
(1)直接测序
e.g. Protein Sequencing and Identification by Tandem Mass Spectrometry,
即用串联质谱仪测序
精品课件
串联质谱及其作用
• 两个或更多的质谱连接在一起,称为串联质谱。 •最简单的串联质谱(MS|MS)由两个质谱串联而 成,其中第一个质量分析器(MS1)将离子预分离 或加能量修饰,由第二级质量分析器(MS2)分析 结果。
蛋白质的序列分析及结构预测
精品课件
DNA sequence Protein sequence
Protein structure
精品课件
Protein function
一、蛋白质数据库介绍 二、蛋白质序列分析 三、蛋白质结构预测 四、应用 分子设计
精品课件
一、蛋白质数据库介绍
蛋白质的结构主要分为四级, 一级结构、二级结构、三级结构 以及四级结构。依据这种结构层次, 将蛋白质数据库分为: 1. 蛋白质序列数据库:如PIR、SWISS-PROT、NCBI , 这些 数据库的数据主要以蛋白质的序列为主, 并赋予相应的注释; 2. 蛋白质模体及结构域数据库:如PROSITE、Pfam, 这些数 据库主要收集了蛋白质的保守结构域和功能域的特征序列; 3. 蛋白质结构数据库: 如PDB 等, 这些数据库主要以蛋白质 的结构测量数据为主; 4. 蛋白质分类数据库:如SCOP、CATH、FSSP 等, 这其中有 以序列比较为基础的序列分类数据库以及以结构比较为基础的 结构分类数据库之分。
精品课件
Mass Spectra
H2O
GV
DD
L
K
57 Da =K‘G’ 99 Da = ‘V’ L
D
V
G
mass
0
• The peaks in the mass spectrum:
– Prefixand Suffix Fragments. – Fragments with neutral losses (-H2O, -
灵 敏度。
精品课件
Masses of Amino Acid Residues
精品课件
Protein backbone
H...-HN-CH-CO-NH-CH-CO-NH-CH-CO-…OH
N-terminus
Ri-1
Ri
Ri+1
C-terminus
AA residuei-1 AA residuei AA residuei+1
• PROSITE 中涉及的序列模式包括酶的催化位点、配体结合位 点、金属离子结合位点、二硫键、小分子或者蛋白质结合区 域等, 此外PROSITE 还包括由多序列比对构建的序列表谱 ( profile) , 能更敏感地发现序列中的信息。
精品课件
PROSITE同时数据库提供了序列分析工具:
① ScanProsite 是用于搜索所提交的序列数据是否包 含 PROSITE 数据库中的序列模式或者SWISSPROT 数据库中已提交的序列模式;
a2 b2
a3 b3
HO
NH3+
|
|
R1 O | ||
R2 O | ||
R3 O
R4
| ||
|
H -- N --- C --- C --- N --- C --- C --- N --- C --- C --- N --- C --
COOH
||
||
||
|
HH
HH
HH
H
y3
y2
y1
y3 -H2O
y2 - NH3
精品课件
N- and C-terminal Peptides
486
71
41 5
30
185
1
154
332
57
429
精品课件
N- and C-terminal Peptides
486
71
41 5
30
185
1
154
ห้องสมุดไป่ตู้
332
57
429
精品课件
Peptide Fragmentation
b2-H2O
b3- NH3
精品课件
2. 模体以及结构域数据库
➢ 模体数据库
(1)PROSITE 蛋白质家族及结构域数据库 ( /prosite/ )
• PROSITE 数据库收集了有显著生物学意义的蛋白质位点序列、 蛋白质特征序列谱库以及序列模型, 并能依据这些特征属性快 速可靠地鉴定出一个未知功能蛋白质序列属于哪个蛋白质家 族, 即使在蛋白质序列相似性很低的情况下, 也可以通过搜索 隐含的功能结构模体(motif)来鉴定, 因此是有效的序列分析 数据库。
NH3) – Noise and missing精品p课件eaks.
Protein Identification with MS/MS
GV
D
L
K
MS/MS
Peptide Identification:
Intensity
00 精品课件
mass
Tandem Mass-Spectrometry
精品课件
PDB 包括了蛋白质、核酸、蛋白质-核酸复合体以及病 毒等生物大分子结构数据, 主要是蛋白质结构数据, 这些数据来源于几乎全世界所有从事生物大分子结 构研究的研究机构, 并由RCSB 维护和注释。
精品课件
4.蛋白质结构分类数据库
(1) CATH 数据库 /bsm/cathnew/index.ht ml
(2) SCOP 蛋白质结构分类数据库( structural classification of protein database,SCOP) /scop/index.html
精品课件
二、蛋白质的序列分析
1. 蛋白质序列信息的获取 2. 蛋白质序列分析
精品课件
精品课件
1. 蛋白质序列数据库
(1)PIR(protein information resource, PIR)和PSD (protein sequence database, PSD) /pirwww
PIR-PSD 是一个综合全面的、非冗余的、专业注释的、分类完整的蛋白质序列数 据库。PIR-PSD 的序列来自于将GenBank/ EMBL/ DDBJ 三大数据库的编码序 列的翻译而成的蛋白质序列、发表的文献中的序列和用户直接提交的序列。
fragment ions and measures the mass of
each piece.
精品课件
General for sequencing
Breaking Protein into Peptides and Peptides into Fragment Ions
• Mass Spectrometer accelerates the fragmented ions; heavier ions accelerate slower than lighter ones.
(3) SMART SMART 是一个简单的结构研究工具, 可对可转移的遗传因子 进行鉴定和注解, 以及分析结构域结构, 可以检测出500 多个 参与信号传导、胞外和染色体相关蛋白质的结构域家族, 对这 些结构域又在系统进化树分精布品课、件 功能分类、三级结构和重要
3. 蛋白质结构数据库
PDB( protein data bank , PDB) /pdb/
Ri-1
Ri
Ri+1
Prefix Fragment
Suffix Fragment
• Peptides tend to fragment along the backbone.
• Fragments can also loose neutral chemical groups like NH3 and H2O.
(2)SWISS-PROT/ TrEMBL数据库 /swissprot
数据库由蛋白质序列条目构成, 每个条目包含蛋白质序列、引用文献信息、 分类学信息、注释等, 注释中包括蛋白质的功能、转录后修饰位点、特殊位点 和区域、二级结构、四级结构、与其他序列的相似性、序列残缺与疾病的关系、 序列变异体等信息。
精品课件
蛋白质数据库特征: • 这些数据库种类有差别, 但内部是相互联系的.
• 每个数据库都有指针指向其他数据库, 而且数据 库之间的序列以及相应的结构是共享的, 同一种 蛋白质依次会出现在不同的数据库.
• 这样的数据沟通有助于更深层地挖掘蛋白质的 内在生物信息, 这些数据库是融序列信息的索取 、处理、存储、输出于一身的。
1. 蛋白质序列信息的获取
(1) 直接测序 (2) 翻译编码的DNA序列 ORF Finder (3)在数据库中搜索 • 运用ID 号、入口号、条目号等搜索。 • 运用关键词搜索 • 其他方式搜索。如可以通过引用序列的文献、
序列的作者、序列提交的日期等进行搜索。
精品课件
1. 蛋白质序列信息的获取
模体以及结构域数据库模体数据库1prosite蛋白质家族及结构域数据库wwwexpasyorgprositeprosite数据库收集了有显著生物学意义的蛋白质位点序列蛋白质特征序列谱库以及序列模型并能依据这些特征属性快速可靠地鉴定出一个未知功能蛋白质序列属于哪个蛋白质家族即使在蛋白质序列相似性很低的情况下也可以通过搜索隐含的功能结构模体motif来鉴定因此是有效的序列分析数据库
这个数据库包含1 500 个蛋白质指纹图谱, 编码9 136 个单一模体。
(3) BLOCKS ( ) BLOCKS 是通过一些高度保守的蛋白质区域比对出来
的无空位的片段。
精品课件
➢ 蛋白质结构域数据库
(1 ) 蛋白质家族序列比对以及隐马尔可夫模式数据库 Pfam( protein families database of alignments and HMMs)
Breaking Proteins into Peptides
MPSERGTDIMRPAKID......
protein
GTDIMR PAKID
MPSER …… ……
HPLC To
MS/MS
peptides
精品课件
Mass Spectrometry
Matrix-Assisted Laser Desorption/Ionization
Pfam 是蛋白质家族序列比对以及隐马尔可夫模式数据库,其网 址是: /Software/Pfam/index.shtml。
(2) 蛋白质结构域数据库ProDom
http://prodes.toulouse.inra.fr/prodom/doc/prodom.ht ml
精品课件
N- and C-terminal Peptides
精品课件
Terminal peptides and ion types
Peptide Mass (D) 57 + 97 + 147 + 114 = 415
Peptide
without
Mass (D) 57 + 97 + 147 + 114 – 18 = 397
精品课件
General for sequencing
Breaking Protein into Peptides and Peptides into Fragment Ions
• Proteases, e.g. trypsin(胰蛋白酶), break
protein into peptides.
• A Tandem Mass Spectrometer(串联式质谱仪 ) further breaks the peptides down into
② MotifScan 用于查找未知序列中所有可能的已知结 构组件, 数据库包括PROSITE序列表谱、PROSITE 模式、Pfam 收集的隐马尔可夫模式( HMM)。
精品课件
模体数据库
(2) PRINTS Fingerprint Database /dbrowser/PRINTS/
精品课件
串联质谱仪的组合方式:
(1) 磁分析器-静电分析器-磁分析器 (2) 静电分析器-磁分析器-静电分析器 (3) 三重四极滤质器质谱仪 (4) 混合式串联质谱仪,如MA-ESA-Q-Q。实现 串联质谱有空间串联和时间串联两种方式。
精品课件
优点:
• 可以避免底物分子产生的干扰,大大降低背景噪音。 • 其次,可使分子离子通过与反应气的碰撞来产生断裂。 • 因此能提供更多的结构信息,所以串联质谱特别适合 于复杂组分体系且干扰严重的样品中低含量组分分析测 定,具有比GC-MS和LC-MS等一级质谱更高的选择性和
相关文档
最新文档