生物信息学
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
蛋白质结构的可视化
RasWin
Cn3D
Bioinformatics, 2008-2009, Semester 1, USTC
3. 蛋白质二级结构预测
1. Chou-Fasman predictions: Empirical
2. Garnier, Osguthorpe and Robson (GOR): HMM 3. David T. Jones: PSSM
反平行的b-sheet
Bioinformatics, 2008-2009, Semester 1, USTC
平行的b-sheet
Bioinformatics, 2008-2009, Semester 1, USTC
混合的b-Sheets
Bioinformatics, 2008-2009, Semester 1, USTC
P
f
20
fi
j
Bioinformatics, 2008-2009, Semester 1, USTC
Pα & Pβ
-helix b-sheet
Bioinformatics, 2008-2009, Semester 1, USTC
经验规则与预测性能
1. 规则一:对于给定一个>6aa的片段, Pα均值> 1.03,并且Pα的均值 > Pβ的均值, 则判定为α-Helix 2. 规则二:对于给定一个>6aa的片段, Pβ的均值> 1.05,并且 Pβ的均值 > Pα的均 值,则判定为β-sheet 3. 预测性能:准确性~50-60%;对于βsheet性能较差
3. MSD (Molecular Structure Database): 大分子的相互作用和结合位点
/msd
Bioinformatics, 2008-2009, Semester 1, USTC
PDB (RCSB)
Bioinformatics, 2008-2009, Semester 1, USTC
2. 平均长度:10个氨基酸残基 (10 A0)
长度范围:5-40aa
每一圈:3.6个aa
通过氢键 (~per 4aa) 稳定结构
通常在内核的表面,疏水残基向内,亲水残
基向外
Bioinformatics, 2008-2009, Semester 1, USTC
helix 通过氢键稳定结构
Domains:Motifs的组合
Bioinformatics, 2008-2009, Semester 1, USTC
一个或多个domains
Bioinformatics, 2008-2009, Semester 1, USTC
六种蛋白质的结构类型
(1) Domains: 螺旋束通过loops连接
4. Greek key: 4 adjacent antiparallel strands
5.bb:2 parallel strands connected by helix
Bioinformatics, 2008-2009, Semester 1, USTC
H-T-H
H-L-H
Bioinformatics, 2008-2009, Semester 1, USTC
Bioinformatics, 2008-2009, Semester 1, USTC
Greek key motifs
Bioinformatics, 2008-2009, Semester 1, USTC
bDomains
TIM barrel Rossman fold
Bioinformatics, 2008-2009, Semester 1, USTC
C = black O = red N = blue
Bioinformatics, 2008-2009, Semester 1, USTC
R-侧基分布在helix 的外侧
Bioinformatics, 2008-2009, Semester 1, USTC
helices:氨基酸偏好
Ala, Glu, Leu, Met:出现频率高 Pro, Gly Tyr, Ser:出现频率低
Bioinformatics, 2008-2009, Semester 1, USTC
b-Strands & Sheets
1. 一般不单独出现,成对或多个出现
2. b链通过氢键连接,稳定结构 3. 相互作用的部分通过短的/长的loop连 接 4. 平行或反平行的bsheet
Bioinformatics, 2008-2009, Semester 1, USTC
http://ekhidna.biocenter.helsinki.fi/dali_server/index.html
DALI Database (fold classification)
http://ekhidna.biocenter.helsinki.fi/dali/start
Bioinformatics, 2008-2009, Semester 1, USTC
蛋白质结构的数据库
1.PDB (Protein Data Bank): 蛋白质结构数 据库
/pdb/home/home.do
2. MMDB (Molecular Modeling Database): 分子模拟数据库
/sites/entrez?d b=structure
/scop/
2. CATH (Classification by Class, Architecture, Topology & Homology)
/
3. DALI/FSSP: 蛋白质三级结构的比较 DALI server
四级结构
多个肽链在空间上的排布
Bioinformatics, 2008-2009, Semester 1, USTC
超二级结构
1. Structural Motifs:超二级结构 或二级结构的组合 2. Domains: Motifs的组合
Bioinformatics, 2008-2009, Semester 1, USTC
b-hairpin
Bioinformatics, 2008-2009, Semester 1, USTC
Greek key
Bioinformatics, 2008-2009, Semester 1, USTC
Beta-alpha-beta
Bioinformatics, 2008-2009, Semester 1, USTC
4. Frishman, Argos: Nearest neighbor methods 5. Sujun Hua: Support vector machine
Bioinformatics, 2008-2009, Semester 1, USTC
Chou-Fasman
1. 预测三种主要的二级结构: -helix, bsheet,Coils 2. 训练数据:15个已知构象的蛋白质结构, 共2473个氨基酸残基 3. 定义:蛋白质构象参数 (protein conformational parameters): 氨基酸残 基在二级结构中的重要性
Bioinformatics, 2008-2009, Semester 1, USTC
-domain structures: 4-helix bundles
Bioinformatics, 2008-2009, Semester 1, USTC
Up-and-down sheets and barrel
因此,预测蛋白质的结构和功能非常的困难
Bioinformatics, 2008-2009, Semester 1, USTC
蛋白质结构的四个基本层面
Bioinformatics, 2008-2009, Semester 1, USTC
一级和二级结构
1. 一级结构
氨基酸的线性序列
氨基酸残基之间连接的共价键
Loops
1. 连接-helix和b-sheet
2. 长度和三级结构不定
3. 在蛋白质结构的表面
4. 受点突变的影响小
5. 柔性好,构象变化余地大 6. 带电荷、极性的氨基酸比例高 7. 倾向成为活性位点
Bioinformatics, 2008-2009, Semester 1, USTC
一些常见的结构性motifs
1. Helix-turn-helix: e.g., DNA binding
2. Helix-loop-helix: e.g., Calcium binding
3. b-hairpin: 2 adjacent antiparallel strands
connected by short loop
Pα, Pβ, Pc
Bioinformatics, 2008-2009, Semester 1, USTC
氨基酸在各种二级结构中的频率
Inner Helix: Included in Helix
Bioinformatics, 2008-2009, Semester 1, USTC
Pα, Pβ, Pc的计算
2. 蛋白质结构数据库、结构分类以及可视化 1. 蛋白质结构的数据库:PDB, MMDB, MSD 2. 蛋白质结构的分类:SCOP, CATH, DALI/FSSP 3. 蛋白质结构的可视化:Cn3D, Rasmol/Raswin
Bioinformatics, 2008-2009, Semester 1, USTC
MMDB
Bioinformatics, 2008-2009, Semester 1, USTC
MSD
Bioinformatics, 2008-2009, Semester 1, USTC
蛋白质结构的分类
1. SCOP (Structural Classification of Proteins): folds, superfamilies, and families
2. 二级结构
氨基酸残基局部空间内的排列
短程的、非共价的相互作用 周期性的结构模式: -helix, b-sheet,loops, coils
Bioinformatics, 2008-2009, Semester 1, USTC
- helix
1. 蛋白质中最多的二级结构
生物信息学
第九章 结构生物信息学
Bioinformatics, 2008-2009, Semester 1, USTC
本章内容提要
1. 蛋白质的结构与功能
2. 蛋白质结构的数据库、结构分类以及可
视化
3. 蛋白质二级结构预测
4. 蛋白质三级结构预测
Bioinformatics, 2008-2009, Semester 1, USTC
1. 蛋白质的结构与功能
蛋白质的结构 – 主要由一级序列所决定 蛋白质的功能 – 主要由三级结构所决定 球蛋白 (Globular proteins): 疏水的内核 & 亲水的 表面 膜蛋白 (Membrane proteins): 特定的疏水表面 亚稳态 (marginally stable): 折叠之后的蛋白质 无序性 (Intrinsically disordered): 许多蛋白质必须 与其他蛋白质结合后才能够获得稳定的结构
Coils
无序性 (Intrinsically disordered ): 介导蛋白质蛋白质之间的相互作用
Bioinformatics, 2008-2009, Semester 1, USTC
三级和四级结构
三级结构
肽链折叠成三维的空间结构
二级结构在空间上的排布 长程的、共价与非共价的相互作用
(2)b Domains: 主要是反平行b片,两对b片形成 sandwich结构 (3)bDomains: 螺旋连接的平行的b片 (4) bDomains: 螺旋和b片各自形成单独的 结构 (5) Multidomain ( b):包含多种domains (6) Membrane & cell-surface proteins