11、结构生物信息学结构分析与预测2
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 二级结构在空间上的排布 • 主要化学键:疏水键、离子键、氢键和 Van der Waals等 四级结构
• 蛋白质分子中各亚基的空间排布及亚基接触部位的布局和相互 作用,称为蛋白质的四级结构。
• 有些蛋白质分子含有二条或多条多肽链,每一条多肽链都有完 整的三级结构,称为蛋白质的亚基 (subunit)
结构生物信息学
内容提要
1. 蛋白质的结构与功能 2. 蛋白质结构的数据库、结构分类以及分子图形学 3. 蛋白质结构预测 ① 二级结构预测 ② 三级结构预测 4. 结构生物学 ① 核磁共振波谱学 ② X-射线晶体学 ③ 低温电镜技术
1. 蛋白质的结构与功能
蛋白质的结构 – 主要由一级序列所决定 蛋白质的功能 – 主要由三级结构所决定
25
一些常见的结构性motifs
1. helix-turn-helix: e.g., DNA binding 2. helix-loop-helix: e.g., Calcium binding
3. : 2 adjacent antiparallel strands connected by short loop 4. Greek key: 4 adjacent antiparallel strands 5. : 2 parallel strands connected by helix
2. 不带电的极性氨基酸7种:Gly,Ser,Thr,Tyr, Cys,Asn,Gln。
3. 带正电荷的极性氨基酸3种(碱性氨基酸):Lys, Arg,His。
4. 带负电荷的极性氨基酸2种(酸性氨基酸):Asp, Glu。
氨基酸特性
两亲性:Arg、Lys、Gln和Glu,侧链中都包含有疏 水和亲水部分,部分侧链可以包埋在蛋白质结构内 部,另外部分则暴露在水环境中,是形成界面的理 想分子。
α-helix
1. 蛋白质中最多的二级结构 2. 平均长度:10个氨基酸残基 (10 Å)
• 长度范围:5-40aa • 每一圈:3.6个aa • 通过氢键 (~per 4aa) 稳定结构 • 通常在内核的表面,疏水残基向内,亲水残基向外
α-helix:氢键稳定结构
17
α-helix:氨基酸偏好
•DALI server
http://ekhidna.biocenter.helsinki.fi/dali_server/index.html
•DALI Database (fold classification)
http://ekhidna.biocenter.helsinki.fi/dali/start
• 亚基之间的结合主要是氢键和离子键。
38
蛋白质功能与结构的主要类别——结合
Myoglobin (PDB: 1a6k)
39
蛋白质功能与结构的主要类别——结合
TATA binding protein (PDB: 1tgh)
40
蛋白质功能与结构的主要类别——催 化
(DNA polymerase PDB:3pw0)
•http://scop.mrc-lmb.cam.ac.uk/scop/
2. CATH (Classification by Class, Architecture, Topology & Homology)
•http://www.cathdb.info/
3. DALI/FSSP: 蛋白质三级结构的比较
Sec在许多生物中普遍存在,由UGA编码;Pyl很 罕见,只存在于古生菌中,由UAG编码。
一级结构
• The primary structure refers to amino acid linear sequence of the polypeptide chain.
• 蛋白质的一级结构指在蛋白质分子从N-端至C-端的氨基酸排列顺序。 • Atomic compositions:C, H, N, O, P, S • 一个氨基酸的α羧基和另一个氨基酸的α氨基连接起来成为酰氨键,通常
(Hydrophobic bond) 4. 范德华力(van der waals
force) 5. 二硫键 (Disulfide bond)
二级结构
•Secondary structure refers to highly regular local substructures. •蛋白质分子中某一段肽链的局部空间结构,即该段肽链主链骨架 原子的相对空间位置,并不涉及氨基酸残基侧链的构象 。 •二级结构的形成几乎全是由于肽链骨架中的羰基上的氧原子和亚 胺基 上氢之间的氢键所维持,其他作用力如范德华力等也有一定贡 献。所以肽段间的氢键(Hydrogen bond)越多,他们形成的二级结 构就越稳定 •周期性的结构模式: α-helix, β-sheet,loops, coils
可溶性球状蛋白质包装的主要原则:疏水侧链包在 里面形成紧密核心,亲水侧链暴露在表面。
氨基酸特性
Amino acid properties:www.russelllab.org/aas/
氨基酸特性
另外有两种氨基酸:硒代半胱氨酸(Sec,U)和吡咯 赖氨酸(Pyl,O)可以在蛋白质合成时插入到多肽链 中,受遗传密码的修饰性阅读所指导。
33
-Domain structures: 4-helix bundles
34
Up-and-down sheets and barrel
35
Greek key motifs
36
domains
TIM barrel fold
rossman
37
三级和四级结构
三级结构
• 整条肽链中全部氨基酸残基的相对空间位置。即肽链中所有原 子在三维空间的排布位置。
脂肪族侧链:Ala、Ile、Leu、Met、Pro和Val。侧 链的惰性很强,不易发生反应,极少直接参与蛋白 质的功能,特别适于组装蛋白质的内部结构。
芳香族侧链:Phe、Trp、Tyr和His,参与‘堆积’ 相互作用。
氨基酸特性
小氨基酸:Ala、Cys、Gly、Pro、Ser和Thr。
His:pKa3 = 6.5,在生理pH值下大约只有10%的 侧链带正电荷,而精确的pKa值取决于具体的微环 境。
26
H-T-H
H-L-H
27
ββ
28
Greek key
29
ββ
30
Domains:motifs 的组合
31
一个或多个domains
32
六种蛋白质的结构类型
(1) Domains: 螺旋束通过loops连接 (2) Domains: 主要是反平行片,两对片形成sandwich 结构 (3) Domains: 螺旋连接的平行的片 (4) Domains:螺旋和片各自形成单独的结构 (5) Multidomain ( ) :包含多种domains (6) Membrane & cell-surface proteins
因此,预测蛋白质的结构和功能非常的困难
蛋白质结构的四个基本层面
Protein Structure 蛋白质结构进阶
5
氨基酸特性
考虑氨基酸理化性质时注意的主要因素:侧链基团的大小, 和疏水性。常根据氨基酸侧链的疏水性进行分类。
1. 非极性氨基酸8种:Ala,Val,Leu,Ile,Pro,Phe, Trp,Met。
Ala, Glu, Leu, Met:出现频率高 Pro, Gly Tyr, Ser:出现频率低
18
β-Strands & β-Sheets
1. 一般不单独出现,成对或多个出现 2. 链通过氢键连接,稳定结构 3. 相互作用的部分通过短的/长的loop连接 4. 平行或反平行的-sheet
19
反平行的β-Strands
无序性 (Intrinsically disordered ): 介导蛋 白质-蛋白质之间的相互作用,用来阐述没有确定 规律性的那部分肽链结构。
24
模体(motif):具有特殊 功能的超二级结构
在许多蛋白质分子中,可发现二个或三个具有二级结构的肽段, 在空间上相互接近,形成一个有规则的二级结构组合,被称为超二 级结构。
称为肽键 • 主要化学键:肽键。键长为0.132nm。这个键长介于单键C-N(0.149nm)
和双键C=N(0.127nm)之间,具有部分双键的性质。
一级结构是蛋白质空间构象和特异生物学功能 的基础,但不是决定蛋白质空间构象的唯一因素。
13
Non-Bonded Interactions
1. 盐键 (Ionic bond) 2. 氢键 (Hydrogen bond) 3. 残基的亲、疏水性
球蛋白 (Globular proteins): 疏水的内核 & 亲水的表面 膜蛋白 (Membrane proteins): 特定的疏水表面
亚稳态 (marginally stable): 折叠之后的蛋白质 无序性 (Intrinsically disordered): 许多蛋白质必须与其他蛋白 质结合后才能够获得稳定的结构
20
平行的β-Strands
21
混合的β-Strands
22
Loops
1. 连接-helix和-sheet 2. 长度和三级结构不定 3. 在蛋白质结构的表面 4. 受点突变的影响小 5. 柔性好,构象变化余地大 6. 带电荷、极性的氨基酸比例高 7. 倾向成为活性位点
23
Coils(无规卷曲)
蛋白质结构的数据库
1.PDB (Protein Data Bank): 蛋白质结构数据库 • http://www.rcsb.org/pdb/home/home.do
2. MMDB (Molecular Modeling Database): 分子模拟数据库 • http://www.ncbi.nlm.nih.gov/sites/entrez?db=structure
46
分子图形学
pymol
Discovery Studio
47
分子图形学
RasWin
Cn3D
谢谢!
49
3. MSD (Molecular Structure Database): 大分子的相互作用和结合位点 • http://www.ebi.ac.uk/msd
45
蛋白质结构的分类
1. SCOP (Structural Classification of Proteins):folds, superfamilies, and families
蛋白质功能与结构的主要类别——催化
(HIV protease PDB:1a8k)
蛋白质功能与结构的主要类别——分子开关
(Ras off and on PDB: 1pll and 121p)
Leabharlann Baidu
2. 蛋白质结构数据库、结构分类以及分子图形 学
1. 蛋白质结构的数据库:PDB, MMDB, MSD 2. 蛋白质结构的分类:SCOP, CATH, DALI/FSSP 3. 分子图形学:pymol,discovery studio,Cn3D, Rasmol/Raswin
• 蛋白质分子中各亚基的空间排布及亚基接触部位的布局和相互 作用,称为蛋白质的四级结构。
• 有些蛋白质分子含有二条或多条多肽链,每一条多肽链都有完 整的三级结构,称为蛋白质的亚基 (subunit)
结构生物信息学
内容提要
1. 蛋白质的结构与功能 2. 蛋白质结构的数据库、结构分类以及分子图形学 3. 蛋白质结构预测 ① 二级结构预测 ② 三级结构预测 4. 结构生物学 ① 核磁共振波谱学 ② X-射线晶体学 ③ 低温电镜技术
1. 蛋白质的结构与功能
蛋白质的结构 – 主要由一级序列所决定 蛋白质的功能 – 主要由三级结构所决定
25
一些常见的结构性motifs
1. helix-turn-helix: e.g., DNA binding 2. helix-loop-helix: e.g., Calcium binding
3. : 2 adjacent antiparallel strands connected by short loop 4. Greek key: 4 adjacent antiparallel strands 5. : 2 parallel strands connected by helix
2. 不带电的极性氨基酸7种:Gly,Ser,Thr,Tyr, Cys,Asn,Gln。
3. 带正电荷的极性氨基酸3种(碱性氨基酸):Lys, Arg,His。
4. 带负电荷的极性氨基酸2种(酸性氨基酸):Asp, Glu。
氨基酸特性
两亲性:Arg、Lys、Gln和Glu,侧链中都包含有疏 水和亲水部分,部分侧链可以包埋在蛋白质结构内 部,另外部分则暴露在水环境中,是形成界面的理 想分子。
α-helix
1. 蛋白质中最多的二级结构 2. 平均长度:10个氨基酸残基 (10 Å)
• 长度范围:5-40aa • 每一圈:3.6个aa • 通过氢键 (~per 4aa) 稳定结构 • 通常在内核的表面,疏水残基向内,亲水残基向外
α-helix:氢键稳定结构
17
α-helix:氨基酸偏好
•DALI server
http://ekhidna.biocenter.helsinki.fi/dali_server/index.html
•DALI Database (fold classification)
http://ekhidna.biocenter.helsinki.fi/dali/start
• 亚基之间的结合主要是氢键和离子键。
38
蛋白质功能与结构的主要类别——结合
Myoglobin (PDB: 1a6k)
39
蛋白质功能与结构的主要类别——结合
TATA binding protein (PDB: 1tgh)
40
蛋白质功能与结构的主要类别——催 化
(DNA polymerase PDB:3pw0)
•http://scop.mrc-lmb.cam.ac.uk/scop/
2. CATH (Classification by Class, Architecture, Topology & Homology)
•http://www.cathdb.info/
3. DALI/FSSP: 蛋白质三级结构的比较
Sec在许多生物中普遍存在,由UGA编码;Pyl很 罕见,只存在于古生菌中,由UAG编码。
一级结构
• The primary structure refers to amino acid linear sequence of the polypeptide chain.
• 蛋白质的一级结构指在蛋白质分子从N-端至C-端的氨基酸排列顺序。 • Atomic compositions:C, H, N, O, P, S • 一个氨基酸的α羧基和另一个氨基酸的α氨基连接起来成为酰氨键,通常
(Hydrophobic bond) 4. 范德华力(van der waals
force) 5. 二硫键 (Disulfide bond)
二级结构
•Secondary structure refers to highly regular local substructures. •蛋白质分子中某一段肽链的局部空间结构,即该段肽链主链骨架 原子的相对空间位置,并不涉及氨基酸残基侧链的构象 。 •二级结构的形成几乎全是由于肽链骨架中的羰基上的氧原子和亚 胺基 上氢之间的氢键所维持,其他作用力如范德华力等也有一定贡 献。所以肽段间的氢键(Hydrogen bond)越多,他们形成的二级结 构就越稳定 •周期性的结构模式: α-helix, β-sheet,loops, coils
可溶性球状蛋白质包装的主要原则:疏水侧链包在 里面形成紧密核心,亲水侧链暴露在表面。
氨基酸特性
Amino acid properties:www.russelllab.org/aas/
氨基酸特性
另外有两种氨基酸:硒代半胱氨酸(Sec,U)和吡咯 赖氨酸(Pyl,O)可以在蛋白质合成时插入到多肽链 中,受遗传密码的修饰性阅读所指导。
33
-Domain structures: 4-helix bundles
34
Up-and-down sheets and barrel
35
Greek key motifs
36
domains
TIM barrel fold
rossman
37
三级和四级结构
三级结构
• 整条肽链中全部氨基酸残基的相对空间位置。即肽链中所有原 子在三维空间的排布位置。
脂肪族侧链:Ala、Ile、Leu、Met、Pro和Val。侧 链的惰性很强,不易发生反应,极少直接参与蛋白 质的功能,特别适于组装蛋白质的内部结构。
芳香族侧链:Phe、Trp、Tyr和His,参与‘堆积’ 相互作用。
氨基酸特性
小氨基酸:Ala、Cys、Gly、Pro、Ser和Thr。
His:pKa3 = 6.5,在生理pH值下大约只有10%的 侧链带正电荷,而精确的pKa值取决于具体的微环 境。
26
H-T-H
H-L-H
27
ββ
28
Greek key
29
ββ
30
Domains:motifs 的组合
31
一个或多个domains
32
六种蛋白质的结构类型
(1) Domains: 螺旋束通过loops连接 (2) Domains: 主要是反平行片,两对片形成sandwich 结构 (3) Domains: 螺旋连接的平行的片 (4) Domains:螺旋和片各自形成单独的结构 (5) Multidomain ( ) :包含多种domains (6) Membrane & cell-surface proteins
因此,预测蛋白质的结构和功能非常的困难
蛋白质结构的四个基本层面
Protein Structure 蛋白质结构进阶
5
氨基酸特性
考虑氨基酸理化性质时注意的主要因素:侧链基团的大小, 和疏水性。常根据氨基酸侧链的疏水性进行分类。
1. 非极性氨基酸8种:Ala,Val,Leu,Ile,Pro,Phe, Trp,Met。
Ala, Glu, Leu, Met:出现频率高 Pro, Gly Tyr, Ser:出现频率低
18
β-Strands & β-Sheets
1. 一般不单独出现,成对或多个出现 2. 链通过氢键连接,稳定结构 3. 相互作用的部分通过短的/长的loop连接 4. 平行或反平行的-sheet
19
反平行的β-Strands
无序性 (Intrinsically disordered ): 介导蛋 白质-蛋白质之间的相互作用,用来阐述没有确定 规律性的那部分肽链结构。
24
模体(motif):具有特殊 功能的超二级结构
在许多蛋白质分子中,可发现二个或三个具有二级结构的肽段, 在空间上相互接近,形成一个有规则的二级结构组合,被称为超二 级结构。
称为肽键 • 主要化学键:肽键。键长为0.132nm。这个键长介于单键C-N(0.149nm)
和双键C=N(0.127nm)之间,具有部分双键的性质。
一级结构是蛋白质空间构象和特异生物学功能 的基础,但不是决定蛋白质空间构象的唯一因素。
13
Non-Bonded Interactions
1. 盐键 (Ionic bond) 2. 氢键 (Hydrogen bond) 3. 残基的亲、疏水性
球蛋白 (Globular proteins): 疏水的内核 & 亲水的表面 膜蛋白 (Membrane proteins): 特定的疏水表面
亚稳态 (marginally stable): 折叠之后的蛋白质 无序性 (Intrinsically disordered): 许多蛋白质必须与其他蛋白 质结合后才能够获得稳定的结构
20
平行的β-Strands
21
混合的β-Strands
22
Loops
1. 连接-helix和-sheet 2. 长度和三级结构不定 3. 在蛋白质结构的表面 4. 受点突变的影响小 5. 柔性好,构象变化余地大 6. 带电荷、极性的氨基酸比例高 7. 倾向成为活性位点
23
Coils(无规卷曲)
蛋白质结构的数据库
1.PDB (Protein Data Bank): 蛋白质结构数据库 • http://www.rcsb.org/pdb/home/home.do
2. MMDB (Molecular Modeling Database): 分子模拟数据库 • http://www.ncbi.nlm.nih.gov/sites/entrez?db=structure
46
分子图形学
pymol
Discovery Studio
47
分子图形学
RasWin
Cn3D
谢谢!
49
3. MSD (Molecular Structure Database): 大分子的相互作用和结合位点 • http://www.ebi.ac.uk/msd
45
蛋白质结构的分类
1. SCOP (Structural Classification of Proteins):folds, superfamilies, and families
蛋白质功能与结构的主要类别——催化
(HIV protease PDB:1a8k)
蛋白质功能与结构的主要类别——分子开关
(Ras off and on PDB: 1pll and 121p)
Leabharlann Baidu
2. 蛋白质结构数据库、结构分类以及分子图形 学
1. 蛋白质结构的数据库:PDB, MMDB, MSD 2. 蛋白质结构的分类:SCOP, CATH, DALI/FSSP 3. 分子图形学:pymol,discovery studio,Cn3D, Rasmol/Raswin