蛋白质蛋白质相互作用ppt课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
个物种的蛋白质进行交互 Blast,即利用一个物种的一 个蛋白质对第二个物种的所有 蛋白质进行Blast,再将在第 二个物种中得到的E值最小的 蛋白质序列对第一个物种的所 有蛋白质进行Blast,如在第 一个物种中E值最小的蛋白质 是原来用来对第二个物种进行 Blast的蛋白质,则这两个蛋 白质互为直系同源蛋白质。
在应用中,通常利用三个物种 进行交互Blast以便更好地确 定直系同源蛋白质。
Org A, Protein1 Blast Org B, All proteins P2 with smallest E value
IleS-MG345- MJ0947
Org B, Protein2 Blast Org A, All proteins P1 with smallest E value
基因位点的上下文 基因临近
聚集
分散
基因融合 (Rosetta-Stone method )
电子双杂交
系统发育上下文
系统发生谱方法 系统树相近 (Mirror tree)
基因表达: mRNA共表达
.
20
一些重要的概念
Ortholog: 直系同源,是指不同物种中来自同一个 祖先的基因和蛋白质。
.
35
Mirror Trees Method
该方法的假设前提是:相互作用的蛋白可能是共进化的。方法是:计算包含
不同物种的蛋白质家族间的进化距离,构建各自相应的进化树,在进化树之间相
似性距离的基础上,构建镜像树,然后由镜像树之间的相似性距离和蛋白质在镜
像树上的位置确定蛋白质之间的两两相互作用。
.
36
.
31
基因组临近/ 基因临近 (1)
假如两个基因在多个基因组中都处于相邻位置, 则这两个基因编码的蛋白可能存在相互作用。.
.
32
基因组临近/ 基因临近(2)
. Nature Biotech Vol 22(7) 912-917, 2303 04
基因融合方法
.
34
‘电子双杂交(In Silico Two Hybrid)’ 方法
酵母蛋白芯片的制作及激酶检测
.
13
蛋白芯片的应用
蛋白芯片通常分为两类:分析型蛋白 芯片和功能性蛋白芯片
分析型芯片通常会有高密度的亲和试 剂组成的点(例如用于检测混合溶液 中的蛋白的抗体或抗原) 功能型芯片则在芯片的固相基质上连 接有大量的纯化后的蛋白。
.
14
PPI of Drosophila (1)
一些相互作用的蛋白质应该保持同步进化,从而保持其相关的功能,即一对相
互作用的蛋白质中一个蛋白质的氨基酸发生改变,可能会促使与其相互作用的另一
个蛋白质中的相应氨基酸位点发生相适应的互补突变,从而保持相互作用的完整性。
否则,在进化的过程中,这些蛋白质会由于选择的压力而被清除。因此,利用这种
关系来预测蛋白质的相互作用。
.
37
系统发育谱方法中的两个重要因子
参考基因组的选择 同源的定义
在已发表的文章中,利用这种方法研究蛋白质 相互作用还没有人系统的研究过不同的基因组 组合以及E值的阈值对结果的准确性以及蛋白覆 盖率的影响。
.
38
方法
研究设计
1. 目标基因组和参考基因组 (163 个具有全基因组信息的 物种) 按照系统发育关系分成 9组(18 个物种, 35 个物种, 55 个物种, 65 个物种, 86 个物种, 106 个物种,128 个物 种, 145个物种及162个物种)
Protein X Protein Y
.
30
基于序列的预测
相互作用直系同源蛋白
假如A蛋白与B蛋白相互作用,在在其它物种中 A与B的直系同源蛋白可能会相互作用
相互作用的结构域对
结构域是相互作用的蛋白质中结构与功能的基本 位,每个蛋白中都是由各种结构域组成的。因此 通过相关结构域的相互作用信息,可以预测蛋白 质的相互作用。
.
Protein coat
7
Phage Display (2)
噬菌体展示通过在基 因3位点插入新的核 酸序列能够在噬菌体 的表面展示新的蛋白 或肽段。
.
8
Phage Display (3)
这些噬菌体群体能够展示十 亿种以上的蛋白或肽段,这 个群体被称为噬菌体展示文 库,每个展示的蛋白或肽段 都对应于一段基因序列。
– Pellegrini et al. 1999: 16 genomes – Date and Marcotte 2003: 57
– Limited number of genomes
• Zheng et al. 2002
– 更多的基因组能够获得更多的功能相关蛋白结果 – 对于系统发育方法预测蛋白功能的准确性可能有基因组数量上限。
系统发育谱(phylogenetic profiles )的概念
假定有四个基因组,每个上面都有几 个蛋白标记为P1,……P7。在该基因组上 是否存在其中的一个蛋白分别用1或0表示。 具有相同系统发育谱的蛋白被放在一个方 框内,系统发育谱差一位的用线连接。结 果是具有相同系统发生谱的P2和P7以及P3 和P6具有功能相关性。 利用这种方法分析 蛋白的功能相关性,不需要序列的相似性。
.
2
实验方法
免疫共沉淀(Co-immunoprecipitation) 酵母双杂交(Yeast two hybrid) 噬菌体展示(Phage display) 亲和层析和质谱(Affinity purification &
mass spectrometry) 蛋白芯片(Protein chip)
– 把一个配体通过化学交联的方法结合在固相载 体上,让蛋白混合液流过固相载体,能够与配 体结合的分子具有较高的亲和力,通过适当的 洗脱条件将亲和力弱的分子洗脱掉,这样与配 体亲和力较高的分子就被纯化了出来。
– 纯化出的分子随后用凝胶电泳的方法分离,用 质谱的方法鉴定是什么蛋白。
Eur. J. Biochem. 270, 570-578 (2003)
17
利用不同方法高通量筛选酵母 蛋白质-蛋白质相互作用结果的比较
Aloy
Ito
Uetz Ho
Gavin
Aloy 499
Ito
1
Utez 6
Ho
27
Gavin 23
0.2% 4475 199 106 113
1.2% 13.8% 1447 92 97
5.4% 2.4% 6.4% 72690 4197
4.6% 2.5% 6.7%够与目标蛋白相互作用的展 示蛋白或肽段将结合到这些 目标蛋白上。洗脱非特异结 合噬菌体,对结合的噬菌体 插入序列进行测序,则能知 道该相互作用的蛋白或序列 是由哪些核酸编码。进而可 以克隆该基因。
.
9
亲和纯化和质谱
鉴定能够相互作用形成复合体的蛋白
sll1362-MG345-MJ1362
.
22
.
23
.
24
Phylogenetic Pattern
.
25
.
26
.
27
.
28
.
29
基于结构的预测
已知有相互作用
Protein A Protein B
Protein A Protein B
结构同源
预测有相互作用
Protein X Protein Y
.
3
免疫共沉淀
将相互作用蛋白其中的 一个通过抗体连接在 固体颗粒上,与之相 互作用的蛋白就能通 过免疫共沉淀的方法 沉淀出来。
.
4
酵母双杂交
.
5
高通量的酵母双杂交
果蝇:
Science Vol.302, 1727-1736, 2003 Genome Research Vol.15, 376- 384, 2005
.
10
串联亲和层析纯化方法The tandem affinity purification method.
(A) 序列标签的结构. (B) 纯化方法. 通过两步的亲和纯化步骤获得蛋白复合体
.
11
蛋白质芯片
目前,多数的蛋白芯片是将捕获蛋白固定在芯片上,而待分析的蛋白 混合物与芯片进行杂交。
.
12
Nature Genetics 26: 283-289,2000
• 准确性(Accuracy)
– 描述测定值与真实值之间的差别。
• 特异性(Specificity)
– 描述报告信号来自预定目标的比例
• 灵敏度(Sensitivity)
– 描述能够获得可检测信号下目标的最低量。
.
42
Discussion
• The number of reference genomes:
.
47
电子预测蛋白质相互作用方法 的评估
.
18
蛋白质相互作用的实验方法
酵母双杂交 蛋白复合体纯化技术及质谱 蛋白芯片 杂交技术
缺点
对实验室条件要求很高, 实验周期长,
费用高,准确性低.
.
19
利用计算的方法预测蛋白-蛋白相互作用
基于结构的预测
基于序列的预测
相互作用的直系同源蛋白
相互作用的结构域对
基于基因组的预测
4679 个蛋白, 4780 个相互作用
Science Vol.302, 1727-1736, 2003
.
15
PPI of Drosophila (2)
1727 个蛋白, 2300 个相互作用
Ge. nome Research Vol.15, 376- 384, 20106 5
24 pairs
.
.
45
How to apply the refined method
• 首先,从/
genomes/Complete.html下载 Eubacteria的
“phylip tree” 文件
• 其次, 用TreeView 软件打开 “phylip tree”
线虫 :
Science Vol. 303(5657):540-3, 2004
酵母
Nature Vol. 425, 686-691,2003
.
6
Phage Display (1)
噬菌体是一种仅感染细菌 的病毒。它由两部分构成: 遗传物质和蛋白质外壳。 噬菌体中的基因3能够利 用细菌的翻译系统生产噬 菌体蛋白质外壳一端的组 分。
.
39
Results
The reference genomes sets
.
• 18 • 35 • 55 • 65 • 86 • 106 • 128 • 145 • 162
40
ቤተ መጻሕፍቲ ባይዱ
如何选择基因组子集?
.
41
一些概念
• 精确性(Precision)
– 用于描述实验重复性,通常用标准差或平均重复误差表示。
2. 同源性的定义 Blastp E value 设定:1×10-1(E01), 1×10-2 (E02), 1×10-3(E03), 1×10-4(E04), 1×10-5(E05), 1×106(E07) and 1×10-10(E10)
3. 63 种组合 例如: 18E01, 18E10,…..,162E01,162E10
文件
• 第三, 选择欲其他所有物种亲缘关系最远的
一个物种作为异常值( outlier)
• 最后,加入所有 Archaea 和 Eukarytoes 物
种的基因组。
这些选定的参考基因组用于其后的计算
.
46
系统发育谱的局限
仅能预测拥有全基因组序列的物种. 对于一些关键蛋白和共有蛋白中,由于在
多数物种中没有系统发育树差别,而无法 判断蛋白之间的相关性。
意义:直系同源在各种物种进化中保持相同的功 能。information from one member to the others.
Paralogs: 旁系同源,指的是一个物种内通过基因 重复而产生的基因或蛋白质,
意义:旁系同源在进化中可以形成新的功能
.
21
• COGs:直系同源簇,用两
生物信息学面临的挑战
已经有超过1000个物种的基因组已经完成测序—
—如何进行数据的分析与整合
在多数的物种中只有大约45%的基因通过同源序
列获得注释信息
那些非同源基因可能与物种特异的表型相关 它
们将成为最重要的研究项目之一
如何注释这些基因的功能?
.
1
蛋白质相互作用研究方法
实验方法 计算方法
.
43
Discussion
• 参考基因组的数量确实能够影响预测能力
– 数量较少的基因组:18 or 35 – 多一些的基因组 :86 – 更多的基因组 :162
.
44
Discussion
• Exploiting the phylogenetic relationship
of genomes
– 系统发育树 – 分支 – 异常值 – 参考基因组
在应用中,通常利用三个物种 进行交互Blast以便更好地确 定直系同源蛋白质。
Org A, Protein1 Blast Org B, All proteins P2 with smallest E value
IleS-MG345- MJ0947
Org B, Protein2 Blast Org A, All proteins P1 with smallest E value
基因位点的上下文 基因临近
聚集
分散
基因融合 (Rosetta-Stone method )
电子双杂交
系统发育上下文
系统发生谱方法 系统树相近 (Mirror tree)
基因表达: mRNA共表达
.
20
一些重要的概念
Ortholog: 直系同源,是指不同物种中来自同一个 祖先的基因和蛋白质。
.
35
Mirror Trees Method
该方法的假设前提是:相互作用的蛋白可能是共进化的。方法是:计算包含
不同物种的蛋白质家族间的进化距离,构建各自相应的进化树,在进化树之间相
似性距离的基础上,构建镜像树,然后由镜像树之间的相似性距离和蛋白质在镜
像树上的位置确定蛋白质之间的两两相互作用。
.
36
.
31
基因组临近/ 基因临近 (1)
假如两个基因在多个基因组中都处于相邻位置, 则这两个基因编码的蛋白可能存在相互作用。.
.
32
基因组临近/ 基因临近(2)
. Nature Biotech Vol 22(7) 912-917, 2303 04
基因融合方法
.
34
‘电子双杂交(In Silico Two Hybrid)’ 方法
酵母蛋白芯片的制作及激酶检测
.
13
蛋白芯片的应用
蛋白芯片通常分为两类:分析型蛋白 芯片和功能性蛋白芯片
分析型芯片通常会有高密度的亲和试 剂组成的点(例如用于检测混合溶液 中的蛋白的抗体或抗原) 功能型芯片则在芯片的固相基质上连 接有大量的纯化后的蛋白。
.
14
PPI of Drosophila (1)
一些相互作用的蛋白质应该保持同步进化,从而保持其相关的功能,即一对相
互作用的蛋白质中一个蛋白质的氨基酸发生改变,可能会促使与其相互作用的另一
个蛋白质中的相应氨基酸位点发生相适应的互补突变,从而保持相互作用的完整性。
否则,在进化的过程中,这些蛋白质会由于选择的压力而被清除。因此,利用这种
关系来预测蛋白质的相互作用。
.
37
系统发育谱方法中的两个重要因子
参考基因组的选择 同源的定义
在已发表的文章中,利用这种方法研究蛋白质 相互作用还没有人系统的研究过不同的基因组 组合以及E值的阈值对结果的准确性以及蛋白覆 盖率的影响。
.
38
方法
研究设计
1. 目标基因组和参考基因组 (163 个具有全基因组信息的 物种) 按照系统发育关系分成 9组(18 个物种, 35 个物种, 55 个物种, 65 个物种, 86 个物种, 106 个物种,128 个物 种, 145个物种及162个物种)
Protein X Protein Y
.
30
基于序列的预测
相互作用直系同源蛋白
假如A蛋白与B蛋白相互作用,在在其它物种中 A与B的直系同源蛋白可能会相互作用
相互作用的结构域对
结构域是相互作用的蛋白质中结构与功能的基本 位,每个蛋白中都是由各种结构域组成的。因此 通过相关结构域的相互作用信息,可以预测蛋白 质的相互作用。
.
Protein coat
7
Phage Display (2)
噬菌体展示通过在基 因3位点插入新的核 酸序列能够在噬菌体 的表面展示新的蛋白 或肽段。
.
8
Phage Display (3)
这些噬菌体群体能够展示十 亿种以上的蛋白或肽段,这 个群体被称为噬菌体展示文 库,每个展示的蛋白或肽段 都对应于一段基因序列。
– Pellegrini et al. 1999: 16 genomes – Date and Marcotte 2003: 57
– Limited number of genomes
• Zheng et al. 2002
– 更多的基因组能够获得更多的功能相关蛋白结果 – 对于系统发育方法预测蛋白功能的准确性可能有基因组数量上限。
系统发育谱(phylogenetic profiles )的概念
假定有四个基因组,每个上面都有几 个蛋白标记为P1,……P7。在该基因组上 是否存在其中的一个蛋白分别用1或0表示。 具有相同系统发育谱的蛋白被放在一个方 框内,系统发育谱差一位的用线连接。结 果是具有相同系统发生谱的P2和P7以及P3 和P6具有功能相关性。 利用这种方法分析 蛋白的功能相关性,不需要序列的相似性。
.
2
实验方法
免疫共沉淀(Co-immunoprecipitation) 酵母双杂交(Yeast two hybrid) 噬菌体展示(Phage display) 亲和层析和质谱(Affinity purification &
mass spectrometry) 蛋白芯片(Protein chip)
– 把一个配体通过化学交联的方法结合在固相载 体上,让蛋白混合液流过固相载体,能够与配 体结合的分子具有较高的亲和力,通过适当的 洗脱条件将亲和力弱的分子洗脱掉,这样与配 体亲和力较高的分子就被纯化了出来。
– 纯化出的分子随后用凝胶电泳的方法分离,用 质谱的方法鉴定是什么蛋白。
Eur. J. Biochem. 270, 570-578 (2003)
17
利用不同方法高通量筛选酵母 蛋白质-蛋白质相互作用结果的比较
Aloy
Ito
Uetz Ho
Gavin
Aloy 499
Ito
1
Utez 6
Ho
27
Gavin 23
0.2% 4475 199 106 113
1.2% 13.8% 1447 92 97
5.4% 2.4% 6.4% 72690 4197
4.6% 2.5% 6.7%够与目标蛋白相互作用的展 示蛋白或肽段将结合到这些 目标蛋白上。洗脱非特异结 合噬菌体,对结合的噬菌体 插入序列进行测序,则能知 道该相互作用的蛋白或序列 是由哪些核酸编码。进而可 以克隆该基因。
.
9
亲和纯化和质谱
鉴定能够相互作用形成复合体的蛋白
sll1362-MG345-MJ1362
.
22
.
23
.
24
Phylogenetic Pattern
.
25
.
26
.
27
.
28
.
29
基于结构的预测
已知有相互作用
Protein A Protein B
Protein A Protein B
结构同源
预测有相互作用
Protein X Protein Y
.
3
免疫共沉淀
将相互作用蛋白其中的 一个通过抗体连接在 固体颗粒上,与之相 互作用的蛋白就能通 过免疫共沉淀的方法 沉淀出来。
.
4
酵母双杂交
.
5
高通量的酵母双杂交
果蝇:
Science Vol.302, 1727-1736, 2003 Genome Research Vol.15, 376- 384, 2005
.
10
串联亲和层析纯化方法The tandem affinity purification method.
(A) 序列标签的结构. (B) 纯化方法. 通过两步的亲和纯化步骤获得蛋白复合体
.
11
蛋白质芯片
目前,多数的蛋白芯片是将捕获蛋白固定在芯片上,而待分析的蛋白 混合物与芯片进行杂交。
.
12
Nature Genetics 26: 283-289,2000
• 准确性(Accuracy)
– 描述测定值与真实值之间的差别。
• 特异性(Specificity)
– 描述报告信号来自预定目标的比例
• 灵敏度(Sensitivity)
– 描述能够获得可检测信号下目标的最低量。
.
42
Discussion
• The number of reference genomes:
.
47
电子预测蛋白质相互作用方法 的评估
.
18
蛋白质相互作用的实验方法
酵母双杂交 蛋白复合体纯化技术及质谱 蛋白芯片 杂交技术
缺点
对实验室条件要求很高, 实验周期长,
费用高,准确性低.
.
19
利用计算的方法预测蛋白-蛋白相互作用
基于结构的预测
基于序列的预测
相互作用的直系同源蛋白
相互作用的结构域对
基于基因组的预测
4679 个蛋白, 4780 个相互作用
Science Vol.302, 1727-1736, 2003
.
15
PPI of Drosophila (2)
1727 个蛋白, 2300 个相互作用
Ge. nome Research Vol.15, 376- 384, 20106 5
24 pairs
.
.
45
How to apply the refined method
• 首先,从/
genomes/Complete.html下载 Eubacteria的
“phylip tree” 文件
• 其次, 用TreeView 软件打开 “phylip tree”
线虫 :
Science Vol. 303(5657):540-3, 2004
酵母
Nature Vol. 425, 686-691,2003
.
6
Phage Display (1)
噬菌体是一种仅感染细菌 的病毒。它由两部分构成: 遗传物质和蛋白质外壳。 噬菌体中的基因3能够利 用细菌的翻译系统生产噬 菌体蛋白质外壳一端的组 分。
.
39
Results
The reference genomes sets
.
• 18 • 35 • 55 • 65 • 86 • 106 • 128 • 145 • 162
40
ቤተ መጻሕፍቲ ባይዱ
如何选择基因组子集?
.
41
一些概念
• 精确性(Precision)
– 用于描述实验重复性,通常用标准差或平均重复误差表示。
2. 同源性的定义 Blastp E value 设定:1×10-1(E01), 1×10-2 (E02), 1×10-3(E03), 1×10-4(E04), 1×10-5(E05), 1×106(E07) and 1×10-10(E10)
3. 63 种组合 例如: 18E01, 18E10,…..,162E01,162E10
文件
• 第三, 选择欲其他所有物种亲缘关系最远的
一个物种作为异常值( outlier)
• 最后,加入所有 Archaea 和 Eukarytoes 物
种的基因组。
这些选定的参考基因组用于其后的计算
.
46
系统发育谱的局限
仅能预测拥有全基因组序列的物种. 对于一些关键蛋白和共有蛋白中,由于在
多数物种中没有系统发育树差别,而无法 判断蛋白之间的相关性。
意义:直系同源在各种物种进化中保持相同的功 能。information from one member to the others.
Paralogs: 旁系同源,指的是一个物种内通过基因 重复而产生的基因或蛋白质,
意义:旁系同源在进化中可以形成新的功能
.
21
• COGs:直系同源簇,用两
生物信息学面临的挑战
已经有超过1000个物种的基因组已经完成测序—
—如何进行数据的分析与整合
在多数的物种中只有大约45%的基因通过同源序
列获得注释信息
那些非同源基因可能与物种特异的表型相关 它
们将成为最重要的研究项目之一
如何注释这些基因的功能?
.
1
蛋白质相互作用研究方法
实验方法 计算方法
.
43
Discussion
• 参考基因组的数量确实能够影响预测能力
– 数量较少的基因组:18 or 35 – 多一些的基因组 :86 – 更多的基因组 :162
.
44
Discussion
• Exploiting the phylogenetic relationship
of genomes
– 系统发育树 – 分支 – 异常值 – 参考基因组