6 蛋白质组学

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

蛋白质组的多样性、复杂性、动态性 VS 基因组的稳定性
蛋白质的相互作用
不与其他蛋白质发生作用的“孤立蛋白质”根本就不存在。
• 不仅仅是“连锁反应或级联反应”,而是一个复 杂交错和精密调控的反应网络。
• 蛋白质相互作用的总数。
重要性: • 通过相互作用,参与众多重要生命活动(如生物催化、 转运、信号传导、免疫、细胞调控等)。 • 绝大多数疾病都是由若干种特定蛋白质之间异常 的相互作用所致。
这些差异所致结果: (2)一个基因组对应着多个蛋白质组.
从卵到虫、变蛹和化蝶, 其表现型的变化由不同的 蛋白组主导,基因型未变。
“A butterfly and a caterpillar have the same genome but different proteomes.”
--- Ron Orlando
ü 全部的定量数据进行对比,蛋白质组学和转录组学的数据在酵母上的相关性很 低,暗示了蛋白质分子水平上的表达水平差别不能从转录组数据上进行合理的 推测。 ü 如果把低信号值的转录组数据去除后,两者之间的数据相关性有较大改善,相 关系数可以达到0.46。 ü 在研究和酵母新现象有关的蛋白质分子时,可以看到这些分子在转录组数据里 也可以找到,但是蛋白质水平的差异和转录组数据间存在差异。 总之,蛋白质作为功能的直接体现者,更理想的研究方法仍然是对蛋白质的定量 数据进行直接分析。
RNA 复制 复制
DNA
转录 逆转录
RNA
翻译
蛋白质
Genome ---编剧 一台大戏:生物体的 RNome ---导演 存在和全部生命活动 Proteome-- -演员
2. Proteome 与 Genome差别 基因组:相对稳定,包括数目和结构。 蛋白质组:多样、复杂,使生命呈丰富多彩的表型。 • 蛋白质组被称为生命的“万花筒”。 **生命体的统一性源于基因组。 **生命体的复杂性基于蛋白质组。
Comprehensive mass-spectrometry-based proteome quantification of haploid versus diploid yeast. (2008 Nature 455, 1251-4)
3. 传统的对单个蛋白质的研究方式已无法满足后基 因组时代的要求
(2)蛋白质的结构和形状影响着自身功能、 所在细胞甚至生物体的命运。
例如:蛋白形状改变致病
• 正常 Prion(PrPc)扭曲变形为异常“版本”PrPsc • 后者可使大脑结构呈海绵状,此与疯牛病、瘙痒病和人 的克-雅氏症发病有关 • 它们在一级结构上完全相同,但二级结构: PrPc主要结构是α-helix PrPsc结构却以β-sheet为主
**蛋白质组学(Proteomics)
Proteomics:不仅是生命科学研究进入后基因组时代的里 程碑,也是该时代生命科学研究的核心内容之一。
3.蛋白质组及蛋白质组学的内涵
澳大利亚科学家Marc Wilkins于1994年 提出蛋白质组(Proteome)这个动态概念。 • Protein + genome ==proteome 意即:基因组表达的全部蛋白质。 • 一个genome/cell/tissue/organism表达的全部蛋 白质构成的整体,不是一个或数个蛋白质。
2. 蛋白质及其研究的重要性
(1) 蛋白质是一切生命活动的执行者 只有蛋白质才是生物最终表型的决定因素 protein preteios(第一,希腊语) 即蛋白质是生物的“第一物质” 没蛋白质就没生命。 所以,单从基因组序列、甚至mRNA的角度, 就不能完整、系统地阐明生物体的功能及本质。
• 从眨眼到呼吸:所有的肌肉运动都由肌蛋白来执 行。 • α-角蛋白:组成人头发和指甲,也是羽毛、羊 毛、爪、鳞、角、蹄的主要成分。 • 血红蛋白:将携带的氧气输送到全身每个部位。 • 大型蛋白簇组成的分子机器:承担着繁重的细胞 工作,如细胞分裂时的基因复制和制造新蛋 白……
Prion oPrPsc
致死性错误折叠
(3)各种疾病都有蛋白质谱的动态变化
• 只有小部分疾病源自基因突变,而各种疾病都有蛋白质谱的动态变 化。 • 每种疾病在不同的发病阶段,都是先有蛋白质的变化,再有临床症 状和体征。 ***这些变化的蛋白质,可望成为疾病早期诊断标志物或治疗靶点。
• (1)药物靶点 • 每种疾病平均与10个左右的基因相关 • 每种基因又与3-10种蛋白质相关 • 人类主要的疾病约100-150种 • 所以,应该有3000-15000种蛋白质是潜在的药物靶标。 • 国际制药界视蛋白质组学为发现药靶的主要技术平台。 • (2)同时,蛋白质本身也可作治疗药物使用。
:
A Resource for Annotating the Proteome. Cell, 2005(122): 957~968.
曾以为:生命的复杂程度与基因数目成正比。
病毒 细菌 E.Coli 真菌 酵母 植物 昆虫 软体动物 鲨鱼 软骨鱼 果蝇
真核生物 Eucaryotes
豆科植物
原核生物 Procaryotes
从受精卵发展到各期胚胎1012个细胞、上 千种细胞类型,再成年,再逐渐衰老。
基因组未变;随外 形、器官形成和功 能活动而变的只是 蛋白质组。
三、蛋白质组学的重要性
1. 基因组研究的局限性
(1)多数基因的功能未知; (2)大规模基因表达(mRNA)研究: 无法精确反映蛋白质的质、量及表达部位; (3)经典的基因功能分析方法(knockout or knockdown/ knockin)提供的信息有限。 如:一些蛋白质的缺失是致死性的,表明该蛋白质 是必需的,但它并不能告诉该蛋白质是干什么的。
(4)基因组和转录组不能准确地代表蛋白质组
Ø 一个基因组对应着多个蛋白质组(动态的蛋白质组)。 Ø mRNA表达与相应的蛋白表达存在时间上的差异。 Ø mRNA表达的部位与相应蛋白执行功能的部位有所不同。 Ø 不同mRNA的稳定性和翻译效率不同,有的甚至不翻译。 Ø 不同蛋白质的稳定性不同(结构蛋白、信号分子)。 Ø premRNA通过可变剪接生成不同的成熟mRNA。 Ø 不同蛋白质的修饰方式和程度不同,而修饰(如磷酸化和糖 基化)明显影响蛋白质的活性及功能。
(1)一种生命现象的发生涉及多个蛋白质。 (2)在执行生理功能时,这些蛋白质之间交织成网络,并 且呈动态变化。 而传统的对一种或几种蛋白质的研究难以形成一种整体 观,难以系统透彻地阐释生命活动。 所以,只能在整体、动态、网络的水平上对蛋白质进行 研究。
多骨鱼 蟾蜍 两栖动物 爬虫类 鸟类 人类
基因数
103 104 105 106 107 108
哺乳动物
109
1010
1011
1012
黄瓜:26682;白菜:4.2万;水稻:45022-55615 ;人:3万
人类与简单生物(果蝇等)间巨大差别
来自蛋白质相互作用的数量
• 人体内蛋白质相互作用的数量大约为65万 *是果蝇的10倍(两者的基因数差不到2倍), *是单细胞酵母的20倍。 • “仅仅了解人类基因组肯定不足以解释人类与其 它物种的差别……蛋白质相互作用应该是一把开 启生物体之间差别程度原因之锁的钥匙”。
ቤተ መጻሕፍቲ ባይዱ
整体性
* 同一基因组,在不同细胞/组织中表达的蛋 白质谱不同(如:脑、肝、心和肾之间)。 * 同一细胞/组织,在不同时间/不同环境条件 下表达的蛋白谱也不同(如:胎儿与成人)。 即蛋白质组是空间和时间上动态变化着的整体。 整 体 性 + 动 态 性
蛋白质组学(Proteomics)
利用高分辨的蛋白分离技术和高效的蛋白鉴定技术, 全景全息式地研究在各种特定情况下的蛋白质谱及其变化 规律,包括细胞内动态变化的蛋白质谱的组成成份、表达 水平、修饰状态和蛋白质之间的相互作用等,以揭示蛋白 质功能及其与生命活动的关系,即在蛋白质水平上整体性、 动态和定量地研究生物体。
2.后基因组时代的新兴学科(系列组学)
表观基因组学(epigenomics) 代谢组学(Metabolomics) 药物基因组学(Pharmacogenomics) 比较基因组学(Comparative genomics) 环境基因组学(Enviromental Genomics) 生物信息学(Bioinformatics)
Functional organization of the yeast proteome by systematic analysis of protein complexes
Anne-Claude Gavin, et al. Nature, 2002, Vol. 415, p141-147 真核生物蛋白质组是 一个多蛋白复合体网络. 图中不同的彩色代表 不同的多蛋白复合体,它 们参与细胞周期、信号 传导、转录、染色体结 构、蛋白质和RNA运输、 RNA代谢、蛋白质合成、 能量代谢、膜生物合成 等过程。
第六章 蛋白质组学
第一节 蛋白质组(学)研究的必要性 第二节 研究策略、研究技术 第三节 基于质谱的蛋白质修饰研究 第四节 从组学到功能研究
第一节 蛋白质组(学)研究的必要性
一、蛋白质组学及相关内容 二、蛋白质组与基因组的联系和差别 三、蛋白质组学的重要性
一、蛋白质组(学)及相关概念
1. 基因组(学)(Genome, Genomics) Genome:来自 GENe和chromosOME 用于描述生物的全部基因和染色体组成。
蛋白质组学数据(SILAC)和TAP、GFP数据之间的关
Comprehensive mass-spectrometry-based proteome quantification of haploid versus diploid yeast. (2008 Nature 455, 1251-4)
图五 定量蛋质组学数据和转录组数据之间的比较和相关性分析
Estimating the size of the human interactome. PNAS, 2008, 105: 6959-6964
蛋白质组与基因组的这些差异所致结果: (1)1个基因对应N个蛋白,蛋白数远超基因数。
• 人类基因数目 由32亿对碱基,编码基因目前认为是大概 3×104 法国国家基因测序中心的休格尔·克罗利尔: 27700~34300 • Cell proteome: 5×103 proteins • Proteome from an individual: 1×105 proteins • Proteome of an individual(all life): 1×106 proteins • Proteome of a species: 1×107 proteins
Ø 蛋白质之间的相互作用更难在基因水平得以认识。
酵母作为最多被应用的模式生物,在蛋白质组学之前,基因组学已经用TAP和GFP 方法对酵母的基因表达水平进行的大规模分析,在此文中,作者的大规模SILAC数 据和原有的TAP和GFP数据大约有89%的重复性。其中,蛋白质学的方法独立地鉴 定到了510个蛋白质分子,有数百个蛋白质分子在酵母的表达谱数据中显示只有低于 50个copy,仅有6%的开放阅读框(ORF)没有被蛋白质组学方法鉴定而被基因组 方法找到。这些都显示了蛋白质组学方法在数据深度上的优势。
蛋白质组(PROTEOME:PROTEinsexpressed by a
genOME)——基因组表达的全部蛋白质。
蛋白质组学(PROTEOMICS:The study of the proteome
)——研究全部蛋白质的存在及存在形式的一门学科。
二、蛋白质组与基因组的关系
1. Proteome 与 Genome的联系 中心法则
千丝万缕
The protein complex network and grouping of connected complexes.
A Human Protein-Protein Interaction Network (2005,Nature)
A Human Protein-Protein Interaction Network—牵一发动全身!
相关文档
最新文档