蛋白质组学研究前沿及主要技术方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
蛋白质组学研究前沿及主要技术方法基因有限公司专家组 (基因有限公司上海区 200233)
基因组中的几乎所有基因最终是通过蛋白质的表达、修饰和相互作用来实现其功能的,因此对蛋白质的分析历来是生命科学研究中很重要的内容。随着多种生物的基因组计划的实施和完成,蛋白质研究技术的发展和突破以及生物信息学的发展,人们开展了大规模的蛋白质分析,蛋白质组学随之产生。一般认为,蛋白质组学的一个很重要的内容应该是筛选出参与一个生命过程(生理过程或病理过程)的全部蛋白质种类及其后修饰和相互作用。为此,需要借助一些高通量,快速,准确,自动化程度高的技术和手段。当然,任何新技术和手段都在发展完善中,也存在一定的局限,因此需要对实验结果要进行严格的分析,并借助多种技术手段对同一研究内容进行验证和比较,去伪存真,得出符合客观的结论。我们在强调这方面重要性的同时,应该也注意到,常规的传统的技术手段如免疫组织化学在蛋白质组学研究中同样魅力不减当年。
直到现在,很多蛋白质组学研究的起始可能就存在问题,因此导致实验结果无法很好地解释,研究结论偏差甚至错误,而实验的重复性也很差。这个问题的根源或许就是在于我们可能忽视了一些最基本的方面如研究材料的获得。利用培养的细胞进行的工作可能还不至于如此。我们主要指利用动物进行的研究。一些基本的问题是不能忽视的,如利用遗传背景、性别、年龄、饲养条件和环境等尽量一致的动物,动物麻醉的时间和条件尽量一致,组织器官的解剖尽量在时间和条件上一致等,解剖获得的组织器官应该尽快速冻以便尽量保持在体状态等。还有一个问题就是,很多研究直接匀浆组织甚至器官来制备蛋白质样品,而事实上这样来源的蛋白质样品的研究结论是很复杂并不能完全解释的。我们知道,任何一种组织都含有不同类型细胞,如动脉粥样硬化组织,含五种类型细胞:巨噬细胞和平滑肌细胞等,这些细胞的蛋白质的表达、修饰和相互作用不尽相同,利用匀浆技术获得的蛋白质样品的研究结果无法精确解释每种细胞的具体情况,即无法建立细胞类型特异性的蛋白质表达、修饰和相互作用的数据库,解决该问题的策略之一是利用激光显微切割技术(laser m icr odissecti on,LMD)。LMD技术可以从组织切片中将不同类型的细胞精确分离。从不同类型细胞中分别制备蛋白质样品才能有助于建立细胞类型特异性的蛋白质数据信息。目前国际上很多重要的研究,其材料的获取都利用了LMD技术。
不同类型的细胞都表达成千上万种蛋白质,而一次实验同时分析这么多种蛋白质是很困难的。现有的技术如二维电泳在一次电泳中也只能把两到三千种蛋白质进行比较有效的分离,因此蛋白质成份越复杂,种类越多越无助于问题的解决。因此在实验中,减少蛋白质种类和复杂程度,可以使结果更加客观真实。我们可以在蛋白质样品的制备上考虑解决这个问题,如分别制备胞质蛋白,膜蛋白,核蛋白,骨架蛋白,线粒体蛋白,内质网蛋白等,也可以根据蛋白质的溶解性质制备,如将最可溶性蛋白质,中等程度可溶性蛋白质,高度不可溶蛋白质,最不可溶性蛋白质分别制备,或者可以分别制备磷酸化蛋白质或糖基化蛋白质(Q iagen 和Genom ic Solution公司有相应试剂盒)。而Genom ic Soluti on公司也有除去白蛋白的试剂盒以便减少杂蛋白质对二维电泳等操作的影响。CST等公司也提供多种特异性抗体,分别识别不同种蛋白质的磷酸化形式,结合L I COR公司的近红外荧光染料标记第二抗体的技术,我们就可以在同一张W estern膜上在一次实验中同时检测一种蛋白质的表达水平和磷酸化水平。需要补充的是,目前也有直接显示凝胶中磷酸化蛋白或糖基化蛋白的凝胶染色技术。
蛋白质表达和mRNA表达具有一定的相关性,因此mRNA表达和蛋白质表达可以在一定程度上进行互相对比和预测,例如可以利用Affy metrix基因芯片技术建立mRNA表达数据库或查询相关mRNA表达数据库来预测蛋白质的表达信息,或者将mRNA表达数据和蛋白表达数据进行比较分析。当然,很多蛋白质发挥其功能并不完全依赖其表达水平高低,而主要依赖于修饰如磷酸化修饰,或依赖特定的结构如受体和通道蛋白质,或依赖酶原激活如cas pase家族蛋白质。
通过二维电泳等技术可以筛选出参与一个病理或生理过程的蛋白质的信息,但这些蛋白质之间是有机联系的,形成一个网络。这些蛋白质之间的相互作用可以通过诸如酵母双杂交之类的技术来研究。根据生物信息学分析和对以往关于这些基因的一定程度的研究,我们可以从这些蛋白质中预测在网络中处于重要位置的蛋白质,对这些蛋白质功能的进一步研究是非常必要的。有效技术包括动物水平的基因敲除技术和细胞培养水平上的RNA干扰技术。基因敲除技术的结果可能导致发育失败,由此证明该基因(蛋白)对发育至关重要。比如jnkl/jnk2的联合敲除可以导致小
鼠发育到十一天左右致死,研究发现是由于脑细胞正常凋亡受阻所致。基因敲除的结果可能也不导致明显的表现,动物可以正常发育生长,但这并不意味着该基因对动物没有作用。ERK1基因敲除小鼠发育生长正常,仔细研究才发现该基因敲除小鼠胸腺的CD4/CD8细胞比例与正常小鼠是不同的,由此推测该基因可能调控CD4与CD8细胞的比例。DRG11基因敲除的动物也可以正常发育,但经神经行为学研究发现该小鼠痛觉消失,究其根源,发现该基因敲除的小鼠的DGG 中小细胞消失所致,而小细胞是传导痛觉的神经元。
由于基因的蛋白产物之间存在相互作用并形成一个有机网络,因此任何一个基因的敲除或基因的mRNA 被干扰,必将引发和其相互作用的其他基因表达的异常,因此检测特定基因敲除或其mRNA被干扰后相关基因mRNA和蛋白质表达及修饰对我们分析特定基因的功能具有很重要的意义。
基因表达数据可以提供关于蛋白质相互作用的信息。Ge等人发现,那些有着相似的表达谱的基因更有可能编码相互作用的蛋白质。他们注意到相关性既适用于那些用大规模酵母双杂交方法鉴定出的相互作用,同样也适用于用传统手段鉴定的相互作用。Jansen 等人也注意到,通常那些在绝大多数细胞条件下都存在的永久性的复合体,诸如核糖体(ribosome)和蛋白分解小体(p r oteas ome),其亚基表现出最强的共表达。另外,几种瞬间复合体,诸如RNA聚合酶Ⅱ的全酶(RNA poly meraseⅡholoenzy me)可以被细分成几个小的共表达的永久性复合体。在最近对酵母大规模数据库中蛋白质相互作用的信息的评估中,每一组数据的质量都通过与可信的相互作用的文献数据的比较来加以评价。von Mering等人发现,不同方法得到的数据间有大量的矛盾之处,即便是使用了相同的方法,分析参数的不同也会造成结果的抵触。他们证实,那些被一种以上的方法所支持的相互作用,其准确性是最高的。再者,在所有的非遗传学方法中都存在着对高丰度蛋白质的强烈的偏好,每个数据组鉴定的蛋白质也对特定细胞定位偏爱。此外,进化上保守的蛋白质的重现性要好于酵母特有的蛋白质。
另一种寻找相互作用的蛋白质的方法是纯化蛋白质复合体并通过质谱鉴定其组分。最近有两篇运用这一方法的研究发表了。Gavin等人纯化了589个带有标签的酵母蛋白,其中绝大多数在高等生物中有同源基因,并提取了其中487个的相关伴侣。由1440个不同蛋白质组成的232个蛋白质复合体被鉴定,其中91%的复合体包括至少一个此前功能未知的蛋白质,使这些蛋白质可能的细胞功能得以初步显示。Ho等人对复合体进行的研究中也发现了差不多数目的蛋白质,他们用493个选自特定功能类别的标签蛋白筛选出了1578个相互作用伴侣。与两篇文章同时刊登的一篇评论指出,虽然其组分之一也被用作标签蛋白,但仍有几种已知复合体未被检测出来。对此可以有几种解释,比如,所用的纯化条件可能无法提取某些蛋白复合体,或者蛋白质C端加上标签可能会干扰某些蛋白复合体的形成。Gavin等人观察到,在18%的情况下,如果一种重要的蛋白质被标签化,该蛋白质就失效了,这也就证明了C端的标签可能会削弱蛋白质的功能。他们还指出,这种方法可能无法检测到瞬间作用、低当量复合体以及那些只在特定的生理条件下发生而在指数期的生长细胞中不存在的相互作用。此外,Gavin等人还发现了一种明显的拒绝捕捉15k D以下蛋白质的偏好。
假阳性蛋白质相互作用产生的原因可能有几种。我们将那些频繁出现的蛋白质从两套数据中过滤出来。即便如此,一些非特异性结合蛋白仍有可能因其较强的结合能力而与一些特异性的复合体一起被纯化。一些偶然的相互作用假象也可能在细胞裂解和纯化的过程产生。质谱分析也可能造成一些错误的检出。作为错误的相互作用比例的对照,Gavin等人重复了13个大复合体的纯化实验,发现70%的相互作用伴侣可以再次被纯化出来,也就是说错误的比例是30%。Ho等人用免疫共沉淀的方法鉴定了86组观察到的相互作用来作为其数据质量的监测,78%的相互作用被证实,错误率约为22%,与Gavin的情况相似。由于两组数据由单一实验得到,重复可能增加数据质量。
由于两项质谱检测蛋白质复合体方法的研究不相容,并且使用了不同的饵蛋白,因此两组数据很难进行比较。Gavin等人将其数据与大规模酵母双杂交的数据进行了比较,发现交集只有7%。而与YPD数据的比较则发现,他们的数据占YP D数据库中已经发现的蛋白质复合体的56%,在两项酵母双杂交研究中这一覆盖率都只有13%。Ho等人则将其数据与已有文献报道的相互作用比较后发现,他们的数据中每个饵蛋白检测出的相互作用比文献来源的两套大规模酵母双杂交数据的任何一套都要多2.6至3.4倍。很明显,质谱方法更适合于检测稳定的蛋白复合体。Gavin等人推测其原因是蛋白复合体的形成可能远远不是两两配对相互作用的加和。相反,酵母双杂交数据提供了关于瞬时的和两两配对的蛋白质结合的重要信息,这在质谱方法所无法企及。因此,将两类数据结合起来就能为一个特定蛋白质提供最多信息。质谱数据告诉我们它可能属于哪个蛋白复合体,而酵母双杂交数据则说明在这个复合体中哪些蛋白质之间有相互作用。