人类后基因组计划 : 蛋白质组学的研究现状和展望

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第11卷 第1期

河南医学研究

V ol.11N o.1

2002年 3月

HE NAN ME DICA L RESE ARCH

M arch 2002

收稿日期:2002201209;修订日期:2002201215

作者简介:陈虹(1978-),女,河南孟州人,在读硕士研究生,从事食管和贲门癌变机制和防治研究。

文章编号:10042437X (2002)0120083203

人类后基因组计划:蛋白质组学的研究现状和展望

H uman post 2genomic project :the currently status and prospect of human proteome project

陈 虹,王立东综述

(郑州大学医学院癌症研究室 河南郑州 450052)

生物医学领域最宏伟的工程———人类基因组计划(Human

genomic project ,HG P )的本质是对人类所有基因组进行作图和序

列测定,旨在破译人类所有的遗传信息。目前,HG P 已近尾声

[1~3]

,这一工程的实施和完成,凝聚了世界各国生物医学领

域众多实验室和科学家的心血,尽管成就巨大,然而仅用核酸语言不足以解释整个生命活动过程。基因组学研究的快速发展,推动了功能基因组研究的进一步前进和后基因组时代的到来。且现代分子医学发展到第三个阶段[4~8],重点是把蛋白质信息纳入细胞通讯路径和网络中加以研究,同时考虑蛋白质翻译后修饰,蛋白质2蛋白质,蛋白质2DNA 间相互作用的动力学状态。因此后基因组时代的未来属于蛋白质组学。旨在通过基因组学/蛋白质组学的综合分析,最终了解在正常过程和病理过程中分子生物学事件的确切功能。同时多学科的综合发展,如人类基因组计划以及由此所揭示的越来越多的新蛋白质;强有力的蛋白质研究技术,譬如近来发展起来的质谱分析法,显微激光细胞获取术以及DNA 显微阵列技术;生物信息学的发展,计算机工具和软件分析,大量数据的输入和解析、输出等的突破性进展,从各个方面推动着蛋白质组学的向前发展。

1 基因水平研究存在的问题

人类基因组计划自实施以来,由于各国政府的重视和支持,加之商业机构的介入,取得异乎寻常的发展。但随着新基因的发现,越来越多的问题呈现在我们面前。酵母细胞的107个核苷酸破译后,尚不能确切阐明对酵母的影响作用,对于人类庞大的3×109个核苷酸决非易事。DNA 作为遗传信息的载体,而真正细胞生物功能的承担者是蛋白质。对基因的识别远不足以全面认识蛋白质的功能

[4]

:(1)特定的DNA 序列并不一

定表示对应的蛋白质,单个基因可以编码多种不同的蛋白———这些差异是通过mRNA 转录的替代片段,或通过改变翻译的起始或终止,或通过mRNA 翻译过程中不同三联密码的框移而实现,而且DNA 序列不足以说明蛋白质的结构功能和细胞学定位。蛋白质比核酸更为复杂,蛋白质合成后经过一系列环境依赖的修饰作用,如磷酸化,糖基化,加乙酰基,泛素化,硫化,以及其他多种修饰方式,发生复杂多样的变化。(2)单纯的DNA 密码子也不能提示蛋白质之间如何互相作用,如何进入细胞网络,如何在细胞器上发挥作用。(3)事实上,早在DNA/RNA 表达发生变化前,蛋白质信号通路的激活就可以迅速导致细胞游走、死亡、转化。这些问题很难从基因组研究水平解决,所以分子医学发展到第三个阶段,蛋白质组学应运而生。

2 蛋白质组学的定义及同基因组学的联系和区别

211 蛋白质组学的定义 蛋白质组(proteome ),由Marc Wilkins

最早于1994年在S iena 双向凝胶电泳会议上提出。最早见诸

1995年7月的“E lectrophoresis ”杂志上[9]。它是指一个有机物所

有的蛋白质,具体指一个细胞或组织基因组所表达的全部蛋白质。蛋白质组学不仅包括蛋白质的定性和定量,还包括它们的定位、修饰、活性、功能、相互作用。其研究目标是:有机体合成的全部蛋白质和其活动方式。蛋白质组学(proteomics ),即人类后基因组计划的一个重要组成部分,其研究目标就是建立完整的蛋白质文库。

212 蛋白质组学同基因组学的联系和区别 蛋白质组与基因

组相对应,是一个整体概念,即基因组表达的全部蛋白,但两者有着不同之处:基因组是组成机体的不同细胞所共享的同一个基因组,但蛋白质组作为基因组表达的产物随时间、地点、环境等条件变化,是一个动态的概念。在同一个体不同的组织和不同细胞中不同;在同一机体不同的发育阶段,生命过程中不断变化;在不同的生理状态下不同;在不同的外界环境下也不同。当前蛋白质组研究可分为2个阶段:第1阶段是建立一个细胞或组织或机体在正常条件下的蛋白质文库,或称参考图谱,即“组成蛋白质组”;第2阶段则是研究在各种条件下的蛋白质组变化,称为“功能蛋白质组”。

3 蛋白质组学的研究现状

蛋白质组学最初仅指应用双向凝胶电泳法定性和分离蛋白质,现在发展到泛指大规模鉴别蛋白质的任何过程。目前,仅有一小部分蛋白质被列入蛋白质文库[10,11]。而且蛋白质组学研究方法还存在很大的局限性。首先在研究材料的获取方面存在较多的问题。如从基础学科到应用学科研究都广泛采用相关细胞的永生细胞系,及疾病同质组织块。尽管技术成熟仍存在一定问题。现在普遍认为绝大多数细胞系因为失去了原有的组织环境且反应于新的培养环境,并不能真实反映原位的细胞生物学。而大组织块中不可避免地混入其它细胞。加

・84・河南医学研究第11卷

之这些研究还不包括疾病异常细胞与其正常起源细胞的比较,就难于阐明疾病所导致的机体各种改变对细胞产生蛋白质的影响。

其次,研究手段有待提高。同基因组学研究一样,蛋白质组学研究首要的一步是蛋白质分离。现行主流技术,双向凝胶电泳[12~16](tw o2dimensional polyacrylamide gel electrophoresis, 2DPAGE,2D凝胶电泳)原理是基于蛋白质等电点的不同用等电聚焦分离,按分子量的不同用S DS2PAGE在二维平面上分开。存在的主要问题是:分析所需的蛋白质量大,所以研究对象就局限于培养细胞或研磨同质组织,但如上所述此二者均脱离了蛋白质所处的细胞组织环境;难于检测难溶或不溶性蛋白质,难于分离极酸或极碱性蛋白质,极大或极小分子量蛋白质。所以在前蛋白质时代,上千种蛋白被鉴别出来———如何代谢以及进行信号传导,复制,转录,翻译机制,如何存在于分泌和细胞网络;以及如何容纳其他细胞复合物———却毫无价值,原因即在于脱离了所处组织环境的作用孤立地分析蛋白质。众所周知,组织是由成千上万的细胞以一定的空间构型相互作用而形成的复杂结构。为了更深一步了解组织与蛋白的相互关系及影响,组织蛋白质学[4,17](tissue proteomics)产生了。

4 蛋白质组学主要技术步骤

蛋白质组学研究的基本步骤有三:蛋白质的分离,蛋白质的鉴定,信息资料的处理。

蛋白质组学研究[18]策略在于:满足日益增长的大规模定量分析的需求。例如,用轻重两种同位素对两个蛋白质群进行标记,然后混合,胰酶消化,最后分离出构成蛋白质的各种亚结构。得到除标签质量不同外,完全相同的两群肽链,再用质谱仪进行分析。

411 蛋白质分离技术 蛋白质组学研究首要的步骤是蛋白质分离技术,遵循的基本原则是高分辨率和可重复性。目前主要应用的从人组织细胞中采取样本的方法有2种。

41111 亲和纯化法(affinity cell s orting,ACS):即从新鲜组织块中采集细胞,经过酶处理,孵育,分离,冲洗等步骤,获得分析可用的细胞群。亲和纯化法的主要原理是用特异性抗体、金属、凝集素或其它试剂同蛋白质结合,以分离蛋白质[19,20]。

41112 激光显微细胞获取术(laser capture microdissection, LC M)[21~26]:这种方法是在显微镜直视下,从玻片上获取标准染色的冰冻或固定组织,操作迅速(在技术熟练情况下,1分钟内可分离100个细胞),可准确到单个细胞,精确率高达90%。即通过比较组织中特定细胞群在不同疾病中的状况,以期得到新的诊断、预后判断和治疗指标。LC M发明于NIH,用LC M获取的细胞可用于高灵敏度,可重复性蛋白质组学分析,且其可对固定组织进行蛋白质组学研究,极大的提高了蛋白质组学的研究对象,也为一些长期积累的各种组织标本库带来光明前景。412 蛋白质鉴定技术 蛋白质鉴定的主要方法是质谱技术, DNA显微阵列技术。

41211 质谱分析法:最近质谱仪的发展,使得应用2D凝胶电泳或用色谱仪快速鉴别蛋白有了重大进展[13]。质谱仪(mass spectrometer)[27,28]可用于研究核苷酸和蛋白质序列分析,从蛋白质资料中得出蛋白质序列,表达方式及翻译后修饰。质谱仪通过鉴定肽的质量,然后比较预期的基因数据库肽的质量,就可以确认蛋白。具有自动化,敏感性强,产出量高的特点,加上生化片段的改进和越来越多数据资料的积累,使质谱仪进一步广泛应用。利用质谱仪直接分析由复杂蛋白质分解得来的肽链混合物,大大提高了一次试验分析的蛋白质数目。蛋白质组学的分离和分析技术的应用可使人体组织作为蛋白质研究的来源,及通过比较病原细胞和正常细胞的蛋白质发现早期病变指标。

41212 DNA显微阵列技术(DNA microarray)[29,30]:原用于检测mRNA水平及不同细胞状态下的基因表达。最近证明纳升滴珠体积的蛋白质可共价结合在玻璃表面,每板可点10000多个样本[29]。此阵列模式可用于分析蛋白质与其它蛋白质,小分子的相互作用及被蛋白酶磷酸化情况。目标阵列可一次测定一个器官中所有酶对特定底物的修饰作用。尽管严格意义上不能算蛋白质组学技术,但却能大规模分析蛋白质功能,提高蛋白质分析的效率。同时显微阵列技术也可用于DNA多态性分析等方面,因而可把相关蛋白的改变同疾病状态相联系。这一方法的应用,正确的发现15个病人中14例遗传性乳癌和卵巢癌基因BRC A1的突变。

413 资料分析 最后,所得资料通过输入、存储、加工、输出和数据库之间的联络,借助计算机数据库和一些软件和网络工具进行分析[5,31]。此阶段的工作极大的依赖生物信息学的发展。其工作基础是先通过2D2PAGE建立正常机体生理条件下蛋白质组的图谱,把相关数据制成二维图谱和数据库,并可通过联网检索,旨在建立完整的“组成蛋白质组”。这是蛋白质分析的基础,BL(bioknowledge library)包括论文,基因序列,基因功能,各种蛋白质的详细资料(protein reports:最新报道,蛋白质分类,名称)多种环境中每个基因的表达状况,它可借助一些软件工具通过基因名称,关键词,蛋白质所有权等进行检索。并可进行功能,规律,种属间相互联系的分析。BL的网址是w w w. 1蛋白质组学的进一步发展将推动依据未归类蛋白质的相关资料直接推测其功能时代的到来。

5 蛋白质组学的应用及前景

在一种疾病发生,发展的过程中,细胞内的蛋白质表达的变化,提示了疾病的病因和结局。这些信息将使我们最终发现有效的治疗,干预信号,发现与疾病进展有关的诊断和预后判断的生物学指标。正是蛋白质组学研究提供蛋白质分离和分析手段,使我们能第一次从病变的各个阶段的损伤着手分析蛋白质的变化,来揭示这些变化。可通过分析细胞和组织中蛋白质组的总体组成;在不同生理条件下,由细胞所处的宏观和微观环境变化所引起的蛋白质组变化;疾病状态下蛋白质的表达和修饰;药物或异体物质对蛋白质组的作用;分析正常上皮到癌前病变到原位癌到转移癌的各个阶段,着手研究癌变的机理和过程。蛋白质组学研究不仅有利于揭示生命活动规律,而且

相关文档
最新文档