蛋白质组学
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
蛋白质组学
1.蛋白质组学研究的目的和任务
20世纪中期以来,随着DNA双螺旋结构的提出和蛋白质空间结构的X射线解析,开始了分子生物学时代,对遗传信息载体DNA和生命功能的主要体现者蛋白质的研究,成为生命科学研究的主要内容。
90年代初期,美国生物学家提出并实施了人类基因组计划,预计用15年的时间,30亿美元的资助,对人类基因组的全部DNA序列进行测定,希望在分子水平上破译人类所有的遗传信息,即测定大约30亿碱基对的DNA序列和识别其中所有的基因(基因组中转录表达的功能单位)。
经过各国科学家8年多的努力,人类基因组计划已经取得了巨大的成绩,一些低等生物的DNA全序列已被阐明,人类3%左右DNA的序列也已测定,迄今已测定的表达序列标志(EST)已大体涵盖人类的所有基因。
在这样的形势下,科学家们认为,生命科学已经入了后基因组时代。
在后基因组时代,生物学家们的研究重心已经从解释生命的所有遗传信息转移到在整体水平上对生物功能的研究。
这种转向的第一个标志就是产生了一门成为功能基因组学(Functional Genomics)的新学科。
它采用一些新的技术,如SAGE、DNA芯片,对成千上万的基因表达进行分析和比较,力图从基因组整体水平上对基因的活动规律进行阐述。
但是,由于生物功能的主要体现者是蛋白质,而蛋白质有其自身特有的活动规律,仅仅从基因的角度来研究是远远不够的。
例如蛋白质的修饰加工、转运定位、结构变化、蛋白质与蛋白质的相互作用、蛋白质与其它生物分子的相互作用等活动,均无法在基因组水平上获知。
正是因为基因组学(Genomics)有这样的局限性,于90年代中期,在人类基因组计划研究发展及功能基因组学的基础上,国际上萌发产生了一门在整体水平上研究细胞内蛋白质的组成及其活动规律的新兴学科-蛋白质组学(Proteomics),它以蛋白质组(Proteome)为研究对象。
蛋白质组是指“由一个细胞或一个组织的基因组所表达的全部相应的蛋白质”。
测定一个有机体的基因组所表达的全部蛋白质的设想,萌发在1975年双向凝胶电泳发明之时。
1994年Williams正式提出了这个问题,而“蛋白质组”的名词则是由Wilkins创造的,发表在1995年7月的Electrophoresis杂志上。
蛋白质组与基因组相对应,但二者又有根本不同之处:一个有机体只有一个确定的基因组,组成该有机体的所有不同细胞都共享用一个确定的基因组;而蛋白质组则是一个动态的概念,她不仅在同一个机体的不同组织和细胞中不同,在同一机体的不同发育阶段,在不同的生理状态下,乃至在不同的外界环境下都是不同的。
正是这种复杂的基因表达模式,表现了各种复杂的生命活动,每一种生命运动形式,都是特定蛋白质群体在不同时间和空间出现,并发挥功能的不同组合的结果。
基因DNA的序列并不能提供这些信息,再加上由于基因剪接,蛋白质翻译后修饰和蛋白质剪接,基因遗传信息的表现规律就更加复杂,不再是经典的一个基因一个蛋白的对应关系,一个基因可以表达的蛋白质数目可能远大于一。
对细菌,可能为1.2~1.3;对酵母则为3;而对人,可高达10。
后基因组和蛋白质组研究,是为阐明生命活动本质所不可缺少的基因组研究的远为复杂的后续部分,无疑将成为21世纪生命科学研究的主要任务。
2.蛋白质组研究技术及其进展
尽管蛋白质组概念提出至今只不过4年时间,但她的研究可以追溯到20多年前O.Farrel和Klose各自创建的蛋白质高分辨双向凝胶电泳(two-dimensional gel electrophoresis,2-DE)。
O.Farrel对大肠杆菌细胞抽提物双向电泳后,分离到
1100个蛋白质组分,从此拉开了蛋白质组研究的序幕。
当今蛋白质组研究能够蓬勃发展,主要归功于以下三大技术突破:(1)80年代固相化pH梯度(immobilized pH gradients,IPG)的发明和完善,改善了双向凝胶电泳的重复性和上样量;(2)80年代后期电喷雾质谱(electrospray ionization mass spectrometry,ESI-MS)和基质辅助的激光解吸飞行时间质谱(matrix-assisted laser-desorptin ionization time of flight mass spectrometry,MALDI-TOF-MS)技术的发明,以及它们在蛋白质分析重的成功应用;(3)蛋白质双向电泳图谱的数字化和分析软件的问世,不少物种的双向电泳和蛋白质数据库相继建立和完善。
蛋白质组研究的技术手段也在不断完善。
2.1主要蛋白质分离技术
2.1.1双向凝胶电泳(2-DE)
双向凝胶电泳的原理是第一向基于蛋白质的等电点不同用等电聚焦分离,第二向则按分子量的不同用SDS-PAGE分离,把复杂蛋白混合物中的蛋白质在二维平面上分开。
近年来经过多方面改进已成为研究蛋白质组的最有使用价值的核心方法。
分离蛋白质组所有蛋白的两个关键参数是其分辨率和可重复性。
在目前情况下,双向凝胶电泳的一块胶板(16cm×20cm)可分出3~4千个,甚至1万个可检测的蛋白斑点,这与10万个基因可表达的蛋白数目相比还是太少了。
80年代开始采用固定化pH梯度胶,克服了载体两性电解质阴极漂移等许多缺点而得以建立非常稳定的可以随意精确设定的pH梯度。
由于可以建立很窄的pH范围(如0.05U/cm),对特别感兴趣的区域可在较窄的pH范围内做第二轮分析,从而大大提高了分辨率。
此种胶条已有商品生产,因此基本上解决了双向凝胶电泳重复性的问题。
这是双向凝胶电泳技术上的一个非常重要的突破。
第二向SDS-PAGE有垂直板电泳和水平超薄胶电泳两种做法,可分离10~100kD分子量的蛋白质。
其中灵敏度较高的银染色法可检测到4ng蛋白,最灵敏的还是用同位素标记,20ppm的标记蛋白就可通过其荧光或磷光的强度而测定。
用图像扫描仪、莱赛密度仪、电荷组合装置可把用上述方法得到的蛋白图谱数字化,再经过计算机处理,去除纵向和横向的曳尾以及背景底色,就可以给出所有蛋白斑点的准确位置和强度,得到布满蛋白斑点的图像,即所谓“参考胶图谱”。
蛋白质组研究的主要困难是对用双向凝胶电泳分离出来的蛋白,进行定性和定量的分析。
最常用的方法是先把胶上的蛋白印迹到PVDF(polyvinylidene difluoride)膜上后再进行分析,确定它们是已知还是未知蛋白。
现在的分级分析法是先做快速的氨基酸组成分析,也可先做4~5个循环的N末端微量测序,再做氨基酸组成分析;结合在电泳胶板上估计的等点电和分子量,查对数据库中已知蛋白的数据,即可作出判断。
有文献报道,N末端4个残基序列的数据就可以给出很多的信息而得到相当准确的结果。
如再结合C末端序列,判断结果的准确性会更高。
对分离得到的蛋白质作进一步的确切鉴定需要有足够数量的纯蛋白,电泳时蛋白质已经过了高度纯化。
现在一块胶板可允许上到高达mg数量级的样品,因此每个分离的蛋白斑点可有μg数量的蛋白,这样使本来是微量的蛋白也可希冀被鉴定。
蛋白质的翻译后修饰和加工,是指在肽链合成完成后进行的化学反应,如磷酸化、羟基化、糖基化、二硫键形成,以及最近发现的蛋白质自剪接等等,可能有一百种以上。
翻译后修饰和加工对蛋白质的正常生理功能是必需的,它们的变
化往往和疾病的发生有关。
用双向凝胶电泳可以进行翻译后修饰的研究,如用32P标记可以研究磷酸化蛋白的变化。
双向凝胶电泳中常可发现的蛋白质拖曳现象,很可能是一个蛋白的不同翻译后修饰产物所造成的。
拖曳图像变化在疾病诊断上可能提供重要的信息。
双向凝胶电泳技术当前面临的挑战是:(1)低拷贝蛋白的鉴定。
人体的微量蛋白往往还是重要的调节蛋白。
除增加双向凝胶电泳灵敏度的方法外,最有希望的还是把介质辅助的激光解吸/离子化质谱用到PVDF膜上,但当前的技术还不足以检出拷贝数低于1000的蛋白质。
(2)极酸或极碱蛋白的分离。
(3)极大(>200kD)或极小(<10kD)蛋白的分离。
(4)难溶蛋白的检测,这类蛋白中包括一些重要的膜蛋白。
(5)得到高质量的双向凝胶电泳需要精湛的技术,因此迫切需要自动二维电泳仪的出现。
2.1.2“双向”高效柱层析
“双向”高效柱层析,实际上是先进行一次分子筛柱层析,在进行利用蛋白质表面疏水性质进行分离的反向柱层析。
第二次分离的原理与双向电泳中利用蛋白质等电点分离完全不同,两种方法可起补充作用。
和双向电泳相比,“双向”高效柱层析的优点是可以适当放大,分离得到较多的蛋白质以供鉴定。
另一个优点是流出的蛋白峰可以直接连通进入质谱进行测定,避免了“印迹”的步骤及其缺点。
2.2主要的蛋白质鉴定技术
2.2.1 Edman降解法测N端序列
尽管Edman降解法测序速度较慢,费用偏高,灵敏度也不如快速发展的质谱,但它测定的肽序列非常准确,成为蛋白质可靠鉴定的重要依据。
最近,应用细径(内径0.8mm,流速40μL/min)的HPLC柱,Cordwell等能够在100fmol
的初产率下测得5~10个氨基酸残基的序列。
Gooley等设计一种称为“sample cartridge carousel”的硬件,能自动地将样品输入序列仪,可进行样品平行测序,加快了测序进程,也降低了费用。
随着Edman降解法在微量测序和速度等技术上的突破,它在蛋白质组研究中可发挥重要作用。
类似Edman降解法的C端化学降解法研究多年并有自动化仪器问世,但它的反应效率低,通常需nmol样品。
2.2.2 质谱技术
质谱技术的基本原理是样品分子离子化后,根据不同离子间的荷质比(m/e)的差异来分离并确定分子量。
其原理并不新鲜,但是在80年代早期出现的两种新的离子化技术,使质谱从仅能分析小分子挥发物质到可以研究生武打分子,80年代末又发明了两种更新的离子化技术,一种是介质辅助的激光解吸/离子化(matrix-assisted laser desorption/ionization,MALDI),另一种是电喷雾离子化(electrospray ionization,ESI)。
这些技术能快速而极为准确地测定生物大分子的分子量;在结合各种新的质谱分析技术,便可以在各种水平上研究蛋白质,为蛋白质研究开辟了新的道路,是蛋白质组研究从蛋白质深入到高级结构研究,以及各种蛋白质之间的相互作用研究。
另外,对于蛋白质和多肽,质谱的发展还有一个重要的用途是肽的测序。
这是采用串联质谱(Tandem-MS),即在第一级质谱得到肽的分子离子,选取目标肽的离子作为母离子,与惰性气体碰撞,使肽链中的肽键断裂,形成一系列离子,即N端碎片离子系列(B系列)和C端碎片离子系列(Y系列),将这些碎片离子系列综合分析,可得出肽段的氨基酸序列。
最近,Wilm等应用纳喷串联质谱(nano-electrospray tandem mass spectrometry)能在较低的fmol量上测得肽段
序列。
在MALDI-MS方面,近年来可用源后衰变-基质辅助激光解吸离子化质谱(post-source decay MALDI-MS,PSD-MALDI-MS)技术测得肽序列。
与上述方法测肽序列不同,Chait等发展一种称为“protein ladder sequencing”的方法,通过对Edman降解法的修改,产生一系列截去N端残基的肽段,用MALDI-MS测得这些肽段的质量,从而推测N端序列。
Patterson等利用羧肽酶Y酶解法并结合MALDI-TOF MS质量分析法同样测得了C端得肽序列。
Mann 等用串联质谱技术分析肽段可得到这样的信息:N端段质量、C端段质量和中间少数几个残基的序列,称为“肽序列标记”(peptide sequence tag,PST),并认为这样的标记比部分肽序列信息在查库时更具限制性。
质谱法有不少优点,还能用于翻译后修饰的分析(糖基化、磷酰化),但目前只适用于20个氨基酸以下的肽段。
此外,还存在固有的局限性,譬如Leu和Ile、Lys和Gln不能区分,有些肽的固有序列不能用质谱法测定。
用质谱技术可以进行得从基因组到蛋白质功能的研究可以归纳为表1。
氨基酸组成分析由于耗资低而常用于蛋白质鉴定。
非常可靠的鉴定往往需要配合其它鉴定手段。
氨基酸组成分析对杂质污染较敏感,如样品含有杂蛋白,会严重影响鉴定的可信度。
2.3蛋白质组研究技术进展
2.4.1蛋白质组重叠群(Proteomic contig)
一块双向电泳凝胶对复杂蛋白混合物的分辨率有限,太大的凝胶无论在电泳、操作及图像分析上都会带来很大麻烦,期望的特殊pH梯度范围也不易达到。
Humphery-Smith等创建蛋白质组重叠群来提高双向电泳的分辨率。
利用多块在不同pH梯度和/或分子量上相互重叠的双向电泳图谱,结合图像分析技术拼接成一张完整的双向电泳图谱,其实质是使每一块凝胶在较窄的pH梯度和分子量范围内分离蛋白,以提高分辨率。
这样,每个电泳图谱称为蛋白质表达的pI/Mr窗口(pI/Mr window of protein expression)。
蛋白质组重叠群扩大了双向电泳的pH
梯度范围和分子量范围,可分离更多的蛋白质组组分。
该方法已得到成功运用,并将pH梯度扩展到2.3~11。
2.4.2 双向电泳矢量图
蛋白质组研究的一个重要内容是蛋白质各种翻译后修饰的研究。
运用图像分析软件,在双向电泳数据库的参考图上,蛋白质位置如果与该蛋白的理论预测位置不同,在这两个位置之间连一直线,即为该蛋白的“矢量”,这样的图谱称为双向电泳矢量图。
在矢量图上,有的蛋白质具有一个失量,有的具有两个或多个矢量,表明可能存在多种翻译后修饰。
如果对不同翻译后修饰与蛋白质双向电泳迁移位置效应关系进行大量研究,可能建立一个矢量库,从而有利于蛋白质翻译后修饰种类和程度等预测,为实验研究提供信息。
2.4.3 酵母双杂交技术
蛋白质-蛋白质的相互作用时细胞生命活动的基础和特征。
这种千变万化的相互作用以及由此形成的纷繁复杂的蛋白质联系网络同样也是蛋白质组学的研究内容,相应的工作也已经开展。
酵母双杂交系统(yeast two-hybrid system)自建立以来已经成为分析蛋白质相互作用的强有力的方法之一。
该方法不断完善,如今它不但可用来在体内检验蛋白质间的相互作用,还能用来发现新的作用蛋白质,在对蛋白质组中特定代谢途径中蛋白质相互作用关系网络的认识上发挥了重要的作用。
试验表明双杂交技术在蛋白质组学上大应用成功的。
酵母双杂交技术较为复杂,因此在此恕不详述。
3. 蛋白质组研究的现状和前景
3.1原核及简单真核生物的蛋白质组研究
蛋白质组研究目前还主要集中于原核生物及一些简单的真核生物,尤其是一些基因组序列被完全搞清或大部分已知的生物,如支原体、细菌、酵母等。
3.1.1流感嗜血杆菌的蛋白质组研究
流感嗜血杆菌(Haemophilus influenzae)是第一个获得基因组全序列的生物。
瑞士的一个小组通过2D-PAGE研究了流感嗜血杆菌的蛋白质组分,在pH3~10的范围内鉴定了约300个蛋白质组分,然后用有两个尿素浓度的麦黄酮(tricine)胶分离了很难分离到的5~20ku范围内的蛋白质,还鉴定了其中的80种。
另外用肝素亲和层析将碱性蛋白质富集后,在pH6~11的范围内又鉴定了102个蛋白质,其中许多是核酸结合蛋白尤其是核糖体蛋白。
华盛顿大学的另一个小组将双向电泳得到的流感嗜血杆菌303个蛋白质斑点进行质谱分析,确定了263个蛋白质,其中大部分是外膜蛋白,以及与能量代谢和大分子合成有关的蛋白质。
另外发现了几种不能在基因组中找到对应序列的蛋白质。
大约22%的被鉴定了的蛋白质表现出与预计不同的等电点与分子质量,显示它们可能经过了翻译后加工。
3.1.2 大肠杆菌的蛋白质组研究
目前大肠杆菌全部4000多个基因的DNA序列已被测定,并由此建立了蛋白质-基因联合数据库,希望及此来回答以下几方面的问题:a.所有编码基因的产物在双向图谱上的位置;b.各种蛋白质的丰度;c.不同条件下各种蛋白质表达水平及合成速率的变化;d.各种蛋白质在细胞内的定位;e.某些蛋白质翻译后修饰的方式和水平。
目前,大肠杆菌的联合数据库已更新到第六版,大约包括1,600个蛋白质斑点的数据,其中大约400个已与大约350个基因相对应。
对于这些蛋白质,这个数据库可以提供基因名称、蛋白质名称、E.C.编号、功能范畴、
Swiss-Prot数据库编号、Genbank序列号、基因图谱的位置、染色体上的转录方向及一些生理信息(如在不同生长条件下该蛋白质在细胞内的丰度)。
双向电泳技术的最大优势在于它可以对细胞内复杂的蛋白组分进行整体性的定量分析,从而可以分析当条件变化时,一系列蛋白质而不仅仅是某一蛋白质的表达变化。
在基因水平,“调节子”被用来描述受控于一个调节蛋白的一系列基因;在蛋白子和基因水平,刺激子(stimulon)用来描述一系列蛋白质,它们对同一刺激物起反应。
例如在大肠杆菌中,人们已经研究了碳、氮、磷及硫元素限制导致的细胞内蛋白质谱的变化;在对营养成分磷限制的研究中,发现当磷饥饿时有137个蛋白质的合成速率明显改变,其中大部分(118个)的表现为诱导合成,其他则被抑制。
3.1.3致病微生物的蛋白质组研究
蛋白质组的一个重要引用是在阐明新抗生素作用机理上。
最近的10年中,用于临床的抗生素几乎都是原有抗生素的衍生物。
目前这种状况有所改变,寻找作用于细菌内新的靶子的研究工作已经展开,找到了许多有效的抗菌化合物。
但目前遇到的困难在于难于揭示新的化合物的作用靶子及其作用机理。
有时虽在体外发现新化合物能够使某种蛋白质失活,但在体内是否有这种现象和这是否是抗菌的主要机制任然未知,双向电泳分析提供了一个有效的手段。
例如在研究抑制核糖体类抗生素对细菌作用机制时,对12种作用于翻译过程的不同阶段和核糖体内不同分子的抗生素加以考察,发现其中8种诱导冷休克反应(cold-shock response)的一系列蛋白质,另4种诱导热休克反应的一系列蛋白质,因此预计新的作用于核糖体的化合物也是诱导这两种反应,并且籍此可推测大肠杆菌对冷热的反应发生于核糖体水平。
蛋白质组研究的重要优势在于能够从整体水平上分析不同条件下蛋白质谱的变化。
例如做为一种差异显示技术,这一技术已被应用于比较结核分枝杆菌与牛结核分枝杆菌蛋白的不同,结果发现一些在基因水平上很类似的蛋白在蛋白质水平上有很大差别,这可能部分揭示近年来牛痘做为结核病疫苗会出现失败的现象。
3.1.4酿酒酵母的蛋白质组研究
利用双向电泳技术分析酵母蛋白谱的工作也早于蛋白质组概念的提出。
酿酒酵母(Saccharomyces cerevisiae)基因组的完成及其蛋白质数据库在互联网上的建立,大大加速了这一工作。
借助数据库的有力推动,在双向电泳图谱上最明显的蛋白质斑点的大部分得到鉴定。
丹麦进行的一项研究计划分别作出野生型和将基因系统缺失的缺陷型酵母的双向蛋白质图谱。
初步的研究表明,缺失单一基因将导致的结果并不只是缺乏此基因编码的蛋白质,而是能导致其它一系列蛋白质量的改变。
单一基因缺失的结果总是引起蛋白质组全局性的变化。
大约20%的酵母基因缺失是致死性的,另外80%则不然,这是机体能通过调节蛋白质的表达来对抗这种内源性的变化。
这种基因缺失的研究可能会告诉我们一些关于细胞内蛋白质分子间相互“对话”和“作用”的重要信息,如蛋白质间的物理联系(这些蛋白质可能会组成蛋白质复合物)、信号传递途径,以帮助我们了解细胞是如何构成的以及是如何协同工作的。
3.2多细胞真核生物的蛋白质组研究
3.2.1线虫的蛋白质组研究
利用双向电泳技术,Bini等对线虫(C.elegans)进行了蛋白质组分析,在等电点3.5~9和分子量10~200ku的范围内可分辨2000个以上的蛋白质斑点,然
后利用Edman微量测序技术对其中24个斑点进行分析,得到其中12个蛋白质的N端序列。
已测出的12个中有一个未能找到与其匹配的基因。
另外11个与能量代谢、酸性核蛋白、G蛋白等对应。
C.elegans的19,000个基因已于1998年12月全部测出,预计会对蛋白质组的研究提供帮助。
3.2.2果蝇的蛋白质组研究
不同性别果蝇(Drosophila melanogaster)成虫的头、胸、腹部的蛋白质组图谱已分别被作出,共约有1,200个蛋白质被检出,其中的大多数在头、胸、腹中是相同的,但也发现了一部分其部位、性别特异的蛋白质。
3.3人类的蛋白质组研究
人类的蛋白质组研究吸引了最多的注意力。
由于人有着大量的组织、细胞类型和发育阶段,对人蛋白质组的研究主要聚焦在特异的组织、细胞和疾病上。
已有的证据表明,尽管人的不同组织有着很大的差别,但其中的许多蛋白质是看家蛋白,因此他们的双向图谱可能也是近似的。
这点与简单生物不同,因此对于人类来说,一个高质量的基本的双向图谱是非常有用的,它可以作为其他组织、细胞的参照图谱。
人的各类组织、器官、细胞乃至各种细胞器已被广泛研究。
人的各种体液(血液、淋巴、脊髓、乳汁和尿等)都被用于研究与某些疾病的关系。
最近澳大利亚科学家利用双向电泳技术研究眼泪中的蛋白质与生理状态的关系。
他们发现了一种新的蛋白质,他非常相似于在乳腺癌细胞里高表达的另一种蛋白质。
这一发现可能会提供疾病诊治的新手段。
在一项利用蛋白质组研究技术进行的酒精对人体毒性的研究中发现,乙醇会改变血清蛋白糖基化作用,导致许多糖蛋白的糖基缺乏,如转铁蛋白。
肿瘤至今任是人类的一个顽敌,癌细胞不仅有许多特异蛋白质产物,而且这些产物还会影响其他蛋白质的翻译后加工及许多蛋白质的表达水平。
肿瘤的蛋白质组研究能提供一些以往其他技术所不能提供的早期诊断依据,例如利用不同细胞组织的特征蛋白质谱,可以判别一些难以判定来源的肿瘤细胞的来源。
丹麦的一个小组利用蛋白质组研究技术结合组织冰冻切片技术分析了150例膀胱癌病人的组织,发现在所有的鳞状细胞瘤的尿液中均能发现一种化学引诱剂-银屑素(psoriasin),推测其极可能作为这种肿瘤的早期标志物。
许多科学家致力于各种肿瘤组织与正常组织之间蛋白质谱差异的研究,这些组织包括脑、胸腺、乳腺、肺、直肠、肾、膀胱、卵巢、骨髓等,这些研究已经找到了一些肿瘤特异的标志物,可能会对揭示肿瘤发生的机制有所帮助。
例如,在对肾癌的研究中发现有4种蛋白质存在于正常肾组织而在肾癌细胞中缺失。
其中两种分别是辅酶Q蛋白色素还原酶和线粒体泛醌氧化-还原复合物I。
这提示线粒体功能低下可能在肿瘤发生过程中起重要作用。
3.4蛋白质组表达图谱用于基因组功能提示的可行性
最近,谢涛等人以ECO2DBASE(Edition6)为研究材料,研究了利用蛋白质组表达图谱提供的生命动态活动信息提高基因组功能提示效果的可行性。
在设计出一套较为完整的细胞功能簇(CRC)聚类方案的基础上,经考察,79个蛋白质聚成4个不同的CRC。
结果显示出功能相关的蛋白质趋向于聚集在相同的CRC中,如9种氨酰tRNA合成酶和4种热休克蛋白分别准确的聚合到CRC2和CRC3中。
这些结果提示:在蛋白质组研究中比较充分的前提下,通过有效的算法,蛋白质表达图谱可以为基因组功能提示提供非常重要的序列相似性之外的功能信息。