蛋白质组学及其主要技术
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
蛋白质组学及其主要技术
朱红1 周海涛2 (综述) 何春涤1, (审校)
(1.中国医科大学附属第一医院皮肤科,辽宁沈阳110001; 2.北京大学深圳医院核医学
科,广东深圳518036)
【摘要】蛋白质组是指一种细胞、组织或有机体所表达的全部蛋白质。
蛋白质组学是以蛋白质组为研究对象的新兴学科,近年来发展迅速,已成为后基因组时代的研究热点。
目前,蛋白质组学研究技术主要包括:样品的制备和蛋白质的分离、蛋白质检测与图像分析、蛋白质鉴定及信息查询。
本文就蛋白质组学概念及主要技术进行综述。
【关键词】蛋白质组,蛋白质组学
1蛋白质组学的概念
随着人类基因组测序计划的完成,人们对生命科学的研究重点由结构基因组转向功能基因组,1994年Wilkins和Williams首先提出蛋白质组一词[1],蛋白质组是指一种细胞、组织或有机体所表达的全部蛋白质。
从基因到蛋白质存在转录水平、翻译水平及翻译后水平的调控,组织中mRNA丰度与蛋白质丰度不完全符合[2]。
蛋白质复杂的翻译后修饰、蛋白质的亚细胞定位或迁移、蛋白质-蛋白质相互作用等也无法从DNA/mRNA水平来判断。
因此,只有将功能基因组学与蛋白质组学相结合,才能精确阐明生命的生理及病理机制。
蛋白质组学是以蛋白质组为研究对象,对组织、细胞的整体蛋白进行检测,包括蛋白质表达水平、氨基酸序列、翻译后加工和蛋白质的相互作用,在蛋白质水平上了解细胞各项功能、各种生理、生化过程及疾病的病理过程等[3,4]。
蛋白质组学有两种研究策略。
一种是高通量研究技术,把生物体内所有的蛋白质作为对象进行研究,并建立蛋白质数据库,从大规模、系统性的角度来看待蛋白质组学,更符合蛋白质组学的本质。
但是,由于剪切变异和翻译后修饰,蛋白质数量极其庞大,且表达随空间和时间不断变化,所以分析生物体内所有的蛋白质是一个耗时费力,难以实现的理想目标。
另一种策略是研究不同状态或不同时期细胞或组织蛋白质组成的变化,主要目标是研究有差异蛋白质及其功能,如正常组织与肿瘤组织间的差异蛋白质,寻找肿瘤等疾病标记物并为其诊断治疗提供依据。
2蛋白质组学的常用技术
2.1样品的制备和蛋白质的分离技术
2.1.1样品的制备样品制备包括细胞裂解与蛋白质溶解,以及去除核酸等非蛋白质成分。
激光捕获显微切割(Laser-captured microdissection, LCM)[5]技术可大量获得足够用于蛋白质组学研究的单一细胞成分,避免其他蛋白成分对电泳结果的干扰。
尤其是肿瘤的蛋白质组学研究常用LCM技术来获取单一的肿瘤细胞。
2.1.2蛋白质的分离技术
①双向凝胶电泳(Two-dimensional electrophoresis, 2-DE):双向电泳方法于
l975年由O'Farrell[6]首先提出,根据蛋白质等电点和分子量的差异,连续进行成垂直方向的两次电泳将其分离。
第一向为等电聚焦(Isoelectric focusing,IEF)电泳,其基本原理是利用蛋白质分子的等电点不同进行蛋白质的分离。
较早出现的IEF是载体两性电解质pH梯度,即在电场中通过两性缓冲离子建立pH梯度;20世纪80年代初建立起来的固相pH梯度(Immobilized pH gradients,IPG)IEF,是利用一系列具有弱酸或弱碱性质的丙烯酰胺衍生物形成pH梯度并参与丙烯酰胺的共价聚合,形成固定的、不随环境电场条件变化的pH梯度。
IPG胶实验的重复
性好。
第二向为十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(SDS-polyacrylamide gel electrophoresis,SDS-PAGE),它是按蛋白质分子量的大小进行分离,双向电泳的最新进展是用IPG干胶条代替两性电解质加上与干胶条相配套的电泳仪如PROTEAN IEF Cell、IPG-phort等进行第一向等电聚焦[7,8],不仅极大地提高了电泳的分辨率,也提高了结果的重复性,尤其是不同实验室之间结果的可比性。
2-DE最大的应用是能分离相同分子量的同分异构体以及经过翻译后修饰的蛋白质,蛋白质经过诸如磷酸化后,其电荷数量发生改变。
通常蛋白质的磷酸化形式可以与未磷酸化的对应物分离开,在双向电泳胶上出现一串水平斑点。
虽然该技术不断的发展,依然存在一些不足: 疏水性强及强酸强碱性蛋白质无法用2-DE 进行检测、低拷贝的蛋白质很难被检测到、检测分子量有一定范围、样品上样量相对少使得检测的灵敏度受到限制。
而且电泳结果需染色处理,而不同蛋白质与染料的结合差异较大。
另外该技术尚不能完全自动化,消耗时间长。
最近发展起来的差异凝胶电泳(Differences gel electrophore-
sis)[9]是将两种蛋白质样品分别用不同的染料进行荧光标记,混合后在一块胶上进行双向电泳。
因此,该技术可用于蛋白质的差异鉴定,尤其是用于大样本实验。
②毛细管电泳(Capillary electrophoresis,CE): CE是20 世纪80 年代由Joenson 和Lukacs 提出的高效分离分析技术。
即在高电场强度作用下,对毛细管(内径5~10 μm) 中的待测样品按分子质量、电荷、电泳迁移率等差异进行有效分离。
主要包括毛细管区带电泳、毛细管等电聚焦和筛板SDS-毛细管电泳。
该技术弥补了双向凝胶电泳无法实现自动化分析的不足,并可用于分子量范围不适用于双向电泳样品的检测,对单一样品尤为适用,但对复杂样品的分离尚不完全[10]。
③高效液相色谱(High performance liquid chromatography, HPLC):HPLC适用于单一蛋白质或简单样品蛋白质组的分离与纯化。
它与质谱结合,利用蛋白质等电点、疏水性和分子量的特性进行蛋白质分离鉴定,借助计算机联机检索,实现蛋白质分离鉴定一次完成,能满足高通量、自动化分析的要求。
与双向电泳比较,操作简单、速度快且灵敏度高。
但由于一维的HPLC仅能分析一些不太复杂的蛋白质体系,而对复杂的多肽混合物常不能满足分离的要求。
利用蛋白质不同特性,用多个分离柱对蛋白质进行多次高效液相分离的多维色谱(multi-LC)分离的方法在某种程度上满足了对复杂蛋白质混合分离鉴定的要求,常用于膜蛋白及低丰度蛋白质的分离鉴定[11]。
2.2蛋白质的检测与图像分析
蛋白质样品经双向电泳分离后,首先要经过染色再进行图像分析。
常用方法有考马斯亮蓝染色、银染色。
考马斯亮蓝染色因简单易行而常用,但灵敏度低。
银染的机制是将蛋白带上的硝酸银(银离子)还原成金属银,以使银颗粒沉积在蛋白带上。
其灵敏度比考马斯亮蓝染色高100倍,可以检测小至0.38 ng/mm2的牛血清白蛋白,但操作复杂,动态线性关系不明显,某些蛋白染色不明显甚至不染色。
其他的方法也可以在特定情况下使用,包括 [35S]蛋氨酸或14C放射性标记,胶质金、锌咪唑、丽春红、氨基黑及印度红染色等。
尽管蛋白质染色方法可以进行蛋白质的定量分析,但不能在一个广泛的浓度、等电点和氨基酸范围内进行蛋白质检测,尤其是对于大量翻译后修饰的蛋白质。
凝胶经过染色并显色后,通过专用扫描仪,将图像扫入计算机内,用特定分析软件进行分析,得到各个蛋白质点的相关数据(pI、分子量、密度等),然后对感兴趣的蛋白质点进行鉴定。
2.3蛋白质的鉴定
2.3.1肽质量指纹谱(peptide mass fingerprinting, PMF)技术指蛋白质被酶切位点专一的蛋白酶水解后,由于每种蛋白质的氨基酸序列不同,产生的肽片段序列也不同,其肽混合物的质量具有特征性,得到肽片段质量图谱,称为肽质量指纹谱,可用于蛋白质的鉴定。
基质辅助激光解吸电离飞行时间质谱(Matrix assisted
laser desorption/ionization time-of-flight mass spectrometry,
MALDI-TOF-MS) 是一种常用的取得蛋白质PMF测定方法。
基本原理是:将大分子待测样品与基质混合,通过基质分子吸收激光能量,转化为系统的激发能,导致大分子样品的电离和气化,生成的离子在真空无场区飞行并到达检测器,不同荷质比的离子到达检测器的时间不同从而得到该蛋白质PMF[12]。
实验所得肽谱数据与数据库进行匹配,再采用一定的方法对匹配结果进行打分和排序,最后根据分值高低而确定所测的蛋白质[13,14]。
该法灵敏度高,是大规模鉴定蛋白质的首选方法。
2.3.2同位素标记亲和标签(Isotope coded affinity tages, ICAT)鉴定蛋白质技术ICAT是一种人工合成的化学试剂,由三个功能区域:半胱氨酸反应区、8个H或2H的连接子和有亲和标签作用的生物素形成8个Da质量差异的亲和标签。
实验时,两种不同细胞状态的蛋白质样品分别用不同的ICAT标记,等量混合并用蛋白酶消化,经过生物素亲和层析进行分离,标记的多肽由于生物素的作用被吸附下来,经过液相色谱-质谱(LC-MS)或液相色谱-串联质谱(LC-MS/MS)分析,经不同ICAT标记的相同肽段一前一后相邻分布在MS图谱上,经计算机数据库查询,得到在不同细胞状态下蛋白质的表达差异。
该技术灵敏度及准确度均很高,主要用于研究蛋白质组差异,能够快速定性和定量鉴定多肽和翻译后修饰蛋白质、低丰度蛋白质,尤其是膜蛋白等疏水性蛋白[15]。
但该技术只能对含半胱氨酸残基的蛋白质进行分析;ICAT
分子量约为500 Da,相对肽段来讲是一个很大的修饰物,增加了数据库搜索的难度;而且操作的步骤较多,对精确的定量分析有影响。
2.3.3肽序列标签(Peptide sequence tag, PST)技术蛋白质由20种氨基酸组成,5~6个氨基酸残基的序列片段在一个蛋白质组成中具有很高的特异性,这个片段称为PST,可用于蛋白质鉴定。
色谱串联质谱(LC-MS/MS)及液相色谱-电喷雾-串联质谱(LC-ESI-MS/MS)能够检测离子结构碎片的质荷比及提供离子的结构信息,即得到肽段的分子量及部分PST信息,最后通过计算机联网查询,其信息在数据库查询中特异性更强,最后可对该蛋白质进行鉴定。
该技术自动化程度高、重复性好,尤其是它能够分离鉴定低丰度蛋白质。
2.3.4蛋白质芯片(Protein chips)技术是指以蛋白质分子作为配基,将其固定在固相载体的表面,形成的蛋白质微阵列(Protein microarray) 。
一个蛋白质芯片可以容纳一个蛋白质家族所有成员或一种蛋白质的所有变异体。
根据检测目的不同,作为配基的蛋白质分子可以是酶、受体、抗原、抗体或抗体片断等。
蛋白质芯片技术主要包括蛋白质微阵列的构建、样品的制备、芯片生化反应、信号检测及分析。
实验时,将带有特殊标记的蛋白质分子与芯片反应,探针捕获样品中的待测蛋白质并与之结合,然后通过检测器对标记物进行检测,计算机分析出待测样品的结果。
目前,对吸附到芯片表面的靶蛋白的检测主要有两种方式[16]:蛋白质标记法和直接检测法。
前者将样品中的蛋白质预先用荧光物质或同位素等标记,结合到芯片上的蛋白质就会发出特定的信号,用CD (Charge-coupled device) 照相技术及激光扫描系统等对信号进行检测;后者以质谱技术为基础,采用表面增强激光解吸离子化-飞行时间-质
谱 ( SELDI-TOF-MS) 技术,使靶蛋白离子化,以分析蛋白质的分子量和相对含量。
蛋白质芯片与质谱联合应用于蛋白质组研究领域,具有高通量、微型化、集成化、平行性检测等特点,逐渐应用于疾病检测、新药筛选等诸多领域,尤其成为肿瘤检测、分级、疗效及预后判定、寻找药物治疗特异性靶目标的关键技术。
与DNA芯片比较,蛋白质芯片存在许多不足,还应该在以下几方面进行研究[17]:增加芯片蛋白质的种类和数量;加速探针蛋白质的制备和纯化研究;寻找更好的探针固定技术;研究新的检测仪器和方法,提高检测灵敏度;开发高度集成化生产的制备系统,便于推广应用。
2.4信息查询
生物信息学(Bioinformatics) 是生物与计算机以及应用数学相互结合而形成的一门新兴学科。
它通过对生物学实验数据的获取、加工、存储、检索与分析, 达到解释数据所蕴含的
生物学意义的目的。
蛋白质组学研究任一物种的基因组编码的全套蛋白质,它通常是高通量的,在进行蛋白质功能预测和结构分析时,生物信息学就成为蛋白质组学研究的核心技术之一。
常用几种软件进行分析[13,18,19]。
PeptIdent是以肽质量指纹谱数据鉴定蛋白质的查询软件,是将数据库中的所有蛋白质用我们选定的酶进行"理论消化"形成肽片段,计算其理论肽段质量,建立索引,然后再与输入的实验数据进行对比,按实验数据匹配数的多少排列并输出匹配结果。
蛋白质的等电点、分子量和种属可以详细限制候选蛋白,减少假阳性误差。
MS-Fit 和Mascot软件利用了MOWSE得分法,特别考虑数据库中肽段分布频率的问题。
Mascot 软件还把MOWSE得分转换为绝对概率,减少结果的不确定性。
在蛋白质组的研究中,生物信息技术应用主要包括以下内容[20]:①高效率的分析技术平台,即计算机和网络联合应用。
②高通量技术,即运用信息技术去分析所得到的巨量数据。
③数据挖掘技术,即可从存放在数据库或其他信息库中的大量数据中挖掘知识,应用于分析中。
④数据可视化技术,有助于反映生物序列的三维结构模型,表现出生物体错综复杂的相互关系。
⑤复杂系统理论:描述系统关系时,必须把核酸、蛋白质、细胞、器官、组织等的作用考虑在内,即用系统的方法来认识生命活动。
3结语
蛋白质组学作为仅有十年历史的新兴生命科学正迅速发展,在基础医学、临床医学已得到广泛应用,尤其在肿瘤的诊断及药物筛查方面已取得可喜的进展。
然而,也存在许多亟待解决的问题,如强酸性、强碱性、难溶及低丰度蛋白质的分离鉴定问题,蛋白质分离鉴定中的通量问题,信息查询中的灵敏度和准确度问题等。
随着相关技术的发展,蛋白质组学研究技术将不断完善,该学科必将在后基因组时代为其他生命科学的研究提供更加坚实的平台。
参考文献:
[1] Wasinger VC, Cordwell SJ, Cerpa-Poljak A, et al. Progress with gene-product mapping of the Mollicutes: Mycoplasma genitalium[J]. Electrophoresis, 1995, 16(7):1 090-1 094.
[2] Anderson L, Seilhamer J. A comparison of selected mRNA and protein abundances in human liver[J]. Electrophoresis, 1997, 18(3-4): 533-537.
[3] Anderson NI, Anderson NG.Proteome and Proteomics: new technologi- es, new concepts, and new words[J]. Electrophoresis, 1998, 19: 1 853-1 861.
[4] Blackstock WP, Weri WP. Proteomics : quantitative and physical mapping of cellular proteins[J]. Trends Biotechnol, 1999, 17(3):121-127.
[5] Emmert-Buck MR, Bonner RF, Smith PD, et al. Laser
capture microdissection[J]. Science, 1996, 274(5289):921-922.
[6] O'Farrell PH. High resolution two-dimensional electrophoresis of proteins[J]. J Biol Chem, 1975, 250(10): 4 007-4 021.
[7] Vitolins MZ,Anthony M, Burke GL Soy protein isoflavones, lipids, and arterial disease[J]. Curr Opin Lipidol, 2001,12:433.
[8] Barry RC, Alsaker BL, Robison-Cox JF,et al. Quantitative evaluation of sample application methods for semipreparative separations of basic proteins by two-dimensional gel electrophoresis[J]. Electrophoresis, 2003, 24(19-20): 3 390-3 404.
[9] Yan JX,Devenish AT, Wait R, et al. Fluorescence two-dimensional difference gel electrophoresis and mass spectrometry based proteomic analysis of Escherichia coli[J].Proteomics,2002,2(12):1 682-1 698. [10] Ana M, Laura GG,Willy RG, et
al. Derivatization of biomolecules for chemiluminesoent detection in capillary electrophoresis[J]. Analyt Tec-
hnol Biomed Life Sci, 2003, 793(1): 49-74.
[11] Fields S. Proteomics in Genomeland[J]. Science, 2001, 291(2): 1 221-1 224.
[12] Zhang W, Czernik AJ, Yungwirth T, et al. Matrix-assisted
laser desorption mass spectrometric peptide mapping of proteins separated by two-dimensional
gel electrophoresis:Determination of phosphorylation in synapsin I[J]. Protein Sci, 1994, 3(4): 677-686.
[13]Chamrad DC, Korting G, Stuhler K,et al.Evaluation of algorithms
for protein identification from sequence databases using mass spectrometry data[J]. Proteomics, 2004,4(3):619-628.
[14] Von Eggeling F, Davies H, Lomas L, et al.
Tissue-specific microdissection coupled with proteinchip array technologies: applications in cancerresearch[J]. Biotechniques, 2000, 29: 1 066- 1 070.
[15]Gygi SP, Corthals GL, Zhang Y, et al. Evaluation of two-dimensional gel electrophoresis-based proteome analysis technology[J].
Proc Natl Acad Sci USA, 2000, 97: 9 390-9 395.
[16]钟春英, 彭蓉, 彭建新, 等. 蛋白质芯片技术[J].生物技术通报,2004,2: 34-37.
[17] 张艳,范学工. 蛋白质芯片技术及其在传染病研究中的应用进展[J]. 国外医学流行
病学传染病学分册, 2004, 31(5): 304-307.
[18] Wilkins MR, Gasteiger E, Bairoch A, et al. Protein identification and analysis tools in the ExPASy server[J]. Methods Mol Biol, 1999, 112: 531-552.
[19] Perkins DN, Pappin DJ, Creasy DM, et al. Probability-based protein identification by searching sequence databases using mass
spectrometry data[J]. Electrophoresis, 1999,20(18): 3 551-3 567. [20] 李科, 尧德中, 陈李容. 信息技术在后基因组学研究中的应用[J]. 电子科技大学
学报(社科版), 2003, 5: 64-67.。