蛋白质组学主要研究技术
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
蛋白质组学主要研究技术
目前蛋白质组学的研究手段主要依靠分离技术、质谱技术和生物信息学的发展。
分离技术要求达到高分辨率和高重复率,质谱技术主要包括MALDI-TOF、Q-TOF与MS/MS等质谱设备以及样品的预处理,生物信息学则利用算法的改进和数据库查询比对的完善提高数据结果的判断。
1. 蛋白质组学的分离技术
目前蛋白质组学研究广泛采用的是双向电泳技术。
高通量性、对实验要求低、操作简便快速是双向电泳具有的最大优点,它特别适合大规模的蛋白质组学研究。
尽管当前蛋白质的分离技术多种多样,但目前仍然没有一种可以彻底地取代双向电泳技术。
从1975年,O’Farrells[8]等将IEF与SDS-PAGE结合创立了2D-PAGE电泳技术以来。
双向电泳技术在多个方面都得到了提高和改进:(1) IPG胶条的使用。
传统的载体两性电解质等电聚焦存在上样量小、长时间电泳过程中pH梯度不稳定、阴极漂移现象及其导致的碱性蛋白损失、不同批次间重复性差等问题。
IPG 胶条的使用使这些问题得到了极大的改善,这使蛋白质双向电泳数据库的建立成为现实;(2) 样品制备:蛋白质样品的质量好坏从根本上决定了电泳最终结果的好坏。
双向电泳的样品制备有两个关键点,即如何使样品中蛋白质充分溶解以及尽可能减少影响等电点聚焦的杂质,特别是带电杂质。
采用超声或核酸酶处理的方法可以去除核酸,超速离心可除去脂类和多糖,透析、凝胶过滤或沉淀/重悬法可以降低盐浓度。
近来的研究发现磺基甘氨酸三甲内盐(ASB14-16)的裂解效果最好,而2mol/l的硫脲和4%的表面活性剂CHAPS的混合液能促使疏水蛋白从IPG到第二相胶的转换。
以三丁基膦(TBP)取代β-巯基乙醇或DTT,可以完全溶解链间或链内的二硫键,增强了蛋白质的溶解度,并促进蛋白质向第二向的转移。
另外,双向电泳中对低丰度蛋白的分离识别比较困难,除了显色技术的局限外,还存在容易被高丰度蛋白掩盖的问题,这样得到的蛋白质图谱很不完整,经常会忽略那些在生命过程中发挥重要功能的微量活性分子。
解决方案包括增加上样量、对样品进行分级纯化从而富集低丰度蛋白、采用更高灵敏度的显色方法,
如同位素标记等;(3) 电泳过程的完善:不同厂家,不同pH值范围的胶条都配有相应的样品处理方法及样品处理液,电泳参数可以预先设置并自动完成,这些都使电泳质量能得到保证,重复性也得到提高;Herbert等对电泳过程中的烷基化操作进行了详尽的研究,认为在样品制备时就应该完成烷基化作用,而不是在一向至二向之间的平衡阶段完成,这样有利于消除蛋白聚合物在碱性区域的产生并促进碱性蛋白的分离。
2 蛋白质组学的质谱技术
质谱技术的基本原理是样品分子离子化后,根据不同离子间的质荷比(m/z)在真空系统中飞行速度的差异来分离并确定其分子量。
它可以在数秒内打断肽段,并保持极高的灵敏度,而且操作简便。
离子化技术的方法主要有两种,均为软离子法,一是采用基质辅助的激光解吸离子化(Matrix assisted laser desorptionionization,MALDI),即样品分子电离时, 保留整个分子的完整性, 不会形成碎片离子。
MALDI结合时间飞行检测器(Time of Flight, TOF)成为MALDI-TOF,是生物质谱技术的常用方法,通常被称为肽质量指纹图谱(PMF);另一种为电喷雾离子化(Electrospray ionization,ESI),此法由离子谱推得多肽的氨基酸序列, 并依据这些氨基酸序列进行蛋白质鉴定, 因此较肽质量指纹分析鉴定更准确、可靠。
上世纪90年代末期在以上离子化技术基础上, 将两个或更多的质量分析仪被组合起来,如MALDI-Q-TOF[11]、MALDI-TOF-TOF、MALDI/nano-LC-Q-TOF的出现,使质谱得到更好的质量精度、分辨率和灵敏度。
(1)MALDI-TOF-MS
基体辅助激光解析电离(MALDI)是由德国科学家Karas和Hillen Kamp发现的,它采用短激光脉冲(1-10ns)使样品分子离子化,导致蛋白质的电离和气化电离,然后由高电压将电离的蛋白质从离子源转送到质量分析器内,样品的离子化需要样品与基体混合(1:1000-1:10000为合适摩尔比)形成共结晶薄膜,基体吸收了激光的能量跃迁到激发态, 产生的质子转移到生物分子上,从而使生物分子电离。
样品离子在电场作用下加速飞过飞行管道,根据到达飞行时间检测器(Time of Flight, TOF )的飞行时间不同而被检测。
常用的基体有2, 5二羟基苯甲酸(2,5-dihydroxybenzoic acid, DHB)、α-氰基-4-羟基肉桂酸(α
-Cyano-4-hydroxy-cinnamic acid,α-CAHC)和芥子酸(sinapinic acid, SA)等[15]。
MALDI-TOF-MS可用于分子量的测定、肽质量指纹分析图谱的检测、多糖、多肽氨基酸序列信息或者寡核苷酸的分析等多用途,质量准确度可高达几个ppm,具有很高的灵敏度,可达fmol级或者更低,同时能耐受一定量的小分子,像盐、去污剂等。
近年来在MALDI中引入的脉冲抽取即延迟抽取(delayed extraction, DE)技术与反射型的MALDI-TOF-MS技术结合起来,大大的提高了分辨率,分子量检测也相当准确。
反射式MALDI-TOF-MS中利用源后衰变分析(Post Source decay, PSD)检测源后分解碎片离子或者碰撞诱导解离(CID)可以获得多肽氨基酸序列,从而提高了蛋白质鉴定的可信度,成为除了串联质谱(MS/MS)测序以外的另一个质谱测序方式。
(2)ESI-MS
电喷雾(electrospray ionization,ESI)也是一种软电离技术,它将利用样品溶液通过带有高压的毛细管或喷雾针时产生电离,在强电场作用下,样品溶液形成带电荷的电喷雾。
当雾滴在大气压下蒸发时,随着溶剂的蒸发,由于液滴直径变小,液滴表面电荷密度增加,当液滴表面电荷达到一定程度时,液滴崩解,如此循环,从而完全蒸发形成离子。
生成的气相离子进入质量检测器,测出它们的质/荷比,敏感度为fmol—pmol, 质量准确度达0.01%,能更为准确地测定分子量。
但是ESI-MS易受盐类的干扰,盐类的存在除了造成电喷雾现象不稳定、背景信噪高、分析物离子信号减弱或消失以外,也易和分析物分子形成加和离子造成质谱图谱阅读的困难。
近年来ESI-MS引入了纳米级电雾源(Nano-electorsprayt ionization source, NanoESI, 纳升流速), NanoESI不仅提高了分析的灵敏度, 而且少至0.5µL的样品溶液,可得到30-40分钟的稳定喷雾,它最大的进展是与其他分离仪器一起联用形成串联质谱。
(3)串联质谱(MS/MS)
单独的MALDI-TOF-MS或ESI-MS应用有一定的限制,它们无法鉴定多个蛋白混合,而多个高效分离手段与质谱仪器串联形成的MS/MS系列,具有比一般质谱更高的灵敏度、分辨率和质量准确度并具有更多的功能。
它通过离子在运动过程中发生的质量或电荷的变化,选择一定质量的离子通过一级质谱(MS1),使
其进入碰撞室,与室内的碰撞气体(常用气体为He,Ar,Xe,CH4等)进行碰撞诱导裂解(collision-induced dissociation,CID),发生离子-分子碰撞反应,产生子离子,再经第二级质谱(MS2)分析母离子和子离子的关系,从而获得碎裂过程的信息,推测多肽的一级结构等信息。
最常用的分析器是单级四极杆分析器和三级四极分析器(Triple Quatrupole Analyzer)。
电喷雾四极杆飞行时间串联质谱仪nanoESI-MS/MS(Q-TOF2)是英国Waters 公司生产的新型串联质谱仪Q-TOF系列的第二代,离子源为电喷雾源,一级质谱是四极杆,主要起选择离子的作用,二级质谱为飞行时间质谱,是该仪器的主要质量分析器。
它能够对蛋白质进行测序,具有强大的De-novo测序功能,应用ESI MS/MS测定多肽的氨基酸序列, 是对Edman降解反应测序的最好补充, 它能测定Edman降解反应所不能测的修饰氨基酸和封闭的N末端,在分析蛋白质翻译后的修饰时十分有效。
此外串联质谱与HPLC、毛细管区带电泳(capillary zone electrophoresis,CZE)等高效分离手段相结合,也可以很好地分析复杂样品,HPLC 与串联质谱的联用可以解决双向电泳对疏水性蛋白分离效果差的问题,具有很好的应用前景。
但是串联质谱仪器十分昂贵,目前还无法普遍使用。
近年Medzihradszky等介绍了把两个飞行时间质量分析器串联在一起的MALDI-TOF/TOF质谱,其工作原理是样品离子在MALDI源中产生并被加速和聚焦,然后进入第二级TOF重新被加速并被分析。
它具有MALDI-Q-TOF的许多优点,除了鉴定蛋白质分子量、PMF、翻译后修饰、序列测定、De-novo鉴定以外,还具有更高的灵敏度、分辨功能、高质量准确度和高速度扫描率,可以实现工业化的蛋白质组分析。
而且MALDI-TOF/TOF具有高能CID提供大量结构信息,大大增强了蛋白质鉴定的可靠性,理论上没有分子量限制的优点使能测大分子量或者完整的蛋白质分子成为可能,MALDI-TOF/TOF的发展使质谱真正发展为高通量的蛋白质测序工具。
(4)肽序列测定技术
蛋白质一般由20种常见氨基酸组成,根据概率计算,一个特定的4个氨基酸序列出现概率的为1/160000,因此对于某个蛋白来说,确定4个以上氨基酸残基序列片断就已具有很高的特异性。
基于这个原理,质谱技术通过2种方法进行肽序列的测定,一个是利用串联质谱或具有PSD功能的反射式MALDI-TOF-MS中
获得多肽氨基酸序列,然后在数据库中搜寻的肽序列标签(Peptide sequence tag,PST)技术;另一个是通过质谱分析末端酶解或化学降解,产生一组相互之间差一个氨基酸残基的蛋白质样品,根据其中分子量差值来确定氨基酸序列的肽阶梯序列(Peptide ladder sequence) 技术。
3 蛋白质组生物信息学的发展
对于蛋白质组学研究来说,生物信息学技术是其最终能否实现高通量并获得结果的关键。
生物信息学的研究主要包括两个方面:各种数据库的建立和完善以及如何利用这些数据库中庞大的信息。
基因组计划的实施实现了对人及多种模式动物的整体基因序列及很大一部分功能基因序列的了解。
在极大丰富了人们对生命本质问题认识的同时,促进了大规模国际生物信息数据库的出现和发展。
分子生物信息数据库的种类繁多,可归纳为4类:即基因组数据库、核酸和蛋白质一级结构序列数据库、生物大分子三维空间结构数据库以及由前三类数据库和文献资料为基础构建的二次数据库。
一次数据库数据量大、更新速度快、用户面广,而二次数据库容量小很多,往往是针对不同问题开发的具有特殊生物学意义和专门用途的数据库。
目前主要的国际数据库包括美国的Genbank、欧洲的EMBL、日本的DDBJ和瑞士的蛋白质序列数据库SwissProt, 分别由美国国家生物技术信息中心(NCBI)、英国剑桥欧洲生物信息学研究所(EBI)、日本国家遗传学研究院(NIG)和瑞士生物信息研究所(SIB)负责管理、维护和运行。
除了核酸序列数据库外,前3个信息中心同时负责管理和维护蛋白质序列、蛋白质结构及生物医学文献等各种数据库,为世界各国的科学家提供生物信息资源服务。
我国北京大学生物信息中心,负责欧洲分子生物学网络组织中中国节点的建设、运行和管理以及对生物信息的研究、开发和利用。
生物学数据库除了在种类和数量上的急剧增长外,其复杂程度也在不断增加,但数据库的管理和使用却越来越简捷。
现在大多数数据库能实现自动投送数据、在线查询、在线计算和空间结构的可视化浏览等多种功能。
如何对这些数据库加以利用是生物信息学的另一个方面,这主要是通过开发出各种计算机应用程序,通过日益发展的互联网对数据库信息进行分析处理。
数据库的主要应用可分为数据库查询和数据库搜索两个方面:前者指对序列、结
构以及各种二次数据库中的注释信息进行关键词匹配查找;后者指通过特定的序列相似性比对算法,找出核酸或蛋白质序列数据库中与检测序列具有一定程度相似性的序列。
数据库查询系统主要有NCBI的Entrez和SRS,它们为生物学研究提供了一个重要工具,在实际工作中经常使用。
而在前面提到过的PMF检索及肽序列信息最终都是通过对数据库的搜索才能得到鉴定结果。
此外,通过数据库的搜索,还可以对蛋白质的功能、蛋白质的分子结构、蛋白质的分布、物种间的亲缘进化关系等多个方面进行研究。
数据库搜索的基础是序列的相似性比对,BLAST是目前常用的数据库搜索程序。