核酸测序技术的回顾与展望
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
核酸测序技术的回顾与展望
卢辰蔬菜学2009305010014
摘要
在过去的30多年中,核酸(包括DNA和RNA)测序技术,作为最重要的分子生物学研究手段之一,经历了多次技术突破,数据产出能力呈指数增长,并且测序技术本身也演变成为生物工程和物理学的新技术增长点。本文回顾了从第一代Sanger测序到下一代测序的技术特点和应用,并对即将投入应用的第三代测序技术进行了前瞻性的展望。
关键词:核酸测序下一代测序
Abstract
As one of the most important tools of molecular biology, the nucleic acid (including DNA and RNA) sequencing technology has experienced several breakthroughs in the past three decades. The sequencing technology has not only been improving its productivity in the exponential growth rate but also been evolving into a new layout of technological territories toward bioengineering and physical disciplines. This view look into the technical characteristics and applications from Sanger sequencing to the next generation sequencing, and provide prospective insights into the third generation sequencing.
Keywords: Nucleic acids sequencing, next generation sequencing
现代生物学的核心问题之一,就是遗传信息的传递、表达及其调控。为了理解这个问题,获得遗传信息的携带者——核酸(DNA和RNA)的具体序列,就显得尤为重要。因此,核酸测序技术也就顺理成章地成为分子生物学的核心研究手段之一。
上世纪70年代中期,Frederick Sanger发明了末端终止测序技术,因此获得1980年诺贝尔化学奖。随即,基于Sanger法的第一代自动化测序技术被开发出来,人们终于可以大批量地深入了解生物遗传的密码。
近40年来,测序技术领域发生了翻天覆地的变化,测序通量的升级速率,犹如半导体工业的摩尔定律(Moore’s Law)一般呈指数级地增长。测序技术的高速发展,海量涌现的序列数据,改变了整个生命科学领域的研究方式,并推动了基因组学、生物信息学、系统生物学、合成生物学等等一系列学科的创立和发展。而这些学科的发展,又需要更加强大的测序技术来提供更多更精确的数据加以支持,反过来也激励了相关技术理论和工程实践的进一步发展。
无论哪种测序技术,基本都可以被认为是模板制备,读取碱基信息和显示,以及数据分析这几个部分的组合。本文根据国际上通行的世代划分,对测序技术的发展历程及其应用进行回顾和展望。
I 第1代测序技术——Sanger末端标记法
第1代测序技术,都是基于Sanger发明的人工末端标记法(Sanger, 1988)。其主要思路是在待测序列的一端加上统一的测序接头,用放射性同位素标记根据接头设计的引物,然后由此开始延伸待测序列。这个过程要进行四套独立的反应,每套反应中分别加入四种双脱氧核苷三磷酸(ddNTP) 中的一种。由于ddNTP缺乏延伸所必要的3’-OH,这样每套反应中延长的寡聚核苷酸链就会选择性地在不同的A、C、G、T处终止,得到一组长度不同的链终止产物。然后利用高分辨率的变性凝胶电泳在
四个泳道中分离各个片段,通过读取放射自显影显示的不同长度片段就可获得每个位置上的碱基信息。
1.1 最早版本的自动化测序技术
20世纪80年代中期,加州理工学院的Leroy Hood研究组在Sanger法的基础上发明了最早版本的第1代测序仪,最大的改进就是不再在引物上进行同位素标记,而是采用不同颜色的荧光基团直接标记不同的ddNTP,这样在一个反应体系中就可以同时进行四种末端终止反应,然后采用聚丙酰胺凝胶电泳分离,通过计算机来读取并分析荧光信号。第二年,ABI公司采用这个技术推出了第一款半自动DNA测序仪ABI 370,并迅速推广开来。
1.2 改进后的第1代测序技术
上世纪末,在第1版技术基础上上,研究者采用紧凑的毛细管电泳代替了平板电泳,采用自动上样,大大降低了试剂的消耗,同时测序进程的并行化程度也随之大幅提升。采用这种改进版技术的ABI 3730和Amersham Mega-BACE等测序仪终于实现了测序的完全自动化,并在最早开展的几个物种全基因组测序计划,尤其人类基因组计划的后期阶段起到了关键作用。
经过二十年的逐步改进,第1代测序仪的读长可以超过1,000 bp,原始数据的准确率可以达到99.999%,每千碱基序列的成本是0.5美元,每台测序仪的数据通量可以达到6×105bp/day。但是由于第1代测序技术对电泳分离技术的依赖,很难再进一步提升分析速率和并行化程度,其发展已经到达了极限。
当然,第1代测序技术经过多年的考验,在低通量常规测序,比如PCR产物测序、质粒和细菌人工染色体的末端测序等等方面还将会继续得到广泛应用。
II 第2代测序技术——微阵列循环合成法
随着现代生物学的发展,研究者对测序通量的要求越来越高。为了满足这样的要求,人们开发出了多种多样的下一代测序技术(next-generation sequencing, NGS)。尽管这些技术的生化基础和实现手段各有千秋,但是其基本思想都是采用矩阵结构的微阵列形式,实现样品的微量化和处理的大规模并行化。大概的测序流程也大同小异,首先制备测序对象模板文库,在双链片段两端连接上接头序列,变性得到单链模板,固定到反应介质上,对样本文库进行扩增,然后开始测序反应,在测序反应进行的过程中通过显微设备观测并记录连续循环反应中的光学信号,来获得每个位置上的碱基信息(Metzker, 2010)。
相比第1代测序技术,NGS有下列几个显著特点:第一,微阵列形式可以实现大规模并行化。第二,不采用电泳,样本和试剂的消耗大大降低,设备也易于微型化。第三,由于对序列信息的获取是直接读取反应中的光学信号,因此从理论上说,检测独立光学事件所需要的波长,即光的衍射极限,才是并行化程度的极限。
2.1 目前已经应用的下一代测序技术
NGS技术在上世纪90年代末就已经研发出来,而在2005年之后纷纷投入实际使用。其中Roche 454,Illumina Solexa和Life/APG’s SOLiD三种是大规模商业化应用最为广泛的,此外还有一些未能得到普遍应用的。
2.1.1 Roche 454
Roche公司的454测序仪利用微乳滴PCR (emulsion PCR, emPCR) 扩增单链文库片段,采用焦磷酸法来进行测序。
首先将已经固化了引物的玻璃微球和单链文库模板与脱氧核苷三磷酸(dNTP)、聚合酶等PCR反应体系必要化合物一起混合,微球和文库片段按一定比例确保大多数微球结合的单链核酸分子不超过