第三代测序技术单分子即时测序
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三代测序技术:单分子即时测序
・718・
第三代测序技术:单分子即时测序
刘岩吴秉铨
DNA测序技术是分子生物学研究中最常用的技术,它的出现极大地推动了生物学的
发展。从人类基因组计划
(humangenomeproject),到人类基因组单倍型图计划
(HapMap),再到人类癌症基因组及个体基因组计划,第一代和第二代DNA
测序技术功不可没。特别是近几年发展起来的第二代DNA测序技术则使得DNA测序进
入了高通量、低成本的时代。目前,基于单分子读取技术的第三代测序技术已经出现,该
技术测定DNA序列更快,并有望进一步降低测序成本,为人类从基因水平深入理解疾病
的发生、发展、诊断和治疗提供新的手段,使个体化医疗成为现实。本文回顾了测序技术
发展过程,并对第三代测序技术的特点和优势进行详细论述。
一、第一代DNA测序(first—generation
DNA
sequencing)
成熟的DNA测序技术始于20世纪70年代中期,1977年Maxam和Gil
bert…报道了通过化学降解测定DNA序列的方法。同一时期,Sanger等拉1
发明了双脱氧链终止法,基本原理是利用4种双脱氧核苷酸(ddNTP)代替脱氧核苷
酸(dNTP)作为底物进行DNA合成反应。一旦ddNTP掺入到DNA链中,由于
核糖的第3位碳原子上不含羟基,不能与下一核苷酸反应形成磷酸二酯键,DNA合成链
的延伸反应被终止,生成了若干长度仅相差单个碱基的DNA片段。在4个DNA合成反
应体系中,分别加入一定比例的带有放射性同位素标记的某种ddNTP,通过单碱基分
辨率的凝胶电泳分离不同长度的DNA片段和放射自显影后,可以根据电泳带的位置确定
待测DNA分子的序列。
20世纪90年代初出现的荧光自动测序技术也是基于Sanger等¨1原理。但
用荧光标记代替同位素标记,并用成像系统自动检测,从而大大提高了DNA测序的速度
和准确性,将DNA测序带入自动化测序的时代,这些技术统称为第一代DNA测序技术。随后,平板电泳分离技术被毛细管电泳所取代,并且通过更高程度的并行化使得同时进行
测序的样本数量成倍增加。目前应用最广泛的ABI3730系列自动测序仪,即是基于
毛细管电泳和荧光标记技术的DNA测序仪,在一次运行中可分析96个样本。
第一代测序技术。在人类基因组计划DNA测序的后期阶段起了关键作用,加速了人
类基因组计划的完成。通过几十年的逐步改进,第一代测序仪的读长可以超过1000bp,原
DOI:10.3760/cma.j.issn.0529-5807.2011.10.022作者单位:100191北京大学医学部病理学系通信作者:吴秉铨。
E-mail:bqwmd@bjmu.edu.ca
万方数据
.综述.
始数据的准确率可以高达99.999%,测定每千碱基长度序列的成本是0.5美元,每天的数据通量可以达到600000
bp。
尽管由于对电泳分离技术的依赖,第一代测序技术在速度和成本方面都已达到了极限,但因其久经考验的准确性和初具规模的市场占有率,第一代测序技术并不会很快退出历史
舞台,它将与新的若干代测序平台并存,特别是在PCR产物测序、质粒和细菌人工染色
体的末端测序以及短串联重复
(shorttandemrepeat,STR)基因分型方面继续发挥重要作用。
二、第二代DNA测序(second-generation
DNA
sequencing)
随着人类基因组计划的完成,后基因组时代,即功能基因组时代已向我们走来。第一
代测序方法已经不能满足深
度测序和重复测序等大规模基因组测序的需求,这促使了第二代测序,又称下一代测
序(next—generationsequencing)的诞生。
第二代测序方法,将基因组DNA用限制性内切酶切割成一定长度范围的DNA片段(即DNA文库),然后在其两侧连上接头,用PCR方法扩增出几百万个拷贝(克隆)
并固定于平板基质上,每个克隆由单个文库片段的多个拷贝组成且可以被同时并行分析。
测序过程根据其原理又可分为两类:聚合酶合成测序"1和连接酶合成测序MJ。前者使
用修饰的DNA聚合酶和标记了光学信号的某种dNTP混合试剂进行单碱基延伸测序反应,后者则是利用DNA连接酶和荧光标记的寡核苷酸探针的混合试剂。每一次反应都包
括混合试
剂掺入一合成链延伸一个碱基一光学信号采集一未反应试剂的洗涤4个步骤,经过这
种重复的掺人一延伸一采集一洗
涤的过程,dNTP标记的光学信号能够通过显微设备观察成像并被不断记录下来,
最后经过计算机分析就可以获得完整的DNA序列信息,是一种边合成、边测序的技术。
第二代测序技术最显著的特征是高通量,一次能对几十万到几百万条DNA片段进行
序列测定,使得对一个物种的转录组(RNA)测序或基因组(DNA)深度测序变得方
便易行”J。该技术已逐步应用于多项人类基因研究,如单核苷酸多态性(singlenucleotide
polymorphism,SNP)研究、小分子
RNA(microRNA,miRNA)以及转录调控研究等。
第二代测序平台主要包括Roche454GS
FLX测序平
台、Solexa
Genome
Analyzer测序平台和ABISOLID测序平
台【64J,并于2005年前后实现商业化,使用第一代Sanger等
的测序技术完成的人类基因组计划,花费了30亿美元巨资,用了3年的时间;然而,使用第二代测序技术,完成一个人的基因组测序只需要1周左右的时间,费用降低到10
万美元
以下。
上述3种第二代测序技术平台各有所长,但亦各有所限。Roche454以焦磷酸
测序为基础,主要优势是它的速度和读长(将近500个碱基),但易出现同聚核苷酸导
致的插入.缺失错误,如5'-GGGG-3’被误读为5'-GGGGG-3’或5’
-GGG-3’。与Roche454相比,Solexa和SOLID拥有更高的通量
和更低的成本,具有识别错误碱基的优点,但序列读长相对较短仍是主要的技术瓶颈,应
运而生的第三代单分子测序技术是解决这一问题的一种方案。
三、第三代DNA测序(third・generation
DNAsequencing)
第三代测序技术,也被称为“下、下一代测序(next-next—