DNA测序技术比较_刘振波
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1第1代测序技术
1954年,Whitfeld等用化学降解法测定多聚核糖核苷酸序列[3],是关于DNA测序技术的较早报道。1977年,Sanger发明DNA双脱氧核苷酸末端终止测序法(chain terminator sequencing),A.M. Maxam和W.Gilbert发明DNA化学降解测序法(chemical degradation sequencing),2项技术的出现,标志第1代测序技术诞生[1,2]。
Sanger测序法的原理如下:每一次DNA测序反应都由4个独立反应组成,由于DNA双链中核苷酸以3′,5′-磷酸二酯键相连,因此在测序过程中掺入2′,3′-双脱氧核苷三磷酸——
—ddNTP(不含3′-OH),当ddNTP位于DNA双链的延伸末端时,无羟基3′端不能与其他脱氧核苷酸形成3′,5′-磷酸二酯键,因此,DNA双链合成便终止,若在终止位点掺入ddATP,则新生链末端为A,若掺入ddTTP、ddCTP、ddGTP,相应地,新生链末端则是T、C或G。该测序技术的具体做法如下:将模板、引物、4种dNTP(其中含有一种为放射性同位素标记的核苷酸)与DNA聚合酶共同保温,形成的混合物包含许多长短不一的片段,最后利用聚丙烯酰胺变性凝胶电泳(SDS-PAGE)分离该混合物,得到放射性同位素自显影条带图谱,人们依据凝胶电泳图即可读出DNA双链的碱基序列组成(图1)。Sanger测序技术操作快速、简单,因此应用较广泛,例如,人类基因组测序正是基于该技术而完成[4]。DNA测序技术的出现,不但为人类对植物、动物和微生物进行基因改造的研究提供科学依据,而且在医学方面,对疾病诊断、治疗和研究具有重要价值。
图1第1代测序技术流程
(图1来源于)
DNA测序技术比较
刘振波(内蒙古自治区赤峰市教育局教学研究中心内蒙古赤峰024000)
摘要自从1953年,J.D.Watson和F.H.C.Crick发现DNA的双螺旋模型之后,DNA测序技术随着科学的进步得到了迅猛发展。1977年Sanger[1]发明DNA双脱氧末端终止测序技术,Maxam与Gilbert[2]发明利用化学降解法进行测序的技术,2种测序技术被誉为DNA测序技术的始祖。随后,在第1代DNA测序技术的基础上,相继出现了第2代测序技术、基因芯片技术以及第3代测序技术。总结并展望了每一代测序技术及基因芯片技术的诞生、原理及应用前景,为利用测序技术研究基因表达提供理论基础和实验依据。
关键词DNA测序技术第2代测序技术第3代测序技术基因芯片
中国图书分类号:Q-33文献标识码:A
与Sanger法有所不同,Maxam-Gilbert化学降解法[2]侧重对DNA双链进行化学降解:将DNA 片段的5′端磷酸基团做放射性同位素标记后,采用不同的化学方法修饰并裂解特定碱基,产生一系列长度不同的5′端被标记的DNA片段,最后,通过凝胶电泳方法将片段群分离,经同位素放射性自显影,确定各片段末端的碱基,最终得到目的DNA的碱基组成。该测序技术重复性较高,所需要的化学试剂简单,不需进行酶的催化反应,还可对未经克隆的DNA片段进行直接测序,因此,可利用Maxam-Gilbert法进行表观遗传学方面的研究,即能够分析DNA的甲基化修饰等情况。
2第2代测序技术
进入21世纪以来,伴随着科技的进步,第2代测序技术问世:以454测序平台(Roche公司)[5]、Solexa测序平台(Illumina公司)[6]和SOLiD测序平台(ABI公司)[7]为标志。第2代测序技术原理是边合成边测序,所以被誉为“下一代测序技术”:即依照第1代Sanger测序技术的原型,利用测序仪器捕捉新掺入的末端荧光标记来确定DNA序列组成[8]。
第2代测序技术相比第1代测序技术精准性更高,并大幅度降低了测序成本,提高了测序速度,使科学家从宏观揭示所研究物种的基因组成和基因表达情况成为可能。上述所提的3个测序技术平台各有优点:454测序平台得到的片段能够达到400bp,并且读长的质量高;Solexa测序平台的性价比最高[9],在数据量相同的情况下,测序成本仅为454测序平台的1/10;SOLiD测序平台准确度能够达到99.94%,在片段覆盖率为15×时,测序准确度可接近100%(图2)。
图2第2代测序技术流程
(图2来源于)
现以Solexa测序平台为例,详细说明测序过程如下:2.1测序文库的构建(library construction)将样品DNA(或RNA)随机片段化,形成长度为几百个碱基的片段或更短的片段,之后在片段两端加特定的接头(adaptor),值得注意的是:片段的大小直接关系到后续数据的分析,乃至科学家们将数据与生物学现象联系的准确度。
2.2锚定桥接(surface attachment and bridge am-plification)测序过程在微流量池(flow cell)中进行,每个flow cell含有8个单元通道(lane),每个lane的内表面含有无数个被固定的单链接头。2.3预扩增(denaturation and complete amplifica tion)利用固相桥式PCR(bridge solid phase PCR)进行扩增:添加没有被标记的dNTP和Taq酶,即能够得到固相表面上大约百万条双链待测目的片段,这些片段成簇分布。
2.4单碱基延伸测序(single base extension and sequencing)根据掺入荧光标记的dNTP在测序簇延伸其互补链时,能够释放出相应的荧光,测序仪据此就能捕捉荧光信号,之后计算机可以将荧光信号转化为不同颜色的测序峰图,使研究者能够获得待测片段的序列信息[10]。
2.5数据分析(data analyzing)通过构建重叠群(contigs)分析测序数据。重叠群,即将含有STS序列标签位点的基因片段分别进行测序,通过重叠分析,最终得到完整的染色体基因组序列信息。测序得到的原始序列长度只有几十个碱基,需要通过生物信息学分析将这些原始序列组装成较长的重叠群或者脚手架结构乃至整个基因组的框架结构,将组装的序列信息比对到已有的全基因组信息或与测序物种相近的物种基因组数据库中,分析得到有生物学意义的结果[11]。
由于第2代测序技术的高通量性,成为目前开展物种测序生产化的主要平台。例如,应用第2代测序技术完成测序的物种主要有大熊猫、马铃薯、棉花等,为进入宏观基因组学和后基因组学研究阶段提供保证。在人类疾病研究方面,加拿大英属哥伦比亚癌症研究中心Huntsman等,应用Illu-mina公司测序平台Genome Analyzer II对粒层细胞瘤GCTs进行研究:对成年的GCTs的4个全转录组双末端进行测序,将得到的数据、已发表的人类基因组、11个上皮卵巢肿瘤以及SNP数据库进行Blast比对,发现在卵巢粒层细胞发育过程中,
DNA模板文库制备~随机
~配对末端DNA片段固定
~平面或微球
~共价或非共价
DNA片段单分子扩增
~微乳液PCR
~DNA簇
序列拼接,组装光学图像采集与处理
~荧光
~化学发光
并行测序反应
~碱基延伸
~连接