picbio 三代测序原理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

三代测序之PacBio SMRT技术全解析2017-05-11 11:29 来源:基因谷技术

气温回升,天气渐暖,

花儿开了一簇又一簇~

在这美好的季节里,

我们准备聊点新话题。

今天小编要来和你分享:

PacBio SMRT测序那些事儿~

测序技术在近几年中又有里程碑的发展,Pacific Biosciences公司成功推出商业化的第三代测序仪平台,让三代测序正式走入我们的视线。与前两代相比,第三代测序有什么不同呢?今天小编带大家详细了解测序界新宠-PacBio SMRT测序平台。

PacBio SMRT测序原理

Pacific Biosciences公司研发的单分子实时测序系统(Single Molecule Real Time,SMRT)应用了边合成边测序的原理,并以SMRT芯片为测序载体。基本原理如下:

聚合酶捕获文库DNA序列,锚定在零模波导孔底部

4种不同荧光标记的dNTP随机进入零模波导孔底部

荧光dNTP被激光照射,发出荧光,检测荧光

荧光dNTP与DNA模板的碱基匹配,在酶的作用下合成一个碱基

统计荧光信号存在时间长短,区分匹配碱基与游离碱基,获得DNA序列

酶反应过程中,一方面使链延伸,另一方面使dNTP上的荧光基团脱落

聚合反应持续进行,测序同时持续进行

PacBio SMRT测序原理

PacBio SMRT的单分子测序和超长读长是如何实现的?我们重点看一下该技术的两点关键创新:分别是零模波导孔(zero-mode waveguides, ZMWs)和荧光标记在核苷酸焦磷酸链上(Phospholinked nucleotides)。

SMRT Cell含有纳米级的零模波导孔,每个ZMW都能够包含一个DNA聚合酶及一条DNA样品链进行单分子测序,并实时检测插入碱基的荧光信号。ZMW是一个直径只有10~50 nm的孔,当激光打在ZMW底部时,只能照亮很小的区域,DNA聚合酶就被固定在这个区域。只有在这个区域内,碱基携带的荧光基团被激活从而被检测到,大幅地降低了背景荧光干扰。

SMRT Cell和ZMWs

将荧光染料标记在核苷酸的磷酸链而不是碱基上,当核苷酸掺入到新生的链中,标记基团就会自动脱落,减少了DNA合成的空间位阻,维持DNA链连续合成,延长了测序读长。SMRT测序最大限度地保持了聚合酶的活性,是最接近天然状态的聚合酶反应体系。

荧光标记在焦磷酸链上的核苷酸

PacBio SMRT测序送样要求

PacBio SMRT测序建库流程

DNA打断之后,经过末端修复、接头连接、片段筛选、杂交测序引物和聚合酶绑定,即可出库准备上机测序,建库过程无PCR反应。

PacBio SMRT建库流程

PacBio SMRT技术特点

PacBio SMRT技术有两种测序平台,RSⅡ和Sequel,应该如何选择?小编已将二者的对比表准备好啦~ 表3 RSⅡ和Sequel测序平台比较

Sequel平台与RSII平台相比具有很大的优势,Sequel平台测序通量高、单Gb数据成本低、周期短。

1.第三代基因测序技术又被为"Single Molecule Real Time (SMRT™) DNA

Sequencing"(单分子实时DNA测序技术),该方法基于纳米孔的单分子读取技术,不需要扩增即可快速读取序列。目前,Pacific Biosciences 公司已经成功推出了商业化的第三代测序仪PacBio RS平台,使得第三代测序正式走入人们的视角。

PacBio RS II是Pacific Biosciences公司研发的单分子实时测序系统(Single Molecule Real Time, SMRT),其专利的SMRT Cell含有15,0 00个纳米级的零模波导孔(zero-mode waveguides, ZMWs),每个ZMW 都能够包含一个DNA聚合酶及一条DNA样品链进行单分子测序,并实时检测插入碱基的荧光信号。

2. 2

技术特点

ü利用测序过程聚合酶反应的动力学变化,首次实现对碱基修饰进行直接测序。

ü超长的读长:平均测序读长能达到7,000-8,000bp,最长读长能达到3,0000bp;

ü准确率高:对基因组组装和基因组变异检测,可以最多达到99.999%的准确率;

ü敏感性强:可以检测频率在0.1%的minor variants;

ü无PCR扩增偏好性:样本不需要进行PCR扩增,避免了覆盖度不均一和PCR artifacts;

ü最小的GC偏好性(GC bias):在极端高GC和极端低GC区域,可以轻松测定,从而保证序列的均匀覆盖度。

3. 3

数据产出

试剂盒平均读长数据量/SM RT Cell

P4-C2 Chemistry 5.5-6Kb ~200Mb

P5-C3 Chemistry 8-10Kb ~250Mb

4. 4

应用领域

(1)全基因组de novo测序

与二代测序最高不超过1kb的读长相比,PacBio RS II的长读长将有效解决短序列数据的拼接难题。同时,与二代测序的模板样品需要扩增相比,PacBio RS II无需扩增可直接对单个分子进行测序,有效避免了PCR扩

增偏好性和GC偏好性,PacBio RS II可轻松跨越GC含量异常(过高或过低)及高度序列重复的区域,实现序列覆盖的完整性和均一性。

(2)基因组草图的优化或基因组完成图绘制

对前期已开展测序的动植物、微生物基因组结合三代长读长测序数据进行完善和提升。针对前期已经开展全基因组测序,获得基因组草图的动植物、微生物等,可以结合PacBio RS II平台长读长reads进行补充,从而快速获得前期没有测得的信息及提升基因组的完整度。另外还可以针对前期没有检测获得的结构变异信息(structural-variation events)、串联重复序列信息(tandem duplication)、易位信息(Inversion)等。尤其在微生物基因组完成图的绘制中,可在一天之内、成本低于$1,000即可将基因组完善获得0 gap contig。

(3)全长转录本测序

PacBio RS II的长读长可实现全长转录本测序,并使基因可变剪接形式的识别成为可能,因此可以对新基因及其isoform进行更全面的研究。同时,长读长不再需要对RNA-Seq的reads进行组装,因此可以更完整的对基因模型和转录的基因进行更全面的注释,用以改进参考基因组中的基因注释信息。

(4)宏基因组测序

长读长reads能够更为精准地鉴定水体、土壤、肠道等生境中微生物的种类的鉴定,能够更加快捷地获得更多微生物种的全基因组序列。

(5)16S rDNA全长测序

PacBio RS II的平均读长为8-10Kb,而16S rDNA长度大约为1540bp,因此结合该平台测序可以成功测序获得16S的全长序列。

(6)细胞器基因组测序

叶绿体基因组和线粒体基因组序列都包含重复序列、反向重复序列等复杂结构,PacBio RS II的长读长可直接跨越这些区域获得这些细胞器的全

相关文档
最新文档