picbio 三代测序原理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
三代测序之PacBio SMRT技术全解析2017-05-11 11:29 来源:基因谷技术
气温回升,天气渐暖,
花儿开了一簇又一簇~
在这美好的季节里,
我们准备聊点新话题。
今天小编要来和你分享:
PacBio SMRT测序那些事儿~
测序技术在近几年中又有里程碑的发展,Pacific Biosciences公司成功推出商业化的第三代测序仪平台,让三代测序正式走入我们的视线。与前两代相比,第三代测序有什么不同呢?今天小编带大家详细了解测序界新宠-PacBio SMRT测序平台。
PacBio SMRT测序原理
Pacific Biosciences公司研发的单分子实时测序系统(Single Molecule Real Time,SMRT)应用了边合成边测序的原理,并以SMRT芯片为测序载体。基本原理如下:
聚合酶捕获文库DNA序列,锚定在零模波导孔底部
4种不同荧光标记的dNTP随机进入零模波导孔底部
荧光dNTP被激光照射,发出荧光,检测荧光
荧光dNTP与DNA模板的碱基匹配,在酶的作用下合成一个碱基
统计荧光信号存在时间长短,区分匹配碱基与游离碱基,获得DNA序列
酶反应过程中,一方面使链延伸,另一方面使dNTP上的荧光基团脱落
聚合反应持续进行,测序同时持续进行
PacBio SMRT测序原理
PacBio SMRT的单分子测序和超长读长是如何实现的?我们重点看一下该技术的两点关键创新:分别是零模波导孔(zero-mode waveguides, ZMWs)和荧光标记在核苷酸焦磷酸链上(Phospholinked nucleotides)。
SMRT Cell含有纳米级的零模波导孔,每个ZMW都能够包含一个DNA聚合酶及一条DNA样品链进行单分子测序,并实时检测插入碱基的荧光信号。ZMW是一个直径只有10~50 nm的孔,当激光打在ZMW底部时,只能照亮很小的区域,DNA聚合酶就被固定在这个区域。只有在这个区域内,碱基携带的荧光基团被激活从而被检测到,大幅地降低了背景荧光干扰。
SMRT Cell和ZMWs
将荧光染料标记在核苷酸的磷酸链而不是碱基上,当核苷酸掺入到新生的链中,标记基团就会自动脱落,减少了DNA合成的空间位阻,维持DNA链连续合成,延长了测序读长。SMRT测序最大限度地保持了聚合酶的活性,是最接近天然状态的聚合酶反应体系。
荧光标记在焦磷酸链上的核苷酸
PacBio SMRT测序送样要求
PacBio SMRT测序建库流程
DNA打断之后,经过末端修复、接头连接、片段筛选、杂交测序引物和聚合酶绑定,即可出库准备上机测序,建库过程无PCR反应。
PacBio SMRT建库流程
PacBio SMRT技术特点
PacBio SMRT技术有两种测序平台,RSⅡ和Sequel,应该如何选择?小编已将二者的对比表准备好啦~ 表3 RSⅡ和Sequel测序平台比较
Sequel平台与RSII平台相比具有很大的优势,Sequel平台测序通量高、单Gb数据成本低、周期短。
1.第三代基因测序技术又被为"Single Molecule Real Time (SMRT™) DNA
Sequencing"(单分子实时DNA测序技术),该方法基于纳米孔的单分子读取技术,不需要扩增即可快速读取序列。目前,Pacific Biosciences 公司已经成功推出了商业化的第三代测序仪PacBio RS平台,使得第三代测序正式走入人们的视角。
PacBio RS II是Pacific Biosciences公司研发的单分子实时测序系统(Single Molecule Real Time, SMRT),其专利的SMRT Cell含有15,0 00个纳米级的零模波导孔(zero-mode waveguides, ZMWs),每个ZMW 都能够包含一个DNA聚合酶及一条DNA样品链进行单分子测序,并实时检测插入碱基的荧光信号。
2. 2
技术特点
ü利用测序过程聚合酶反应的动力学变化,首次实现对碱基修饰进行直接测序。
ü超长的读长:平均测序读长能达到7,000-8,000bp,最长读长能达到3,0000bp;
ü准确率高:对基因组组装和基因组变异检测,可以最多达到99.999%的准确率;
ü敏感性强:可以检测频率在0.1%的minor variants;
ü无PCR扩增偏好性:样本不需要进行PCR扩增,避免了覆盖度不均一和PCR artifacts;
ü最小的GC偏好性(GC bias):在极端高GC和极端低GC区域,可以轻松测定,从而保证序列的均匀覆盖度。
3. 3
数据产出
试剂盒平均读长数据量/SM RT Cell
P4-C2 Chemistry 5.5-6Kb ~200Mb
P5-C3 Chemistry 8-10Kb ~250Mb
4. 4
应用领域
(1)全基因组de novo测序
与二代测序最高不超过1kb的读长相比,PacBio RS II的长读长将有效解决短序列数据的拼接难题。同时,与二代测序的模板样品需要扩增相比,PacBio RS II无需扩增可直接对单个分子进行测序,有效避免了PCR扩
增偏好性和GC偏好性,PacBio RS II可轻松跨越GC含量异常(过高或过低)及高度序列重复的区域,实现序列覆盖的完整性和均一性。
(2)基因组草图的优化或基因组完成图绘制
对前期已开展测序的动植物、微生物基因组结合三代长读长测序数据进行完善和提升。针对前期已经开展全基因组测序,获得基因组草图的动植物、微生物等,可以结合PacBio RS II平台长读长reads进行补充,从而快速获得前期没有测得的信息及提升基因组的完整度。另外还可以针对前期没有检测获得的结构变异信息(structural-variation events)、串联重复序列信息(tandem duplication)、易位信息(Inversion)等。尤其在微生物基因组完成图的绘制中,可在一天之内、成本低于$1,000即可将基因组完善获得0 gap contig。
(3)全长转录本测序
PacBio RS II的长读长可实现全长转录本测序,并使基因可变剪接形式的识别成为可能,因此可以对新基因及其isoform进行更全面的研究。同时,长读长不再需要对RNA-Seq的reads进行组装,因此可以更完整的对基因模型和转录的基因进行更全面的注释,用以改进参考基因组中的基因注释信息。
(4)宏基因组测序
长读长reads能够更为精准地鉴定水体、土壤、肠道等生境中微生物的种类的鉴定,能够更加快捷地获得更多微生物种的全基因组序列。
(5)16S rDNA全长测序
PacBio RS II的平均读长为8-10Kb,而16S rDNA长度大约为1540bp,因此结合该平台测序可以成功测序获得16S的全长序列。
(6)细胞器基因组测序
叶绿体基因组和线粒体基因组序列都包含重复序列、反向重复序列等复杂结构,PacBio RS II的长读长可直接跨越这些区域获得这些细胞器的全