第二代测序技术研究现状
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二代测序技术的发展
生物的遗传信息都储存在其DNA中,解读其DNA的核苷酸序列,对于揭示探索生命奥秘、治疗疾病,以及对整个生物科学乃至医学的发展起到了巨大的推动作用,并具有广阔的应用前景。基因组重测序是相对于全基因组de novo 测序而言的,是借助于第二代测序技术和计算机分析技术,迅速发展起来的,并被生物学家广泛应用的一种测序方法。
第二代测序技术,又称新一代测序技术(next generation sequencing),相对于基于Sanger 法的测序原理,结合荧光标记和毛细管阵列电泳技术来实现测序的自动化的第一代测序技术而得名的。第二代测序技术依据不同的测序原理,主要包括三个平台:Illumina公司的Solexa Genome Analyzer 测序平台、ABI公司的Solid 平台、罗氏454公司的GSFLX测序平台,虽然它们的测序原理不完全相同,但共同的特点是都不需要传统的克隆步骤,实现了更高的通量。与第一代测序技术相比,第二代测序技术不仅保持了高的准确度,而且大大减低了测序成本并极大地提高了测序速度。
1)罗氏454公司的GSFLX测序平台
454测序系统是第二代测序技术中第一个商业化运营的测序平台,它的原理如下:
①待测DNA文库的构建把带测序列用喷雾法(nebulization)打断成300—800bp的小片段并在两段加上不同的接头,或者将待测序列变性后用杂交引物进行PCR扩增,链接载体,构建单链DNA(ssDNA)文库。
②Emulsion PCR 将这些ssDNA与水油膜包被的直径大约28um的磁珠连
在一起孵育、退火,由于磁珠表明含有与接头互补的寡聚核苷酸序列,因此ssDNA 会特异地连接到磁珠上。同时孵育体系中含有PCR反应试剂,因此可以保证每一个与磁珠结合的小片段都会在各自的孵育体系内独立扩增,扩增产物扔可以结合到磁珠上。反应完成后,破坏孵育体系并富集带有DNA的磁珠。经过扩增反应,每一个小片段都将被扩增大约100万倍,从而达到下一步测序反应所需要的模板量。
③测序预先用Bacillus stearothermophilus 聚合酶和单链结合蛋白处理带有DNA的磁珠,然后将磁珠放置在一种叫做PicoTiterPlate(PTP)d平板上。
PTP板上含有很多直径约44um的小孔,每个小孔仅能容纳一个磁珠,通过这种方法固定每个磁珠的位置以监测接下来的测序反应。测序反应采用焦磷酸测序法,将一种含有PTP半山小孔直径更小的磁珠放入小孔,启动测序反应。测序反应以磁珠上大量扩增的ssDNA为模板,每次反应加入一种dNTP进行核查反应。如果这种dNTP能与待测序列配对,则会在合成后释放焦磷酸基团。释放的焦磷酸基团会与反应体系中的ATP硫酸化酶反应形成ATP。生成的ATP和荧光素酶共同氧化体系中的荧光素分子并发出荧光。测序反应产生的荧光信号由放置在PTP板另一侧的CCD照相机记录,再经过计算机分析转换为测序结果。由于每种dNTP在反应中产生的荧光颜色不同,因此可以根据荧光的颜色来确定被测分子的序列。反应结束后,游离的dNTP会在双磷酸酶的作用下降解ATP,导致荧光淬灭,从而使反应体系再生。作为一个反应器,由于PTP板上每个小孔之间相互独立,因而大大降低了反应的干扰和误差。
454技术的主要缺点是无法准确测量同聚物(homopolymer)的长度。例如当待测序列中出现PolyA的情况下,测序反应中会加上多个T,而加入T的数目只能从荧光信号的强度来推测,有可能早晨结果不准确。也正是因为这个原因,454技术主要的错误不是来自核苷酸的替换,而是来自插入或缺失。454技术最大的优势在于较长的读取长度,使得后继的序列拼接工作更加高效、准确。
2)Illumina公司的Solexa Genome Analyzer 测序平台
I llumina/Solexa Genome Analyzer测序于2006年问世,是一种基于Solexa技术的测序系统,其基本原理是边合成边测序。在Sanger等测序方法的基础上,通过技术创新,用不同颜色的荧光标记四种不同的dNTP,当DNA聚合酶合成互补链时,每添加一种dNTP就会释放出不同的荧光,根据捕捉的荧光信号并经过特定的计算机软件处理,从而获得待测DNA的序列信息。其操作流程如下:
①测序文库的构建(Library Construction)首先准备基因组DNA(虽然测序公司要求样品量要达到200ng,但是Gnome Analyzer系统所需的样品量可低至100ng,能应用在很多样品有限的实验中),然后将DNA随机片段化成几百碱基或更短的小片段,并在两头加上特定的接头(Adaptor)。如果是转录组测序,则文库的构建要相对麻烦些,RNA片段化之后需反转成cDNA,然后加上接头,或者先将RNA反转成cDNA,然后再片段化并加上接头。片段的大小(Insert size)对于后面的数据分析有影响,可根据需要来选择。对于基因组测序来说,通常会
选择几种不同的insert size,以便在组装(Assembly)的时候获得更多的信息。
②锚定桥接(Surface Attachment and Bridge Amplification)Solexa测序的反应在叫做flow cell的玻璃管中进行,flow cell又被细分成8个Lane,每个Lane的内表面有无数的被固定的单链接头。上述步骤得到的带接头的DNA 片段变性成单链后与测序通道上的接头引物结合形成桥状结构,以供后续的预扩增使用。
③预扩增(Denaturation and Complete Amplification)添加未标记的dNTP 和普通Taq 酶进行固相桥式PCR 扩增,单链桥型待测片段被扩增成为双链桥型片段。通过变性,释放出互补的单链,锚定到附近的固相表面。通过不断循环,将会在Flow cell 的固相表面上获得上百万条成簇分布的双链待测片段。
④单碱基延伸测序(Single Base Extension and Sequencing)在测序的flow cell中加入四种荧光标记的dNTP 、DNA 聚合酶以及接头引物进行扩增,在每一个测序簇延伸互补链时,每加入一个被荧光标记的dNTP就能释放出相对应的荧光,测序仪通过捕获荧光信号,并通过计算机软件将光信号转化为测序峰,从而获得待测片段的序列信息。从荧光信号获取待测片段的序列信息的过程叫做Base Calling,Illumina公司Base Calling所用的软件是Illumina’s Genome Analyzer Sequencing Control Software and Pipeline Analysis Software。读长会受到多个引起信号衰减的因素所影响,如荧光标记的不完全切割。随着读长的增加,错误率也会随之上升。
⑤数据分析(Data Analyzing)这一步严格来讲不能算作测序操作流程的
一部分,但是只有通过这一步前面的工作才显得有意义。测序得到的原始数据是长度只有几十个碱基的序列,要通过生物信息学工具将这些短的序列组装成长的Contigs甚至是整个基因组的框架,或者把这些序列比对到已有的基因组或者相近物种基因组序列上,并进一步分析得到有生物学意义的结果。
使用对读测序方法,Solexa技术的读取长度可以达到2×75bp相比454技术,其后续的序列拼接工作的计算量和难度均大大增加。Solexa技术主要的错误来源是核苷酸的替换,而更不是插入或缺失,目前它的错误率大约在1—1.5%之间。3)ABI公司的SOLiD 测序平台
SOLiD全称为supported oligo ligation detetion,它的独特之处在于以四色荧光标记寡核苷酸的连续连接合成为基础,取代了传统的聚合酶连接反应,可对单拷