测序技术介绍
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
9
10
11
12
自动化测序实际上已成为当今 dna序列分析的 主流。美国PE ABI公司已生产出373型、377型 、310型、3700和3100型等dna测序仪,其中 310型是临床检测实验室中使用最多的一种型 号。
13
在进行DNA测序时,紧接引物的10 — 30 Bases有时不一定能完全读清楚。 由 于DNA结构上的原因,有时会出现反应中途无法进行之情况。如:G/C rich; G/C Cluster;Poly A、 Poly T的连续结构等。此外,另一种情况为反应中途出 现的套峰现象,此种情况一般为DNA结构中的重复序列,造成测序用引物和模板 之间有二个以上的结合位点。具体问题分析如下:
第一个峰,重叠干扰。如果不判读为干扰峰,那就说明样品不纯,如果是基因组DNA, 就很好地说明了样品为杂合子,该位点可能存在SNP现象(T/G)。如果判读为干扰峰, 我们只需认定样品此处碱基为T为行了。
第二个峰,错位干扰。如果不判读为干扰峰,则说明样本可能比预期多一个碱基(G), 如果判读为干扰峰,我们仍只需认定样品此处碱基为T为行了。
1
2
1954 年,Whitfeld 等用化学降解法测定多聚核糖核苷酸 序列,是关于DNA 测序技术的较早报道。
1977 年,Sanger 发明DNA 双脱氧核苷酸末端终止测序 法(chain terminator sequencing),
A.M.Maxam 和W. Gilbert 发明DNA 化学降解测序法 (chemical degradation sequencing),
Solexa 测序平台的性价比最高,在数据量相同的 情况下,测序成本仅为454 测序平台的1/10;
SOLiD 测序平台准确度能够达到99.94%,在片段 覆盖率为15×时,测序准确度可接近100%。
20
2005年底,454公司推出第一个基于焦磷酸测序原理的高通量基因 组测序系统——Genome Sequencer 20 System,这是核酸测序技术发 展史上里程碑式的事件。随后,罗氏公司以1.55亿美元收购了454公司, 并在2006年推出了更新的GS FLX测序系统,该系统可在10小时的运行 中获得100万条读长(reads),4~6亿个碱基信息(base pair),且 准确率达到99%以上。2008年,GS FLX系统再次升级,通量提高了5倍, 读长和准确率也有所增加。虽然454 GS测序平台也许不是市场占有率最 高的测序仪,但截至2011年3月,利用该系统进行研究的论文已发表超 过1000余篇,而它在读长上的优势明显胜于另两套系统,因此在从头测 序(de novo)和宏基因组测序(meta genome)方面有着不可替代的 地位。
4:过短的PCR产物为什么不适于直接测序?首先由于一般的PCR产物纯化试 剂盒要求产物片段大于200bp,过短的PCR产物不能进行纯化;再者,测序的 前50bp和后50bp的序列是不好的,所以不适于直接测序。
15
5:酒精如果没有挥发完全,在约300bp处会出现连续异常的G峰,酒精挥发 时间过长会导致DNA断裂。
1: 测序结果有很多套峰,出现很多N值原因分析:PCR产物直接进行测序,在 PCR产物长度以后将无反应信号,机器将产生许多N值。 在序列的起始端出现N 值,主要是由于有未去除的染料单体造成的干扰峰,是机器无法正确判读出位何 值。有时,引物二聚体或者起始端小片段的丢失,也会出现N值。模版本身含杂 合序列,有等位基因。
16
6:为什么用PCR产物或质粒测序时,经常会出现套峰现象? 下图是pGEM-T载体测序的结果,在83位点处测序结果出现双峰,即模板中
含有两个或两个以上的相同载体,但是插入片段不同。 解决办法:重新挑取 单克隆或者重新提取质粒。需要注意的是,重新进行PCR反应或者酶切鉴定 仅能证明该克隆含有插入片段,并不足以证明模板的单一。
14
2:为什么找不到我的PCR引物序列?用PCR引物作为测序引物,所测序列是 从引物3末端后第一个碱基开始的,所以就找不到您的测序引物了。可以进 行反向测序,得到引物的反向互补序列。还可以将所测片段克隆到适当载体 中,由于通用引物与插入序列有一段距离,就可以测出您的引物序列。
3:测序结果和文献资料不一样,为什么?原因有很多,如同一种动物,在不 同的种族之间,或者不同的个体之间,基因序列也不一定完全一样。如果是 PCR产物克隆测序, 那还有PCR过程中的错配因素等等。我们提供的测序结果 是客户样品序列的忠实结果,不能保证和文献序列完全一致。
4
5
6
7
8
该测序技术的具体做法如下:将模板、引物、4 种 dNTP(其中含有一种为放射性同位素标记的核苷 酸)与DNA 聚合酶共同保温,形成的混合物包含 许多长短不一的片段, 最后利用聚丙烯酰胺变性凝 胶电泳(SDS-PAGE)分离该混合物,得到放射性 同位素自显影条带图谱,人们依据凝胶电泳图即可 读出DNA 双链的碱基序列组成。
21
2006 年 , Solexa 公 司 也 推 出 了 自 己 的 NGS 系 统 ——Genome Analyzer, 简 称 GA 。 这 套 基 于 DNA 簇 ( DNA cluster ) 、 桥 式 PCR (Bridge PCR)和可逆阻断(Reversible terminator)等核心技术的系 统 具 有 高 通 量 、 低 错 误 率 、 低 成 本 、 应 用 范 围 广 等 优 点 。 2007 年 , Illumina公司以6亿美元的高价收购了Solexa,使GA得以商品化。GA最 早期的版本一次运行可获得1Gb的数据,因此也有1Gb Analyzer的含义, 而最新的Hiseq2000平台则能够在10天的运行中获得300Gb以上的数 据,读取的碱基长度达到150bp左右。更有消息称,Illumina已完成了 600Gb的运行测试并在部分客户中开展了前期体验,Tb(1000Gb)级 的测试Run也将于年内进行。据不完全统计,Illumina公司已售出超过 600台/套GA IIx和Hiseq2000平台,2010年仅深圳华大基因研究院一 家就购买了128台Hiseq2000,一举成为全球最大的基因组测序与分析 中心,Illumina公司在测序领域的影响力由此可见一斑。
2 项技术的出现,标志第1 代测序技术诞生。
3
每一次DNA 测序反应都由4 个独立反应组成; 由于DNA 双链中核苷酸以3′,5′-磷酸二酯键相连,因此在测
序过程中掺入2′,3′-双脱氧核苷三磷酸———ddNTP(不含 3′-OH),当ddNTP 位于DNA 双链的延伸末端时, 无羟基3′ 端不能与其他脱氧核苷酸形成3′,5′-磷酸二酯键, 因此, DNA 双链合成便终止; 若在终止位点掺入ddATP,则新生链末端为A,若掺入ddTTBaidu Nhomakorabea、 ddCTP、ddGTP,相应地,新生链末端则是T、C 或G。
17
7:poly结构的测序结果 以polyT为例,在polyA/T结构之后往往出现移码现象,而在polyG/C之后会
往往导致测序信号的衰减。解决办法:使用反向引物对模板进行测序,测到 该poly结构处,即可完成模板全长的拼接。
18
19
454 测序平台得到的片段能够达到400 bp,并且 读长的质量高;
10
11
12
自动化测序实际上已成为当今 dna序列分析的 主流。美国PE ABI公司已生产出373型、377型 、310型、3700和3100型等dna测序仪,其中 310型是临床检测实验室中使用最多的一种型 号。
13
在进行DNA测序时,紧接引物的10 — 30 Bases有时不一定能完全读清楚。 由 于DNA结构上的原因,有时会出现反应中途无法进行之情况。如:G/C rich; G/C Cluster;Poly A、 Poly T的连续结构等。此外,另一种情况为反应中途出 现的套峰现象,此种情况一般为DNA结构中的重复序列,造成测序用引物和模板 之间有二个以上的结合位点。具体问题分析如下:
第一个峰,重叠干扰。如果不判读为干扰峰,那就说明样品不纯,如果是基因组DNA, 就很好地说明了样品为杂合子,该位点可能存在SNP现象(T/G)。如果判读为干扰峰, 我们只需认定样品此处碱基为T为行了。
第二个峰,错位干扰。如果不判读为干扰峰,则说明样本可能比预期多一个碱基(G), 如果判读为干扰峰,我们仍只需认定样品此处碱基为T为行了。
1
2
1954 年,Whitfeld 等用化学降解法测定多聚核糖核苷酸 序列,是关于DNA 测序技术的较早报道。
1977 年,Sanger 发明DNA 双脱氧核苷酸末端终止测序 法(chain terminator sequencing),
A.M.Maxam 和W. Gilbert 发明DNA 化学降解测序法 (chemical degradation sequencing),
Solexa 测序平台的性价比最高,在数据量相同的 情况下,测序成本仅为454 测序平台的1/10;
SOLiD 测序平台准确度能够达到99.94%,在片段 覆盖率为15×时,测序准确度可接近100%。
20
2005年底,454公司推出第一个基于焦磷酸测序原理的高通量基因 组测序系统——Genome Sequencer 20 System,这是核酸测序技术发 展史上里程碑式的事件。随后,罗氏公司以1.55亿美元收购了454公司, 并在2006年推出了更新的GS FLX测序系统,该系统可在10小时的运行 中获得100万条读长(reads),4~6亿个碱基信息(base pair),且 准确率达到99%以上。2008年,GS FLX系统再次升级,通量提高了5倍, 读长和准确率也有所增加。虽然454 GS测序平台也许不是市场占有率最 高的测序仪,但截至2011年3月,利用该系统进行研究的论文已发表超 过1000余篇,而它在读长上的优势明显胜于另两套系统,因此在从头测 序(de novo)和宏基因组测序(meta genome)方面有着不可替代的 地位。
4:过短的PCR产物为什么不适于直接测序?首先由于一般的PCR产物纯化试 剂盒要求产物片段大于200bp,过短的PCR产物不能进行纯化;再者,测序的 前50bp和后50bp的序列是不好的,所以不适于直接测序。
15
5:酒精如果没有挥发完全,在约300bp处会出现连续异常的G峰,酒精挥发 时间过长会导致DNA断裂。
1: 测序结果有很多套峰,出现很多N值原因分析:PCR产物直接进行测序,在 PCR产物长度以后将无反应信号,机器将产生许多N值。 在序列的起始端出现N 值,主要是由于有未去除的染料单体造成的干扰峰,是机器无法正确判读出位何 值。有时,引物二聚体或者起始端小片段的丢失,也会出现N值。模版本身含杂 合序列,有等位基因。
16
6:为什么用PCR产物或质粒测序时,经常会出现套峰现象? 下图是pGEM-T载体测序的结果,在83位点处测序结果出现双峰,即模板中
含有两个或两个以上的相同载体,但是插入片段不同。 解决办法:重新挑取 单克隆或者重新提取质粒。需要注意的是,重新进行PCR反应或者酶切鉴定 仅能证明该克隆含有插入片段,并不足以证明模板的单一。
14
2:为什么找不到我的PCR引物序列?用PCR引物作为测序引物,所测序列是 从引物3末端后第一个碱基开始的,所以就找不到您的测序引物了。可以进 行反向测序,得到引物的反向互补序列。还可以将所测片段克隆到适当载体 中,由于通用引物与插入序列有一段距离,就可以测出您的引物序列。
3:测序结果和文献资料不一样,为什么?原因有很多,如同一种动物,在不 同的种族之间,或者不同的个体之间,基因序列也不一定完全一样。如果是 PCR产物克隆测序, 那还有PCR过程中的错配因素等等。我们提供的测序结果 是客户样品序列的忠实结果,不能保证和文献序列完全一致。
4
5
6
7
8
该测序技术的具体做法如下:将模板、引物、4 种 dNTP(其中含有一种为放射性同位素标记的核苷 酸)与DNA 聚合酶共同保温,形成的混合物包含 许多长短不一的片段, 最后利用聚丙烯酰胺变性凝 胶电泳(SDS-PAGE)分离该混合物,得到放射性 同位素自显影条带图谱,人们依据凝胶电泳图即可 读出DNA 双链的碱基序列组成。
21
2006 年 , Solexa 公 司 也 推 出 了 自 己 的 NGS 系 统 ——Genome Analyzer, 简 称 GA 。 这 套 基 于 DNA 簇 ( DNA cluster ) 、 桥 式 PCR (Bridge PCR)和可逆阻断(Reversible terminator)等核心技术的系 统 具 有 高 通 量 、 低 错 误 率 、 低 成 本 、 应 用 范 围 广 等 优 点 。 2007 年 , Illumina公司以6亿美元的高价收购了Solexa,使GA得以商品化。GA最 早期的版本一次运行可获得1Gb的数据,因此也有1Gb Analyzer的含义, 而最新的Hiseq2000平台则能够在10天的运行中获得300Gb以上的数 据,读取的碱基长度达到150bp左右。更有消息称,Illumina已完成了 600Gb的运行测试并在部分客户中开展了前期体验,Tb(1000Gb)级 的测试Run也将于年内进行。据不完全统计,Illumina公司已售出超过 600台/套GA IIx和Hiseq2000平台,2010年仅深圳华大基因研究院一 家就购买了128台Hiseq2000,一举成为全球最大的基因组测序与分析 中心,Illumina公司在测序领域的影响力由此可见一斑。
2 项技术的出现,标志第1 代测序技术诞生。
3
每一次DNA 测序反应都由4 个独立反应组成; 由于DNA 双链中核苷酸以3′,5′-磷酸二酯键相连,因此在测
序过程中掺入2′,3′-双脱氧核苷三磷酸———ddNTP(不含 3′-OH),当ddNTP 位于DNA 双链的延伸末端时, 无羟基3′ 端不能与其他脱氧核苷酸形成3′,5′-磷酸二酯键, 因此, DNA 双链合成便终止; 若在终止位点掺入ddATP,则新生链末端为A,若掺入ddTTBaidu Nhomakorabea、 ddCTP、ddGTP,相应地,新生链末端则是T、C 或G。
17
7:poly结构的测序结果 以polyT为例,在polyA/T结构之后往往出现移码现象,而在polyG/C之后会
往往导致测序信号的衰减。解决办法:使用反向引物对模板进行测序,测到 该poly结构处,即可完成模板全长的拼接。
18
19
454 测序平台得到的片段能够达到400 bp,并且 读长的质量高;