重测序分析简介

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

重测序参考手册

目录

目录 (1)

1. 重测序简介 (3)

2. 重测序实验方法 (3)

基因组DNA抽提 (3)

基因组DNA样品建库 (3)

上机前定量 (4)

3. 重测序分析内容 (4)

重测序分析流程 (5)

重测序分析内容 (5)

4. 重测序重要技术参数 (6)

5. 重测序分析内容解释 (6)

6. 重测序分析内容示例 (6)

SNP、INDEL的样本差异分析 (12)

7. 成功分析案例/或已发表论文 (14)

8. 概念及常用工具链接 (14)

1. 重测序简介

全基因组重测序是对已知基因组序列的物种进行不同个体的基因组测序,并在此基础上对个体或群体进行差异性分析。全基因组重测序的个体,通过序列比对,可以找到大量的单核苷酸多态性位点(SNP),插入缺失位点(InDel,Insertion/Deletion)、结构变异位点(SV,Structure Variation)位点。众信可以协助客户,通过生物信息手段,分析不同个体基因组间的结构差异,同时完成注释。

2. 重测序实验方法

提取基因组DNA,利用Covaris进行随机打断,电泳回收所需长度的DNA片段(0.2~5Kb),加上接头, 进行cluster制备(Solexa)或E-PCR (SOLiD),最后利用Paired-End或者Mate-Pair的方法对插入片段进行重测序。

实验步骤主要包括以下几点:

基因组DNA抽提

不同生物(植物、动物、微生物)的基因组DNA的提取方法有所不同; 不同种类或同一种类的不同组织因其细胞结构及所含的成分不同,分离方法也有差异。在提取某种特殊组织的DNA时必须参照文献和经验建立相应的提取方法, 以获得可用的DNA大分子。尤其是组织中的多糖和酶类物质对随后的酶切、PCR反应等有较强的抑制作用,因此用富含这类物质的材料提取基因组DNA时, 应考虑除去多糖和酚类物质。

基因组DNA样品建库

这是样品准备过程中最主要的环节,也就是真正意义上的建库(通常我们所说的建库包括整个样品准备的过程)。

样品片段化(Covaris)

Covaris利用超声波剪切DNA,并将传统超声波法可控制化、精确化。DNA可以在小体积中被剪切,减少了因为蒸发带来的样品损耗,并且被剪切的DNA片段大小之间的偏差较小。Covaris剪切的片段大小较小,并且片段大小范围较传统超声波法窄。选择合适的打断参数条件,使最后打断的DNA片段大小集中在300-500bp范围内。

末端修复

使用Covaris剪切的DNA片段都会形成一些杂合的末端,其中包括了3’ 端悬垂结构、

5’端悬垂结构和平末端。这些大小不一的悬垂结构还会存在一些并没有磷酸化的末端。本步操作目的就是用T4 DNA聚合酶和Klenow酶将这些大小不一的悬垂结构补平成平末端。这些酶具有3'端→5'端外切核酸酶活性切除3' 端悬垂结构并具有聚合酶活性补平5'端悬垂结构。另外,本步骤中T4 PNK可以将片段5’端磷酸化。最后用AMPure XP Beads对补平反应体系进行纯化。

3'端加A反应

本步在补平片段的3’末端连接一个A碱基可以减少在连接接头时片段之间的互连,并且由于接头的3’末端有一个独立T碱基,所以这一步的作用是在连接接头时,让接头与片段之间特异性连接。

接头连接反应

本步在DNA片段末端添加一个测序接头,该接头与flow cell上的扩增引物相对应。接头通过平末端连接在DNA片段的两端,并且通过接头在flow cell上进行桥式PCR扩增,形成测序簇。

纯化连接产物

连接反应结束之后用AMPure XP Beads对补平反应体系进行纯化,最后用resuspension buffer 纯化至20ul的连接产物。用2%的琼脂糖凝胶进行电泳,切取所要求的片段大小的DNA片段,并用MInElute Gel Extraction Kit进行回收。

扩增目的片段

本步通过PCR反应扩增已连好两个接头的DNA目的片段,PCR引物对应着接头的末端。本步PCR使用高保真酶和尽可能少的循环数以减少假阳性的出现。

纯化终产物

本步用用AMPure XP Beads对PCR反应体系进行纯化。通过琼脂糖凝胶电泳检测PCR 反应后的纯化产物,注意其片段大小和文库浓度。

上机前定量

有很多客户会问到,如何保证他/她获得相应的数据量?为什么有时候出来数据量不够,有时候又会多出来许多?这个问题主要与上机前的定量有关。目前Hiseq2000机器,每个Lane可以产生30G的数据量,因此往往需要将多个样品合并在一起进行测序,在上机前将各个样品按照预期数据量的比例进行混合,所以定量步骤的小量偏差可能导致数据量上的分布不均匀。

定量完成后,进行簇生成步骤,将序列固定到测序用的flowcell上,接下来就可以进行测序了。

3. 重测序分析内容

重测序是利用测序获得的样本的DNA序列和已知的该物种的完整基因组序列比对,来检测该物种的基因组中发生的SNV、INDEL等突变。进一步研究这些突变导致的转录翻译产物发生的变化。

目前第二代测序技术的两个平台Solexa 和Solid 均可用于重测序的研究,二者均为高通量测序。与Solid 相比,Solexa 测序读长相对长一些(Hiseq2000的读长为100bp ),测序通量相差不大。Solexa 的优势在于其后期分析可以选用的软件比较丰富,而由于Solid 采用的是双色谱碱基表示方法,可以在和已知基因组序列比对时纠正测序错误,使得其测序错误率降低。但是后期分析的比对软件数量有限。

众信提供的重测序分析内容又分为两种,一种是基础分析,通常包含在整个项目的报价中,另一种是高级分析,需要额外询价。

重测序分析流程

重测序分析内容

分析内容

解释 基础分析 测序质量评估及预处理 Reads 比对到参考基因组 比较Mapping 区域和期望的目标区域

突变位点分析 编码区域的INDEL 分析 Exome 注释、及编码区SNP 分析

和已知的SNP (如来自dbSNP 的数据)进行比较分析;

三个样本共有的和特有的SNP 分析 SNP 深度变化

高级分析 依据客户需求针对性设计分析内容

原始数据

质量评估及预处理 符合要求的数据

参考基因组比对

SNV/INDEL 预测

SNV/INDEL 注释

相关文档
最新文档