人全外显子组序列捕获及第二代测序
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
人全外显子组序列捕获及第二代测序
概述
外显子组是指全部外显子区域的集合,该区域包含合成蛋白质所需要的重要信息,涵盖了与个体表型相关的大部分功能性变异。外显子组序列捕获及第二代测序是一种新型的基因组分析技术:外显子序列捕获芯片(或溶液)可在同一张芯片上以高特异性和高覆盖率捕获研究者感兴趣的目标外显子区域,后续利用Solexa/SOLiD/Roche 454测序直接解析数据。
与全基因组重测序相比,外显子组测序只需针对外显子区域的DNA 即可,覆盖度更深、数据准确性更高,更加简便、经济、高效。可用于寻找复杂疾病(如:癌症、糖尿病、肥胖症等)的致病基因和易感基因等的研究。同时,基于大量的公共数据库提供的外显子数据,我们能够结合现有资源更好地解释我们的研究结果。
目前,SBC提供的外显子组序列捕获芯片是NimbleGen Sequence Capture 2.1M Human Exome Array及Agilent SureSelect Target Enrichment System(Human Exome)。
技术路线
以Nimblegen外显子捕获结合Solexa测序为例加以说明:基因组DNA首先被随机打断成500bp左右的片段,随后在DNA片段两端分别连接上接头。经过PCR库检合格后的DNA 片段与NimbleGen 2.1M Human Exome Array芯片进行杂交。去除未与芯片结合的背景DNA 后,将经过富集的外显子区域的DNA片段洗脱下来。这些DNA片段又随机连接成长DNA片段
后,再次被随机打断并在其两端加上测序接头,经过LM-PCR的线性扩增,在经qPCR质量检测合格后即可上机测序。
外显子组测序的实验流程示意图()
生物信息学分析流程图
研究内容
1.外显子组捕获与测序
将基因组DNA随机打断成片段,通过与人全外显子捕获芯片杂交富集外显子区域,通过第二代测序技术对捕获的序列进行测序。
2.基本数据分析
数据产出统计:对测序结果进行图像识别(Base calling),去除污染及接头序列;统计结果包括:测定的序列(Reads)长度、Reads数量、数据产量。
3. 高级数据分析
高级数据分析内容包括:
(1)Clean reads序列与参考基因组序列比对;
(2)目标外显子区域测序深度分析;
(3)目标外显子区域一致序列组装;
(4)目标外显子区域SNP检测及在CCDS数据库中的注释;
(5)可变剪切、基因融合、外显子融合分析。
技术特点
相关产品技术参数
SureSelect Human All Exon 50Mb Kit(New)
捕获量:50Mb
捕获对象:
1、GENCODE project中发现的外显子(约12M)
2、NCBI Consensus CDS database(CCDS, March 2009)中的外显子
3、Sanger V13 database中的miRNA
4、多于300条的human non-coding RNAs(例如snoRNAs和scaRNAs)
* All Exon 50Mb试剂盒是Agilent与Wellcome Trust Sanger Institute、 Gencode consortium合作开发的人全外显子捕获试剂盒。在前款产品(SureSelect Human All Exon Kit)的基础上,加入了WT Sanger实验室发现的人外显子(12Mb),合计为50Mb。这款产品是目前市面上覆盖最全面的人全外显子捕获试剂盒。
SureSelect Human All Exon Kit
捕获量:38Mb
捕获对象:
1、NCBI Consensus CDS database(CCDS)中的外显子(约为人类基因组的1.22%)
2、Sanger V13 database中的miRNA
3、多于300条的human non-coding RNAs(例如snoRNAs和scaRNAs)
SureSelect Human All Exon Plus Kit
捕获量:44Mb
捕获对象:
在SureSelect Human All Exon Kit的基础上加入6M可以自主选择的捕获区域(需要用e-Array设计)
All Exon Kit与All Exon 50Mb Kit的覆盖范围对比