高通量基因组测序中 测序深度,覆盖度

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

高通量基因组测序中,什么是测序深度和覆盖度?
1G=1024M
测序深度是指测序得到的总碱基数与待测基因组大小的比值。

假设一个基因大小为2M,测序深度为10X,那么获得的总数据量为20M。

(测序深度=总数据量20M/基因组大小2M=10X)
覆盖度是指测序获得的序列占整个基因组的比例。

由于基因组中的高GC、重复序列等复杂结构的存在,测序最终拼接组装获得的序列往往无法覆盖有所的区域,这部分没有获得的区域就称为Gap。

例如一个细菌基因组测序,覆盖度是98%,那么还有2%的序列区域是没有通过测序获得的。

序的个体,通过序列比对,可以找到大量的单核苷酸多态性位点(SNP),插入缺失位点(InDel,Insertion/Deletion)、结构变异位点(SV,
技术路线
提取基因组DNA,利用Covaris进行随机打断,电泳回收所需长度的DNA片段(0.2~5Kb),加上接头, 进行cluster制备(Solexa)或E-PCR (SOLiD),最后利用Paired-End(Solexa)或者Mate-Pair(SOLiD)的方法对插入片段进行重测序。

图1-1,以SOLiD为例,说明整个实验方案。

高效策略,外显子测序相对于基因组重测序成本较低,对研究已知基因的SNP、Indel 等具有较大的优势。

外显子(expressed region)是真核生物基因的一部分,它在剪接(Splicing)后仍会被保存下来,并可在蛋白质生物合成过程中被表达为蛋白质。

外显子是最后出现在成熟RNA中的基因序列,又称表达序列。

既存在于最初的转录产物中,也存在于成熟的RNA分子中的核苷酸序列。

在人类基因中大约有180,000外显子,占人类基因组的1%,约30MB。

相关文档
最新文档