quality score 二代测序
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Quality Score 二代测序
1. 什么是Quality Score?
Quality Score(质量分数)是在二代测序中用来评估测序数据质量的指标。在二
代测序中,DNA或RNA样本会被分解成短片段,并通过高通量测序技术进行测序。
每个片段都会被测序仪读取多次,形成一个序列数据集。
Quality Score是对每个测序片段的测序质量进行评估的数值。它反映了测序片段
的可靠性和准确性,对于后续的生物信息学分析和数据解读至关重要。
2. Quality Score的计算方法
Quality Score是通过测序仪读取测序片段时,对每个碱基进行质量评估得出的。
在二代测序中,常用的Quality Score计算方法有两种:Phred Score和Solexa Score。
2.1 Phred Score
Phred Score是最常用的Quality Score计算方法之一。它是基于碱基的测序错误
概率计算得出的质量分数。
Phred Score的计算公式如下:
Q = -10 * log10(P)
其中,Q表示Quality Score,P表示碱基的测序错误概率。
Phred Score的取值范围是0到40,数值越高表示测序质量越高,错误概率越低。
2.2 Solexa Score
Solexa Score是Illumina公司独有的Quality Score计算方法。它也是基于碱基
的测序错误概率计算得出的质量分数。
Solexa Score的计算公式如下:
Q = -10 * log10(P / (1 - P))
其中,Q表示Quality Score,P表示碱基的测序错误概率。
Solexa Score的取值范围是-5到62,数值越高表示测序质量越高,错误概率越低。与Phred Score相比,Solexa Score在测序质量较低时能够提供更高的分辨率。
3. Quality Score的应用
Quality Score是二代测序中非常重要的指标,它在以下几个方面都有重要的应用:
3.1 数据筛选
Quality Score可以用于筛选测序数据,去除质量较低的片段。通常会设定一个阈值,只保留Quality Score高于该阈值的片段。这样可以提高测序数据的可靠性和准确性,减少后续分析的误差。
3.2 错误校正
Quality Score可以用于对测序数据进行错误校正。通过分析Quality Score,可
以识别并更正测序片段中的测序错误。这对于后续的基因组组装、变异检测等分析非常重要。
3.3 变异检测
Quality Score可以用于变异检测。在比对测序数据到参考基因组时,可以利用Quality Score来评估碱基的可靠性。这有助于准确地识别样本中的变异位点。
3.4 数据解读
Quality Score可以用于帮助解读测序数据。在进行生物信息学分析时,可以根据Quality Score对测序片段进行质量加权,从而影响后续的数据解读和结果分析。
4. Quality Score的评估标准
Quality Score的评估标准和阈值可以根据具体的实验设计和测序平台进行调整。
通常,较高的Quality Score表示较高的测序质量。
在一般情况下,以下是一些常见的Quality Score评估标准:
•Q20:Quality Score大于等于20,表示测序质量较高,错误概率小于等于1%。
•Q30:Quality Score大于等于30,表示测序质量很高,错误概率小于等于
0.1%。
•Q40:Quality Score大于等于40,表示测序质量非常高,错误概率小于等于0.01%。
根据实际需求,可以根据Quality Score的分布情况和质量要求,制定相应的评估标准和阈值。
5. 总结
Quality Score是二代测序中用于评估测序数据质量的重要指标。它通过对测序片
段的测序错误概率进行计算,反映了片段的可靠性和准确性。Quality Score在数
据筛选、错误校正、变异检测和数据解读等方面具有重要的应用。了解Quality Score的计算方法和评估标准,可以帮助我们更好地理解和分析二代测序数据。
参考文献: 1. Ewing B, Green P. Base-calling of automated sequencer traces using phred. II. Error probabilities[J]. Genome research, 1998, 8(3): 186-194. 2. Heng L. et al. SolexaQA: At-a-glance quality assessment of Illumina second-generation sequencing data[B]. Poster at Plant and Animal Genome XV Conference, San Diego, CA, USA, 2007.