macs2 call peaks 统计学原理
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
macs2 call peaks 统计学原理
Macs2是一种用于调用染色质免疫沉淀(ChIP)测序数据中峰值的工具。
它使用统计学原理来确定哪些区域在样本中具有显著的信号增加。
Macs2使用了两个主要的统计学原理:泊松分布和负二项分布。
1. 泊松分布:在ChIP-Seq数据中,基因组上的峰值数量服从
泊松分布。
Macs2通过计算每个基因组区域上的峰值数量来评
估其在样本中是否具有显著的信号。
2. 负二项分布:Macs2还使用负二项分布模型来建立一个峰值
模型,该模型描述了在样本中预期的峰值数量。
该模型可以利用ChIP-Seq数据的特征(例如峰值宽度和信号强度)来更好
地预测信号的存在与否。
基于这些统计学原理,Macs2可以通过比较实际观察到的峰值
数量与预期峰值数量来确定哪些区域具有显著的信号。
它会给每个区域分配一个p-value,用于衡量该区域是否有显著的峰值。
总之,Macs2使用泊松分布和负二项分布来基于统计学原理对ChIP-Seq数据进行峰值调用和显著性分析。