正确理解泊松分布通俗解释

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

很多人在上概率论这门课的时候就没搞明白过泊松分布到底是怎么回事,至少我就是如此。如果我们学习的意义是为了通过考试,那么我们大可停留在“只会做题”的阶段,因为试卷上不会出现“请发表一下你对泊松公式的看法”这样的题目,因为那样一来卷子就变得不容易批改,大部分考试都会出一些客观题,比如到底是泊松分布还是肉松分布。而如果我们学习的目的是为了理解一样东西,那么我们就有必要停下来去思考一下诸如“为什么要有泊松分布?”、“泊松分布的物理意义是什么?”这样的“哲学”问题。

如果我们要向一个石器时代的人解释什么是电话,我们一定会说:“电话是一种机器,两个距离很远的人可以通过它进行交谈”,而不会说:“电话在1876 年由贝尔发明,一台电话由几个部分构成……”(泊松分布在1876 年由泊松提出,泊松分布的公式是……)所以我们问的第一个问题应该是“泊松分布能拿来干嘛?”

泊松分布最常见的一个应用就是,它作为了排队论的一个输入。比如在一段时间t(比如 1 个小时)内来到食堂就餐的学生数量肯定不会是一个常数(比如一直是200 人),而应该符合某种随机规律:假如在 1 个小时内来200 个学生的概率是10%,来180 个学生的概率是20%……一般认为,这种随机规律服从的就是泊松分布。

这当然只是形象化的理解什么是泊松分布,若要公式化定义,那就是:若随机变量X 只取非负整数值0,1,2,..., 且其概率分布服

从则随机变量X 的分布称为泊松分布,记作P(λ)。这个分布是S.-D.泊松研究二项分布的渐近公式时提出来的。泊松分布P (λ)中只有一个参数λ ,它既是泊松分布的均值,也是泊松分布的方差。生活中,当一个随机事件,例如来到某公共汽车站的乘客、某放射性物质发射出的粒子、显微镜下某区域中的白血球等等,以固定的平均瞬时速率λ(或称密度)随机且独立地出现时,那么这个事件在单位时间(面积或体积)内出现的次数或个数就近似地服从

泊松分布。(泊松分布图可能长这样——)

在上文中已经提到了,泊松分布的均值和方差都是λ,如何推导的呢?看下图:

其实泊松分布在日常中还是很好辨别的,因为他有一个累计的过程。曾看到一篇用泊松分布来分析美国治安的例子,引来给大家看看:

美国枪击案假定它们满足"泊松分布"的三个条件:

(1)枪击案是小概率事件。

(2)枪击案是独立的,不会互相影响。

(3)枪击案的发生概率是稳定的。

显然,第三个条件是关键。如果成立,就说明美国的治安没有恶化;如果不成立,就说明枪击案的发生概率不稳定,正在提高,美国治安恶化。根据资料,

1982--2012年枪击案的分布情况如下:

计算得到,平均每年发生2起枪击案,所以λ = 2 。

上图中,蓝色的条形柱是实际的观察值,红色的虚线是理论的预期值。可以看到,观察值与期望值还是相当接近的。

我们用"卡方检验",检验观察值与期望值之间是否存在显著差异。卡方统计量= Σ[(观察值-期望值)^2/期望值]

计算得到,卡方统计量等于9.82。查表后得到,置信水平0.90、自由度7的卡方分布临界值为12.017。因此,卡方统计量小于临界值,这表明枪击案的观察值与期望值之间没有显著差异。所以,可以接受"发生枪击案的概率是稳定的"假设,也就是说,从统计学上无法得到美国治安正在恶化的结论。

但是,也必须看到,卡方统计量9.82离临界值很接近,p-value只有0.18。也就是说,对于"美国治安没有恶化"的结论,我们只有82%的把握,还有18%的可能是我们错了,美国治安实际上正在恶化。因此,这就需要看今后两年中,是否还有大量枪击案发生。如果确实发生了,泊松分布就不成立了。

相关文档
最新文档