二项分布和泊松分布的剖析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概率是 t 的高阶无穷小。则 X 的概率函数为:
k
P(X=k)=
! K!
-!
e ,k=0,1,2,...
其 中 E( X) =!.!>0,称 X 服 从 泊 松 分 布 P(!), 这 里 的
条件下文中称为泊松条件。一般随机过程著作中使用母
函数工具推导泊松分布的概率函数 。
( 三) 对定义的剖析
泊松分布和二项分布都是对应于 “一 定 范 围 内 事 件
我 们 看 一 个 实 例: 二 战 期 间 伦 敦 南 部 的 576 个 小 区
的公式近似计算二项分布的概率。
域 被 535 枚 V- 1 飞 弹 击 中, 计 算 随 机 的 一 个 小 区 域 恰 好
( 二) 启发式数学表述
被击中 2 次的概率。
前面泊松分布的概率函数从一个满足泊松条件的计
一般都不假思索, 设为随机的一个小区域被击中的
A 发生的次数”的问题, 二项分布指的“一 定 范 围 ”是 次 贝
努 里 试 验 。 泊 松 分 布 中 的 “时 间 段 ”的 概 念 引 申 为 空 间
(用体积 度 量), 区 域(用 面 积 度 量)等, 泊 松 分 布 中 的 “一 定
范围”指的是诸如体积面积长度重量时间的范围, 下文中
称为区间, 故一般教材中这样表述: 在一定条件下, 单位
二项分布的理论概率 泊松分布的理论概率 二项分布的理论频数 泊松分布的理论频数 实际频数 二项分布的百分比误差 泊松分布的百分比误差
0.39470
0.39502
227.35
227.53
229
0.007267
0.006455
0.36724
0.36690
211.53
211.34
211
- 0.00252
- 0.00159
参考文献: [1] 严颖、成世学、程侃. 运筹学随机模型[M]. 中国人民大
学出版社. 1995/ 6, P31- 32 [2] Mario F. Triola. Elementary Statistics[M] 清华大学出版
社. 2003/ 12, P212
( 作者单位: 上海外国语大学国际工商管理学院)
=0.0017, X 服 从 B(535, 0.0017),
P(X=2)=C5352×0.00172×(1- 0.0017)533≈0.1705。 概率几乎相等。下面是用 Excel 计算的一些概率和拟
合百分比误差, 根据实际数据得到两个分布的拟合均方
百分比误差。
表1
二项分布与泊松分布的理论概率与频数与百分比误差
区 域(region)或 间 隔(interval)内 事 件 A 发 生 的 次 数 服 从 泊
松分布 P(!), 其中 ! 为单位 区 域 或 间 隔 事 件 A 发 生 的 平
均次数, 一定的条件就是指泊松条件。二项分布指的“一
定范围”是用离散变量度量的, 泊松分布指的“一定范围”
是用连续变量度量的, 当离散和连续互相近似转化, 可以
· 10 ·
统计教育
2006 年第 10 期
二项分布和泊松分布的剖析
文/ 傅军和
摘要:本文从二项分布和泊松分布的数学导出过程出 发, 结合应用进行剖析, 并对两个分布之间的联系给出启 发式的数学表述, 文章最后对一个实例继续探讨有关这 两个分布的问题。
关键字: 二项分布; 泊松分布; 概率函数; 泊松条件
0.17053
0.17039
98.22
98.15
93
- 0.05319
- 0.05243
0.05269
0.05275
30.35
30.39
35
0.153214
0.151819
0.01219
0.01225
7.02
7.06
7
- 0.00286
- 0.00793
0.00225
0.00228
1.30
1.31
1
数过程导出, 用到母函数工具. 下面分析泊松分布从二项
分布中产生, 从而由泊松定理根据二项分布的概率函数
导出泊松分布的概率函数公式。
设 X 为单位区间中事件 A 发生的次数, 满足泊松条
件, " 为单位区间内事件 A 发生的平均次数。将单位区间
等分为个小区间, 取足够大, 根据泊松条件, 每一个小区
)n- k,
又
因
为
lim
n→∞
Cnk(
" n
)k(1-
次数,
1
个
小
区
域
被
击
中
的
平
均
次
数
为
535 576
=0.929,
X服
从
P(0.929),
P(X=2)=
0.9292 2!
e- 0.929
≈0.1704。
但 换 一 角 度 看 , 535 枚 飞 弹, 每 一 枚 飞 弹 击 中 指 定 一
个小区域的概率为 1 576
常数, 则:
当然将二项分布中的次贝努里试验近似看作泊松分
k
lim
n→∞
k
Cn
k
p
n-
q
k
=
" K!
-"
e
布中的连续区间, 从而二项分布理解成产生于泊松分布, 不过没有必要, 因为二项分布的概率函数是显然的。
其中 "=np, 证明方法只需要简单的极限性质。
三 、实例
一般此定理的应用是: 在一定条件下利用泊松分布
间 内 A 发 生 一 次 以 上 的 概 率 应 视 为 0, A 恰 好 发 生 一 次
的 概 率 近 似 为 "/n, A 不 发 生 的 概 率 相 应 近 似 为 1- ("/n),
泊松条件意味贝努里条件成立. 则近似服从 B[n,("/n)]。
则
:P(X=k)=Cnk(
" n
)k(1-
" n
一、二项分布和泊松分布的导出过程的剖析 和应用
二项分布和泊松分布是两类最熟悉不过的重要离散 型分布, 而且这两个分布的概率函数有密切的联系。下面 先给出概率论教材中这两个分布的数学导出过程:
( 一) 二项分布 设 n 次 贝 努 里 试 验 满 足 条 件:(1) 每 一 次 试 验 中 事 件 A 发生的概率是不变的,等于 p。(2) 事件 A 在各次试验中 是否发生是独立的。则 X 的概率函数为:P(X=k)=Cnkpkqn-k, k=0,1,2,...n, 称 X 服从二项分布 B(n,p),这里的条件在下文 中称为贝努里条件。 ( 二) 泊松分布 泊松分布可以从一个计数过程导出, 若计数过 程 {Nt,t≥0}满足: 1、独立增量性: 任意 s,t≥0,Nt+s- Nt 与{Nu,u≤t}独 立 。 即在不重叠的时段内 A 发生的次数之间独立。 2、增量平稳性: 任意 s,t≥0,Nt+s- Nt 的 分 布 与 t 无 关, 即在某时段内 A 发生的次数的分布只取决于时段的长 度, 与时段的起点无关。 3、P(Nt≥2)=o(t)长度为的时段内 A 发 生 不 止 一 次 的
预料两个分布之间可能会有联系。
二、二项分布和泊松分布联系的启发式数学
表述、
总第 85 期
统计新论
· 11 ·
( 一) 泊松定理指出: 二项分布的概率函数在一定条 件下以泊松分布的概率函数为极限:
k
k
" n
)n-
k=
" K!
-"
e,
令 n→∞,
P
(X=k)=
" K!
-"
e , 虽不是完全严
若 X 服从二项分布 B(n,p), 当 n→∞ 时 n→!,!>0 ,为 格证明, 但颇具启发性。
- 0.22874
- 0.23707
表2
拟合均方百分比误差
拟合均方百分比误差
二项分布
泊松分布
0.0787
0.0821
该实例中可以认为泊松条件和贝努里条件都很好的 满足, 而且二项分布的拟合均方百分比误差小于泊松分 布 。 根 据 对 “一 定 范 围 内 事 件 A 发 生 的 次 数 ”的 理 解, 人 们一般第一反映是泊松分布, 不太想到二项分布, 甚至觉 得二项分布可能不合理, 其实是我们已形成了思维定势: 一个二项分布的问题在一定条件下会考虑用泊松分布去 近似, 而是泊松分布的问题, 就不太容易想到和二项分布 有 什 么 关 系 。这 个 实 例 对 于 理 解 二 项 分 布 和 泊 松 分 布 的 应 用是很有意义的。