浅析二项分布、泊松分布和正态分布之间的关系

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如果辣nPn
_。l。一,_
一厂飞np(1-p)“
戈一nP
Jnp,一,)
_。一np}
“np(1-p) j
llmC"P(1一。)一羊。一,、一。,1,2...
”冲。一K二
__{b-np)_{。一,)
‘’{nP(I-P){一’{np(I-p){
泊松定理的证明见文献【1]。由该定理可知,当二项分
布b (n, p)的参数n很大,P很小,而兄二np大小适中时,
去近似二项分布,却会产生较大的误差。直观上也可以想象得
到,p很小,n又不大,则np =几一定不会很大。由定理3
可知,正态分布就不能很好地近似泊松分布,因而也就不能近
似被泊松分布十分逼近的二项分布。
在”充分大,P既不接近于0也不接近于1时(实际上最
好满足0.1 S p S 0.9),用正态分布去近似二项分布,效果就
时,事件发生的频数的分布。实际表明,在一般情况下,当
p<wenku.baidu.com.1时,这种近似是很好的,甚至n不必很大都可以,这
点从比较二项分布与泊松分布的概率分布表也可以看出。例
如,当p = 0.01时,甚至”=2时,这种近似程度已经很好
了。表1说明了这一情况,其中np = 0.02。
衰,二项分布与泊松分布的比较
P{a‘戈‘小。
时p最好满足O.15P50.9(参见文献[21). At外,文献[3]
还指出,由于我们是用一个连续分布来近似离散分布,在实际
应用中.为了减少近似误差.常用
这就是二项分布的泊松逼近。当然n应尽可能地大,否则
近似效果往往不佳。
二项分布的泊松近似常常被应用于研究稀有事件(即每次
试验中事件出现的概率p很小)’,当伯努利试验的次数n很大
特征函数的定义:
109
1
“不石e2}rnpg
(k-v)'
服从或近似服从正态分布,这正是正态分布在理论与实践上都
极其重要的原因。
1_(、一np l
一nP9 wl np-q)
2主要结果
2.1二项分布与泊松分布之间的关系
定理I(泊松定理)在n重伯努利试验中,
验中发生的概率为Pn,它与试验次数有关,
=.A>0,则对任意给定的m,有
定理2就是概率论中著名的棣莫弗一拉普拉斯中心极限定
理,它的证明见文献【27。该定理表明,当n充分大时,二项
分布可用正态分布来近似,即二项分布的正态逼近。例如,
P {Xn·、卜心,‘(1一,)n_‘和P毛a、Xn、b}-
E CRpkqn-kx#。充分大时计算是十分困难的。根据定理:,
nsk<b
由于
戈一nP
服从或近似服从正态分布,这正是正态分布在理论与实践上都
极其重要的原因。
1_(、一np l
一nP9 wl np-q)
2主要结果
2.1二项分布与泊松分布之间的关系
定理I(泊松定理)在n重伯努利试验中,
验中发生的概率为Pn,它与试验次数有关,
=.A>0,则对任意给定的m,有
P夏a‘戈‘b}
(2)
事件A在每次试
衰,二项分布与泊松分布的比较
P{a‘戈‘小。
来代替(2)式。
(b+0.5一,、‘厂。一0.5一,、
{nP(l_p){一(np(l_p){
2.3泊松分布与正态分布之间的关系
由定理1和定理2可知二项分布既可以用泊松分布近似,
也可以用正态分布近似。显然,泊松分布和正态分布在一定条
件下也具有近似关系,下面的定理说明泊松分布的正态通近。
较好。
表2是用泊松分布与正态分布去近似二项分布b (n, p)
的比较,其中,二2500,p一0.02,np二50,了而万=
了49=7。可见,在数值上三者是大致相等的。
由定理3易知,泊松分布X一二(刃当A-+树的极限分
布是正态分布N(A, a.)。
为了进一步讨论泊松分布和正态分布的分布函数之间的近
似关系,需要用到随机变量的特征函数的相关知识,首先给出
定理2就是概率论中著名的棣莫弗一拉普拉斯中心极限定
理,它的证明见文献【27。该定理表明,当n充分大时,二项
分布可用正态分布来近似,即二项分布的正态逼近。例如,
P {Xn·、卜心,‘(1一,)n_‘和P毛a、Xn、b}-
E CRpkqn-kx#。充分大时计算是十分困难的。根据定理:,
nsk<b
由于
戈一nP
充分大的n。不过,当p较大或较小时近似效果较差,应用
时p最好满足O.15P50.9(参见文献[21). At外,文献[3]
还指出,由于我们是用一个连续分布来近似离散分布,在实际
应用中.为了减少近似误差.常用
这就是二项分布的泊松逼近。当然n应尽可能地大,否则
近似效果往往不佳。
二项分布的泊松近似常常被应用于研究稀有事件(即每次
布,记为X一N(u,a2)。
正态分布的概率密度中的两个参数产和a,分别就是该分
布的数学期望和方差。特别地,当,t=O,a2 =1时的正态分
布.称为标准正态分布,记为X一N(0,1),标准正态分布的

密度函数记为(Pkx) -了歹e2r‘,-0o < x <+00·
正态分布是自然界及工程技术中最常见的分布之一,大量
来代替(2)式。
(b+0.5一,、‘厂。一0.5一,、
{nP(l_p){一(np(l_p){
2.3泊松分布与正态分布之间的关系
由定理1和定理2可知二项分布既可以用泊松分布近似,
也可以用正态分布近似。显然,泊松分布和正态分布在一定条
件下也具有近似关系,下面的定理说明泊松分布的正态通近。
定理3对任意的a<b,有
│2│0. 0001│0. 0002│
└─┴─────────┴───────┘
“一几
万不,”-
18一兄

。定理3的证明见文献[1〕。
2.2二项分布和正态分布之间的关系
定理2设随机变里X。一b (n, pX0<p<1, n=1,2,
则对于任意x,有
lim{ Xn -npn-am np(1-p)·丹·Jr瓮-Zdt00 2;r一、
InP(1-P)
近似服从N(0,1)或等价地Xn近似服从
以np,np(1-P)),于是可以近似地用正态分布来计算上述概
率,即P毛Xn=*}=心,‘(1一,)”一‘
如前文所述,二项分布的泊松近似和正态近似各自适用的
条件是不同的。当P很小时,即使n不是很大,用泊松分布近
似二项分布,已经相当吻合。但是在这种倩形下,用正态分布
P夏a‘戈‘b}
(2)
事件A在每次试
如果辣nPn
_。l。一,_
一厂飞np(1-p)“
戈一nP
Jnp,一,)
_。一np}
“np(1-p) j
llmC"P(1一。)一羊。一,、一。,1,2...
”冲。一K二
__{b-np)_{。一,)
‘’{nP(I-P){一’{np(I-p){
泊松定理的证明见文献【1]。由该定理可知,当二项分
较好。
表2是用泊松分布与正态分布去近似二项分布b (n, p)
的比较,其中,二2500,p一0.02,np二50,了而万=
了49=7。可见,在数值上三者是大致相等的。
由定理3易知,泊松分布X一二(刃当A-+树的极限分
布是正态分布N(A, a.)。
为了进一步讨论泊松分布和正态分布的分布函数之间的近
似关系,需要用到随机变量的特征函数的相关知识,首先给出
班分布称为二项分布,是因为CApk9"-kt.&为(9+ p)k
二项展开式的各项系数.这种概率模型也被称为伯努利概
型。X服从参数为n, p的二项分布,记为X一b (n, p)。
由二项分布的定义知.随机变量X是n重伯努利试验中事
件A发生的次数,且在每次试验中A发生的概率为p。二项
分布的数学期望和方差分别是EX = np,DX=np(l一月。
布b (n, p)的参数n很大,P很小,而兄二np大小适中时,
实际中n'a100,pS0.1,np<_10时(见文献[21),二项
分布可用参数为兄=np的泊松分布来近似,即
C pk (1一PT‘二
ak
,.一一几
—匕
k!
只要查一查标准正态分布函数表4o容易得到尸{。‘X<b}
的相当精确的值。原则上(1)式和(2)式适用于任何给定的p和
的随机现象都是服从或近似服从正态分布的。文献【1]指出,
如果一个随机指标受到许多微小的、独立的随机因素的影响,
而其中任何一个因素都不起决定性作用,则可认为该随机指标
[作者简介】于洋(1979-),男,大连人,东北财经大学讲师,硕士学位.研究方向:概率统计、数f经济学。
108
1
“不石e2}rnpg
(k-v)'
k!
k=0,1,2,---,其中A. >0是常数,
则称X服从参数为兄的泊松分布,记为X一‘(刃。
泊松分布的重要性质是它的数学期望和方差都等于参数兄。
1 .3正态分布
设连续型随机变量x的概率密度为:
I(x) _ 1- e
一J27rs
(x一月产
2,5'
-00 < x < +00,其中PIC为
常数,口>0,则称溯及从参数为从口的正态分布或高斯分
特征函数的定义:
109
实际中n'a100,pS0.1,np<_10时(见文献[21),二项
分布可用参数为兄=np的泊松分布来近似,即
C pk (1一PT‘二
ak
,.一一几
—匕
k!
只要查一查标准正态分布函数表4o容易得到尸{。‘X<b}
的相当精确的值。原则上(1)式和(2)式适用于任何给定的p和
充分大的n。不过,当p较大或较小时近似效果较差,应用
浅析二项分布、泊松分布和正态分布之间的关系
1预备知识
1.1二项分布
在同一条件下重复做n次独立试验,每次试验只可能有两
种对立的结果:A和A之一,并设在同一次试验中A发生的
概率是P (A) = p,0<p<1,而p(A)=,一,=。。这时,
在n次独立试验中,出现A的总计次数k是一个随机变量.
并且总有
P夏X=k卜心Pk9_k,(k=o,LZ,…,n)
InP(1-P)
近似服从N(0,1)或等价地Xn近似服从
以np,np(1-P)),于是可以近似地用正态分布来计算上述概
率,即P毛Xn=*}=心,‘(1一,)”一‘
如前文所述,二项分布的泊松近似和正态近似各自适用的
条件是不同的。当P很小时,即使n不是很大,用泊松分布近
似二项分布,已经相当吻合。但是在这种倩形下,用正态分布
去近似二项分布,却会产生较大的误差。直观上也可以想象得
到,p很小,n又不大,则np =几一定不会很大。由定理3
可知,正态分布就不能很好地近似泊松分布,因而也就不能近
似被泊松分布十分逼近的二项分布。
在”充分大,P既不接近于0也不接近于1时(实际上最
好满足0.1 S p S 0.9),用正态分布去近似二项分布,效果就
试验中事件出现的概率p很小)’,当伯努利试验的次数n很大
时,事件发生的频数的分布。实际表明,在一般情况下,当
p<0.1时,这种近似是很好的,甚至n不必很大都可以,这
点从比较二项分布与泊松分布的概率分布表也可以看出。例
如,当p = 0.01时,甚至”=2时,这种近似程度已经很好
了。表1说明了这一情况,其中np = 0.02。
│2│0. 0001│0. 0002│
└─┴─────────┴───────┘
“一几
万不,”-
18一兄

。定理3的证明见文献[1〕。
2.2二项分布和正态分布之间的关系
定理2设随机变里X。一b (n, pX0<p<1, n=1,2,
则对于任意x,有
lim{ Xn -npn-am np(1-p)·丹·Jr瓮-Zdt00 2;r一、
,jk_一4,
飞,几‘1 r0
乙-石-=了万Ja“
a<k<口几;Y‘拍

2去,其中
浊a=
┌─┬─────────┬───────┐
│k│C.I Pk (1一P )"-k│(,)‘e一”Ik!│
├─┼─────────┼───────┤
│0│0. 9801│0. 9802│
│1│0. 0198│0. 0196│
定理3对任意的a<b,有
,jk_一4,
飞,几‘1 r0
乙-石-=了万Ja“
a<k<口几;Y‘拍

2去,其中
浊a=
┌─┬─────────┬───────┐
│k│C.I Pk (1一P )"-k│(,)‘e一”Ik!│
├─┼─────────┼───────┤
│0│0. 9801│0. 9802│
│1│0. 0198│0. 0196│
1.2泊松分布
泊松分布刻画了稀有李件在一段时间内发生次数这一随机
变盘的分布,如电话交换台单位时间内接到的呼唤次数.某公
共汽车站在单位时间内来站乘车的乘客数,宇宙中单位体积内
星球的个数.耕地上单位面积内杂草的数目等。
设随机变量x所有可能取得值为0,1,2,-..,而取各个值的
概率为P{X=月二
兄ke_x
相关文档
最新文档