中心极限定理的内涵和应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

中心极限定理的内涵和应用
在概率论与数理统计中,中心极限定理是非常重要的一节内容,而且是概率论与数理统计之间承前启后的一个重要纽带。

中心极限定理是概率论中讨论随机变量和的分布以正态分布为极限的一组定理。

这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量之和近似服从于正态分布的条件。

故为了深化同学们的理解并掌握其重要性,本组组员共同努力,课外深入学习,详细地介绍了中心极限定理的内涵及其在生活实践中的应用。

一、独立同分布下的中心极限定理及其应用
在对中心极限定理的研究中,我们不妨由浅入深地来学习,为此我们先来研究一下在独立同分布条件下的中心极限定理,即如下的定理1:
定理l (林德伯格-勒维中心极限定理)设{}n X 是独立同分布的随机变量序列,且0)(,)(2>==σμi i X Var X E 存在,若记
n
n X Y n i i n σμ-=
∑=1 则对任意实数y ,有 {}⎰∞--∞→=Φ=≤y t n n t y y Y P .d e π21)(lim 22
(1) 证明:为证明(1)式,只须证}{n Y 的分布函数列弱收敛于标准正态分布。

由定理可知:只须证}{n Y 的特征函数列收敛于标准正态分布的特征函数。

为此,设μ-n X 的特征函数为)(t ϕ,则n Y 的特征函数为
n
Y n t t n ⎥⎦⎤⎢⎣⎡=)()(σϕϕ 又因为E(μ-n X )=0,Var(μ-n X )=2σ,所以有()0ϕ'=0,2)0(σϕ-=''。

于是,特征函数)(t ϕ有展开式
)(2
11)(2)0()0()0()(22222t o t t o t t +-=+''+'+=σϕϕϕϕ 从而有
=⎥⎦⎤⎢⎣⎡+-=+∞→+∞→n n Y n n t o n
t t n )(21lim )(lim 22ϕ22t e - 而22
t e -正是N(0,1)分布的特征函数,定理得证。

这个中心极限定理是由林德贝格和勒维分别独立的在1920年获得的,定理告诉我们,对于独立同分布的随机变量序列,其共同分布可以是离散分布,也可以是连续分布,可以是正态分布,也可以是非正态分布,只要其共同分布的方差存在,且不为零,就可以使用该定理的结论。

定理1的结论告诉我们:只有当n 充分大时,n Y 才近似服从标准正态分布
)1,0(N ,
而当n 较小时,此种近似不能保证。

也就是说,在n 充分大时,可用)1,0(N 近似计算与n Y 有关事件的概率,而n 较小时,此种计算的近似程度是得不到保障的。

当)1,0(~N Y n 时,则有),(~),,(~22
1n N X n n N X n i i σμσμ∑=
经过多方面的理论研究,我们可知定理1主要适用于以下两个方面;
应用一:求随机变量之和n S 落在某区间的概率(例如例2.)。

应用二:已知随机变量之和n S 取值的概率,求随机变量的个数n 。

在日常生活中,我们会发现其实有很多的例子均可用林德伯格-勒维中心极限定理来解决。

在此我们从中选择了几个典型而又带有新意的例子,仅供大家参考。

例1.用中心极限定理说明在正常的射击条件下,炮弹的射程服从或近似服从正态分布。

[1]
解:设a 为理论射程,ξ为实际射程,则η=ξ-a 为实际射程对理论射程的偏差,显然ξ=η+a ,故只需证η~N(μ,2σ)。

由于在实际射击中,有很多不可控制的随机因素在不断变化,所以造成了实际射程对理论射程的偏差,若设1ξ:射击时炮身振动引起的偏差,2ξ:炮弹外形差异引起的偏差,3ξ:炮弹内火药的成分引起的偏差,4ξ:射击时气流的差异引起的偏差……,n ξ:……,显然有
η=∑=n i i 1
ξ
∵影响实际射程的因素是大量的,
∴这里的n 一定很大,
又∵炮身的振动、炮弹的外形、火药的成分、气流的变化…….这些因素之间没有什么关系(或有微弱关系)。

∴由它们引起的1ξ,2ξ,……n ξ可看做是相互独立的。

而正常的射击条件也就是对射程有显著影响的因素已被控制,所以1ξ,2ξ,……n ξ所起的作用可看做是同样微小。

∴由中心极限定理可知η~N(μ,2σ)。

∵η可正,可负且相会均等 ∴p=0 ∴η~N(0,2σ)。

则),(~2σηξa N a +=
从这个例子来看,虽然看上去有点复杂,但是我们还是很清晰地可以看到如果一个随机变量能表示成大量独立随机变量的和,并且其中每一个随机变量所起的作用都很微小,则这个随机变量服从或近似服从正态分布,这给我们的计算带来很大方便。

现在的旅游、汽车等行业越来越受欢迎,为了体现中心极限定理的重要性,我们不妨从现实生活中的热门行业说起,看看它到底起到怎样的重要性。

例2.某汽车销售点每天出售的汽车服从参数为λ=2的泊松分布,若一年365天都经营汽车销售,且每天出售的汽车数是相互独立的,求一年中售出700辆以上汽车的概率。

[1]
解:设i ξ为第i 天出售的汽车的数量,则36521......ξξξξ+++=为一年的总销量,由2)()(==i i Var E ξξ,知=)(ξE 365×2=730
利用中心极限定理得
P(ξ>700)=1-P(ξ≤700)≈1—
)730730700(-Φ=1-Φ(一1.11)=0.8665
从此例可以看出,中心极限定理揭示了离散型随机变量与连续型随机变量的内在关系,即离散型随机变量的极限分布是正态分布。

事实上,在现实生活中的很多方面,我们都能清晰地看到中心极限定理的存在。

那么在理论中,我们也可用它来解决一些比较抽象的问题,比如下面的极限求解问题。

例3.利用中心极限定理证明:
21!lim 0=∑=-∞→n k k n n k n e [1] 证明:设{k ξ}独立同分布且k ξ~P(1),k=1,2…….
则a=()k E ξ=l ,2σ=()k Var ξ=1
∵由泊松分布的可加性知∑=n
k k 1ξ~P(n) ∴n n k k n k n i i n k k e k n k P n P -====∑∑∑∑=⎪⎭⎫ ⎝⎛==⎪⎭⎫ ⎝⎛≤0011!
ξξ
又∵由中心极限定理知:
()⎥⎦
⎤⎢⎣⎡≤-=⎪⎭⎫ ⎝⎛≤-=⎪⎭⎫ ⎝⎛≤∑∑∑===010111k n k n k k n k k P n P n P ξξξ ()()00111Φ→⎥⎦
⎤⎢⎣⎡≤-=∑=n k k n P ξ ()∞→=n 2
1 ∴21!
lim 0=∑=-∞→n k k n n k n e
如果在林德伯格-勒维中心极限定理中,n X 服从二项分布,就可以得到以下的定理:
定理2(棣莫弗-拉普拉斯中心极限定理)设n 重伯努利试验中,事件A 在每次试验中出现的概率为p (0<p<1),记n S 为n 次试验中事件A 出现的次数,且记npq np
S Y n n -=*,则对任意实数y ,有dt e y y Y P y
t n n ⎰∞--∞→=
=≤2*221)()(lim πφ
该定理是林德伯格-莱维中心极限定理的特殊情况,是最早的中心极限定理。

大约在1733年,棣莫弗对p=2
1证明了上述定理,后来拉普拉斯把它推广至p 是任意一个小于l 的正数上去。

它表明,n 充分大时,npq np
S Y n n -=*分布近似服从与标准正态分布,常称为
“二项分布收敛于正态分布”,正态分布是二项分布的极限分布,当n 充分大时,我们可以利用该定理的结论来计算二项分布的概率。

由于此定理有更广泛的实际应用,我们将在下面的部分具体地分析棣莫弗-拉普拉斯中心极限定理在实际生活中的应用。

二、独立不同分布下的中心极限定理及其应用
前面我们已经在独立同分布的条件下,解决了随机变量和的极限分布问题。

在实际问题中说诸i X 具有独立性是常见的,但是很难说诸i X 是“同分布”的随机变量。

比如在我们的生活中所遇到的某些加工过程中的测量误差n Y ,由于其是由大量的“微小的”相互独立的随机因素i X 叠加而成的,即∑==n
i i n X Y 1,诸i
X 间具有独立性,但不一定同分布。

在此,我们还要深入地研究在独立不同分布的
前提下,各随机变量和的极限分布问题,目的是给出极限分布为正态分布的条件。

为使极限分布是正态分布,必须对∑==n
i i n X Y 1的各项有一定的要求。

譬如若
允许从第二项开始都等于0,则极限分布显然由1X 的分布完全确定,这时就很难得到什么有意思的结果。

这就告诉我们,要使中心极限定理成立,在和的各项中不应有起突出作用的项,或者说,要求各项在概率意义下“均匀地小”。

下面我们来分析如何用数学式子来明确表达这个要求。

设}{X n 是一个相互独立的随机变量序列,它们具有有限的数学期望和方差: i i X E μ=)(,2)(i i X Var σ=,.,2,1⋅⋅⋅=i
要讨论随机变量的和∑==n
i i n X Y 1,我们先将其标准化,即将它减去均值、除
以标准差,由于
,)(21n n Y E μμμ+⋅⋅⋅++=)(n Y σ=)(n Y Var =22221n σσσ+⋅⋅⋅++,
且记)(n Y σ=n B ,则n Y 的标准化为∑=*-=+⋅⋅⋅++-=n i n i i n n n n
B X B Y Y 121)(μμμμ。

如果要求中各项n
i i B X μ-“均匀地小”,即对任意的,0>τ要求事件}{}{n i i n i
i ni B X B X A τμτμ>-=>-=发生的可能性小,或直接要求其概
率趋于0.为达到这个目的,我们要求0)max (lim
1=>-≤≤∞→n i i n
i n B X P τμ。

因为 ∑==≤≤>-≤>-=>-n
i n i i n
i n i i n i i n i B X P B X P B X P 111)())(()max (τμτμτμ , 若设诸i X 为连续随机变量,其密度函数为)(x p i ,则上式右边=∑⎰∑⎰=>-=>--≤n i B x i i n n i B x i n i n i dx x p x B dx x p 12221)()(1)(τμτμμτ
因此,只要对任意的,0>τ有
0)()(1lim 1222=-∑⎰=>-∞→n i B x i i n n n i dx x p x B τμμτ, )2(
就可保证*n Y 中各加项“均匀地小”。

上述条件(2)称为林德伯格条件[2]。

林德伯格证明了满足(2)条件的和*n Y 的极限分布是正态分布,这就是下面给出林德伯格中心极限定理。

定理3(林德伯格中心极限定理) 设独立的随机变量序列设}{X n 满足(2)林德伯格条件,则对任意的x ,有
dt e x X B P x
t n i i i n n ⎰∑∞--=∞→=≤-212
21))(1(lim πμ.
假如独立随机变量序列}{X n 具有同分布和方差有限的条件,则必定满足以上(2)林德伯格条件,也就是说定理l 是定理3的特例。

这一点是很容易证明的:
设}{X n 是独立同分布的随机变量序列,为确定起见,设诸i X 是连续随机变量,其共同的密度函数为.,),(σσμμ==i i x p 这时,n B n σ=由此得
.)()()()(1
22122⎰∑⎰>-=>--=-n x i n i B x i n i n i dx x p x n n dx x p x B τσμτμμσμ 因为方差存在,即,)()()(2∞<-=
⎰+∞∞-dx x p x X Var i μ 所以其尾部积分一定有,0)()(lim
2=-⎰>-∞→n
x i n i dx x p x τσμμ故林德伯格条件满足。

林德伯格条件虽然比较一般,但该条件较难验证,因此在实际的应用中,我们都不怎么使用林德伯格中心极限定理。

在此情况下,为了使独立不同分布的中心极限定理便于运用,我们深入研究了下面的李雅普诺夫(Lyapunov )中心极限定理。

我们之所以讲李雅普诺夫中心极限定理便于运用,是因为李雅普诺夫条件比较验证,而且它只对矩提出要求,为我们的求解带来了极大的方便之处。

为此我们特地分一节内容来研究它,希望它的出现能引起我们的极大重视。

三、李雅普诺夫中心极限定理的特殊应用
定理4(李雅普诺夫中心极限定理)设}{n X 为独立随机变量序列,并且
()k k X E μ= ,,0)(2>=k k X Var σ),,,2,1(n k ⋅⋅⋅=
记∑-=n k k
n B 1
22σ,若存在,0>δ满足,0)(1lim 122=-∑-+++∞→n k k k n n X E B
δδμ则随机变量之和∑-n k k X
1的标准化变量n n k k n
k k
n k k n k n k k k n B X X Var X E X Z ∑∑∑∑∑===---=-=11111)
()
(μ的分布
函数),(x F n 对于任意的x 满足
⎰∑∑∞-==+∞→+∞→Φ==≤-=x
t n n
k k n k k n n n x dt e x B X P x F 。

)(21)(lim )(lim 2
11πμ 这个定理是李雅普诺夫在1900年提出的。

它表明,在定理条件下,随机变量n
n
k k n k k n B X Z ∑∑==-=11μ,当n 很大时,近似地服从正态分布),1,0(N 由此,当n 很大时,∑∑--=n k k n n n
k k Z B X
11
μ近似地服从正态分布),(21n n k k B N ∑-μ。

也就是说,无论各个随机变量),,2,1(n k X k ⋅⋅⋅=服从什么分布,只要满足定理条件,那么它们
的和∑-n k k X 1,当n 很大时,就近似地服从正态分布,这就是为什么正态随机变量在概率论中占有重要地位的一个基本原因。

在实际生活的很多问题中,所考虑的随机变量往往可以表示成很多个独立的随机变量之和。

例如:在任一指定时刻,一个城市的耗电量是大量用户的耗电量的总和;一个物理实验的测量误差是由许多观察不到的、可加的微小误差所合成的,它们往往近似地服从正态分布。

在现实生活中,人们往往比较在意钱的花费,那么在器件价格预算方面,李雅普诺夫中心极限定理又有着怎样的神奇之处呢?请看下面这例题。

例4.某种器件使用寿命(单位:小时)服从指数分布,其平均使用寿命为20小时,具体使用时是一器件损坏后立即更换另一个新器件,如此继续,已知每个器件进价为a 元。

试求在年计划中应为此器件作多少预算才可能有95%的把握一年够用(假定一年有2000个工作小时)?[3]
解:设第k 个器件使用寿命为k X ,由于k X 服从参数为λ的指数分布,且=)(i X E 20,所以=)(i X E λ1,201=λ,那么,4001)(2==λ
i X Var 。

假定一年至少准备n 件才能有95%的把握够用,,,,,,,,2,121n X X X n k ⋅⋅⋅⋅⋅⋅=相互独立,记∑-=n n i n X
Y 1,由李雅普诺夫中心极限定理知95.0}2000{=≥n Y P
即0.05=)20202000(}202020002020{}2000{n
n n n n n Y P Y P n
n -≈-<-=<φ 所以95.0)100()20202000(≈-=-n n n n φφ。

查表得:118,64.1100≈=-n n
n 。

所以,在年计划中应为此器件作118件预算才可能有95%的把握一年够用。

四、中心极限定理在二项分布中的特殊应用
由于二项分布在实际问题中有着大量的应用,因此在这些中心极限定理中,棣-拉中心极限定理有着更重要的地位,它可以解决的问题类型也特别多。

如果在棣莫弗-拉普拉斯中心极限定理中,我们将二项分布看成是n 个独立同分布的0—1分布的和,于是我们能得到下面的棣莫弗-拉普拉斯中心极限定理,即如下的两个定理:
设),(~p n B X ,则
(1) 局部极限定理
当n 较大时,npq np k k n k e npq q p k n k X P 2)(2
21)(---=⎪⎪⎭
⎫ ⎝⎛==π
(2) 积分极限定理 当n 较大时,⎪⎪⎭
⎫ ⎝⎛--⎪⎪⎭⎫ ⎝⎛-=-=<<npq np a npq np b a F b F b X a P φφ)()()( 其中n k p q ,...2,1,0,1=-=
该定理的具体应用主要有以下几个方面:
应用一:导出贝努利大数定理。

应用二:近似计算服从二项分布的随机变量在某范围内取值的概率。

应用三:已知服从二项分布的随机变量在某范围内取值的概率,估计该范围(或该范围的最大值)。

应用四:与用频率估计概率有关的二项分布的近似计算。

这里主要阐述棣莫弗-拉普拉斯中心极限定理在现实生活中有关二项分布的应用问题。

在前面的学习中,我们已经知道了“二项分布的泊松近似”,即用泊松分布来作为相应的二项分布的近似。

在二项分布),(p n b 中,当n 较大,而p 又较小的情况下时,我们有以下的泊松定理。

定理5 (泊松定理)在n 重伯努利试验中,记事件A 在一次试验中发生的概率为n P (与试验次数n 有关),如果当∞→n 时,有λ→n nP ,则
λλ--∞→=-⎪⎪⎭
⎫ ⎝⎛e k P P k n k
k n k n k n n !)1(lim 而在二项分布),(p n b 中,当n 较大,p 又不小时,且当p 处在5>np 和5)1(>-p n 时,则用正态分布近似比较好,这就用到了棣莫弗-拉普拉斯中心极限定理。

棣莫弗-拉普拉斯中心极限定理在各个方面都有着广泛的应用,尤其是在管
理中也有着不小的应用,请看下面的这例题:
例5. 水房拥挤问题:假设绍兴文理学院要建新校区,里面有学生5000人,只有一个开水房。

由于每天傍晚打开水的人较多,经常出现同学排长队的现象,为此校学生会特向后勤集团提议增设水龙头。

假设后勤集团经过调查,发现每个学生在傍晚一般有1%的时间要占用一个水龙头,现有水龙头45个,现在总务处遇到的问题是:
(1)未新装水龙头前,拥挤的概率是多少?
(2)至少要装多少个水龙头,才能以95%以上的概率保证不拥挤?[4]
分析:首先,我们先设5000个学生中占有水龙头的人数为随机变量X ,未新装水龙头前,拥挤的概率为p 。

因为题中占有水龙头的人和人之间是独立的,而且占用水龙头的概率都一样为0.01。

因此比较容易看出,此题中的X 是服从二项分布的,所以我们可用二项分布的方法将p 的具体值求出来,即有了下面的解法一:
解法一:(1).因为)01.0,5000(~B X ,所以有
()k k k k X P -⎪⎪⎭
⎫ ⎝⎛==5000)99.0(01.05000,其中5000,...2,1,0=k , 于是有
∑=-⎪⎪⎭⎫ ⎝⎛=≤≤-=>=45
0k 500099.001.05000-145)(0 P 145)P(p k k k ξξ (2). 欲求m ,使得95.0)0(≥≤≤m P ξ,则
95.099.001.00500099.001.0500050000m
0k 5000≥⎪⎪⎭⎫ ⎝⎛-⎪⎪⎭⎫ ⎝⎛∑=-k k k 这种方法可以把p 和m 的具体值求出来。

但是,用这种方法做这道题的时候,在求X 等于某一个值的时候都比较困难,更何况求上千个呢,所以这种方法理论上可以,但是实际上是行不通的。

当二项分布不好求时,我们还学过用泊松分布来近似,因为泊松分布是有表可查的,那么这道题可不可以用泊松分布来近似呢?应该说是不可以的,因为二项分布去近似泊松分布的时候,要求二项分布中的n 要比较大,p 要比较小,而且np 也要不大,而本题中,np=50,显然是太大了,所以用泊松分布近似是行不通的。

那么现在再让我们看看中心极限定理,它是可以用来近似二项分布),(p n b 的,只要该二项分布中的n 较大,p 又不小时,且当p 处在5>np 和5)1(>-p n 时,就可以用正态分布来近似。

而这里,50=np ,4950)1(=-p n ,均满足中心极限定理的条件,故有了下面的解法二:
解法二:(1).设同一时刻,5000个学生中占用水龙头的人数为X ,则
)01.0,5000(~B X
拥挤的概率是
∑=-⎪⎪⎭⎫ ⎝⎛=≤≤-=>=45
0k 500099.001.05000-145)(0 P 145)P(p k k k ξξ 由棣莫弗一拉普拉斯中心极限定理,n=5000,p=0.01,q=0.99,
04.7,50==npq np

2389.0)1.7()71.0()04
.7500()04.75045()450(=---=---=≤≤φφφφξP 即拥挤的概率为
7611.02389.01)45(=-=>ξP (2).欲求m ,使得95.0)0(≥≤≤m P ξ,则由棣莫弗一拉普拉斯中心极限定理可知,95.0)04
.7500()04.750(≥---φφm 由于0)09.7()04
.7500(≈-=-φφ 即95.0)04
.750(≥-m φ 查表得645.104
.750≥-m 即6.61≥m
故需装62个水龙头,才能以95%以上的概率保证不拥挤。

从这一题中,我们可明显地看出中心极限定理在实际应用中起到很重要的作用,尤其是棣莫弗-拉普拉斯中心极限定理能很好地处理好二项分布中的近似计算问题。

正所谓“人有旦夕祸福,月有阴晴圆缺”,我们生活在这世上并总不是那么一帆风顺的,因此很多人都想去买保险,为的只是以防万一。

而很多年长的人,也会选择去买养老保险。

那么我们是不是很想知道中心极限定理在保险方面的应用呢?请看以下这道例题:
例6. 某保险公司有2500个人参加保险,每人每年付1200元保险费,在一年内一个人死亡的概率为0.002,死亡时其家属可向保险公司领得20万元。

问:
(1)保险公司亏本的概率有多大?(2)保险公司一年的利润不少于1010万元,200万元的概率各为多大? [3]
分析:首先,我们先设一年内死亡的人数为随机变量X ,保险公司亏本的概率为P 。

因为题中人和人之间是独立的,而且死亡的概率都一样为0.002,因此
比较容易看出,此题中的X 是服从二项分布的,我们也可用二项分布的方法把p
具体地求出来,但要想求出()k k k k X P -⎪⎪⎭
⎫ ⎝⎛==2500)998.0(002.02500绝非易事,更何况还要算上几千个呢?为此我们不妨用中心极限定理来求解它。

解:设X 为一年内死亡的人数,则)002.0,2500(~B X ,5=np ,99.1)1(=-p np
(1)由棣莫弗一拉普拉斯中心极限定理知
P(亏本)=(4.48)-1)4.995-15(
-115)P(X -115) X ( P 300)(20X P φφ=≈≤=>=> =1-0.99993=0.00007
所以,保险公司亏本的概率为0.00007,几乎为0。

(2)由棣莫弗一拉普拉斯中心极限定理知
P(利润100≥)98.0)99.4510(
)10()10020300(=-≈≤=≥-=φX P X P P(利润200≥)5.0)99.45
5()5()20020300(=-≈≤=≥-=φX P X P
以上结果说明,保险公司几乎不可能亏本.不过,关键之处是对死亡率的估计必须正确,如果所估计的死亡率比实际低,甚至低得多,那么,情况就会不同。

五、中心极限定理与切比雪夫不等式的联系与区别
前面我们已经学过了切比雪夫不等式,为了更好地与中心极限定理相比较,我们先来熟悉一下何为切比雪夫不等式。

切比雪夫不等式:设随机变量X 具有有限期望μ和方差)(X Var ,则对与任意正数ε,有如下的不等式成立
2)
()|(|εεμX Var X P ≤≥-。

从上述切比雪夫不等式的定义可知,它和中心极限定理一样,都可以对所求的问题进行适度地估计,而且切比雪夫不等式和中心极限定理都要用到变量的期望μ与方差)(X Var 。

但不同的是,切比雪夫不等式在应用中,是在随机变量X 的分布未知的情况下,只利用X 的期望与方差,即可对X 的概率分布进行估值,但往往这种情况下估出来的值是粗糙的。

而中心极限定理在生活中的应用则是对于相互独立的随机变量序列}{n X ,不管),...,2,1(n i X i =服从什么分布,只要它们是服从同一分布,且有数学期望和方差,那么,当n 充分大时,这些随机变量之和∑=n
i i X 1就近似地服从正态分布),(2σμN 。

为了加深对它们的理解,请先看以下
这道例题:
例7.假设电站电网有10000盏电灯,夜晚每一盏灯开灯的概率都是0.7,而假定开关之间彼此独立,估计夜晚开着的灯数在6800与7200之间的概率。

[5]
分析:首先,我们先设夜晚开着的灯数为随机变量X ,夜晚开着的灯数在6800与7200之间的概率为P 。

因为题中灯和灯之间是独立的,而且开着的概率都一样为0.7,因此比较容易看出,此题中的X 是服从二项分布的,所以我们可用二项分布的方法将P 的具体值求出来,但是根据第四部分的分析,我们可知算一个()k k k k X P -⎪⎪⎭
⎫ ⎝⎛==10000)3.0(7.010000就很困难,那么如果要算3999个这样的值是不是显得不太实际呢?仔细观察这题的问题,不难发现,最后所求的区间是关于随机变量X 的数学期望EX 对称的区间,而且是要估计最后的结果,因此我们可以用切比雪夫不等式来估计。

我们都知道,切比雪夫有着一个重要的不等式,即()2)
(1|)(|εεX Var X E X P -≥<-,所以有着下面的解法一::
解法一:因为)7.0,10000(~B X ,所以
70007.0*10000)(==X E ,21003.0*7.0*10000)(==X Var ,因此,
根据切比雪夫不等式,有
9475.0200
21001)200|7000(|)72006800(2=-≥<-=<<=X P X P p 因此由切比雪夫不等式估计出的最后结果为]1,9475.0[∈p ,区间长度较短,结果较好。

切比雪夫不等式估计出来的结果是比较好,但是这还只是估计出结果属于的区间,到底结果是多少还是不知道。

要想知道具体结果是什么,还是用中心极限定理来研究比较简单。

根据棣莫弗-拉普拉斯中心极限定理的积分极限定理,我们可知例题的条件符合它,为此我们有如下的解法:
解法二:因为)7.0,10000(~B X ,所以根据积分极限定理有,
⎪⎪⎭⎫ ⎝⎛--⎪⎪⎭⎫ ⎝
⎛-=-≈<<=210070006800210070007200)6800()7200()72006800(φφF F X P p =1)37.4(2)37.4()37.4(-=--φφφ,
据标准正态分布函数表,有()999993788.037.4=φ,所以
999987576.01999993788.02)72006800(=-⨯=<<=X P p 从这一题中,我们可明显地看出切比雪夫不等式和中心极限定理在处理二项分布中的近似计算问题时都有着极其强大的功能。

但是相比于切比雪夫不等式,我们也可明显地看出中心极限定理的精确与方便。

例8. 现有一大批种子,其中良种占6
1,今在其中任选6000粒,试分别用切比雪夫不等式估计和用中心极限定理计算在这些种子中良种所占的比例与61之差小于1%的概率是多少?[6]
分析:我们不妨先设6000粒种子中良种的个数为随机变量X ,这些种子中良种所占的比例与6
1之差小于1%的概率为P 。

因为题中良种之间是独立的,而且是良种的概率都一样为6
1。

所以我们可知,X 服从于二项分布,即有)6
1,6000(~B X 。

解:设选出的种子中的良种粒数为X ,则)6
1,6000(~B X ,于是, 65000)(,1000)(==X Var X E ,要估计的概率为}100
1|616000{|<-X P (1) 用切比雪夫不等式估计此概率:
2315.013600165000160)(1}60|1000{|}1001|616000{|
2
-=⨯-=-≥<-=<-X Var X P X P =0.7685。

即用切比雪夫不等式来估计此概率不小于0.7685
(2) 由棣莫弗-拉普拉斯中心极限定理,对于二项分布)6
1,6000(B ,可用正态分布)6
5000,1000(N 来近似,于是所求概率为 ⎪⎪⎭⎫ ⎝⎛--⎪⎪⎭⎫ ⎝⎛-=≤≤=<-6/500010009406/500010001060}1060940{}1001|616000{|ϕϕX P X P 9625.01)0785.2(2=-≈ϕ。

即用中心极限定理来估计此概率不小于0.9625。

从上例看出:用切比雪夫不等式只能得到要求的概率不小于0.7685,而用中心极限定理可得出要求的概率近似等于0.9625,从而知道由切比雪夫不等式得到的下界是十分粗糙的,中心极限定理的近似结果更为精确。

例9.设在n 重伯努利试验中,每次事件A 出现的概率均为0.70,要使事件A 出现的频率在0.68到0.72之间的概率不小于0.90,问至少要进行多少次试验?[6]
分析:我们不妨先设n 重伯努利试验中A 出现的次数为随机变量X 。

因为题中事件A 每次的出现是独立的,而且是出现的概率都一样为0.70。

所以我们可
知,X 服从于二项分布,即有)70.0,(~n B X 。

解:设X 表示n 重伯努利试验中事件A 出现的次数,则)70.0,(~n B X 。

于是: n X Var n X E 21.0)(,70.0)(==,相应的频率为n
X ,问题是要求出适当的n,使得
90.0}72.068.0{≥≤≤n
X P (1)用切比雪夫不等式估计最少的试验次数:
2)02.0(21.0}02.0|70.0{|}72.068.0{}72.068.0{n n n n X P n X n P n X P ≥<-=≤≤=≤≤n
5251-= 解不等式90.05251≥-
n ,得5250≥n 即用切比雪夫不等式来估计最少的试验次数为5250次,才能满足要求。

(2)用棣莫弗一拉普拉斯中心极限定理估计,对于二项分布)70.0,(n B 可用 正态分布)21.0,70.0(n n N 来近似,于是
⎪⎪⎭⎫ ⎝
⎛--⎪⎪⎭⎫ ⎝⎛-≈≤≤=≤≤n n n n n n n X n P n X P 21.070.072.021.070.068.0}72.068.0{}72.068,0{ϕϕ)10436.0(2-≈n ϕ,解不等式90.0)10436.0(2≥-n ϕ 查表得,645.10436.0≥n
解得1424≥n 。

即用中心极限定理来估计最少的试验次数为1424次。

比较两种方法得出得不同结果,可以看到用切比雪夫不等式估计得结果,要多做3826次试验,这将要做很多得无用功。

从上述三例可看出,在做某些估计的时候,虽然用切比雪夫不等式也是可以适当地估计,但是用中心极限定理来估计时,得到的结果往往更加的精确,更加地值得人们的信任。

小结:通过本文介绍的中心极限定理在现实生活中的各方面都有着很好的运用。

因此,灵活地掌握林德贝格一勒维中心极限定理、棣莫弗一拉普拉斯中心极限定理、李雅普诺夫中心极限定理等中心极限定理,并利用它们来解决现实生活中的应用问题是很有必要的。

参考文献
[1]杜伟娟,于文娟.中心极限定理及其初步应用[J] 内蒙古电大学刊.2007.
[2]茆诗松,程依明,濮晓龙.概率论与数理统计教程[M] 北京:高等教育出版杜.2004.
[3]孙蓓.中心极限定理及其在若干实际问题中的应用[D] 河南:开封基础教育研究室.2012.
[4] 孔祥凤. 中心极限定理在管理中的应用[J] 西安邮电学院应用数理系.2009.
[5]张琳.中心极限定理的优势[J] 山东:山东工商学院.2008.
[6] 李生彪.中心极限定理在实际中的应用[J] 甘肃:甘肃联合大学数信学院.2008.。

相关文档
最新文档