中心极限定理证明
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中心极限定理证明
一、例子
高尔顿钉板试验.
图中每一个黑点表示钉在板上的一颗钉子.每排钉子等距排列,下一排的每个钉子恰在上一排两相邻钉子之间.假设有排钉子,从入口中处放入小圆珠.由于钉板斜放,珠子在下落过程中碰到钉子后以的概率滚向左边,也以的概率滚向右边.如果较大,可以看到许多珠子从处滚到钉板底端的格子的情形如图所示,堆成的曲线近似于正态分布.
如果定义:当第次碰到钉子后滚向右边,令;当第次碰到钉子后滚向左边,令.则是独立的,且
那么由图形知小珠最后的位置的分布接近正态.可以想象,当越来越大时接近程度越好.由于时,.因此,显然应考虑的是的极限分布.历史上德莫佛第一个证明了二项分布的极限是正态分布.研究极限分布为正态分布的极限定理称为中心极限定理.
二、中心极限定理
设是独立随机变量序列,假设存在,若对于任意的,成立
称服从中心极限定理.
设服从中心极限定理,则服从中心极限定理,其中为数列.
解:服从中心极限定理,则表明
其中.由于,因此
故服从中心极限定理.
三、德莫佛-拉普拉斯中心极限定理
在重贝努里试验中,事件在每次试验中出现的概率为为次试验中事件出现的次数,则
用频率估计概率时的误差估计.
由德莫佛—拉普拉斯极限定理,
由此即得
第一类问题是已知,求,这只需查表即可.
第二类问题是已知,要使不小于某定值,应至少做多少次试验这时利用求出最小的.
第三类问题是已知,求.
解法如下:先找,使得.那么,即.若未知,则利用,可得如下估计:.
抛掷一枚均匀的骰子,为了至少有的把握使出现六点的概率与之差不超过,问需要抛掷多少次
解:由例4中的第二类问题的结论,.即.查表得.将代入,便得.由此可见,利用比利用契比晓夫不等式要准确得多.
已知在重贝努里试验中,事件在每次试验中出现的概率为为次试验中事件出现的次数,则服从二项分布:
的随机变量.求.
解:
因为很大,于是
所以
利用标准正态分布表,就可以求出的值.
某单位内部有260架电话分机,每个分机有的时间要用外线通话,可以认为各个电话分机用不用外线是是相互独立的,问总机要备有多少条外线才能以的把握保证各个分机在使用外线时不必等候.
解:以表示第个分机用不用外线,若使用,则令;否则令.则.
如果260架电话分机同时要求使用外线的分机数为,显然有.由题意得,
查表得,,故取.于是
取最接近的整数,所以总机至少有16条外线,才能有以上的把握保证各个分机在使用外线时不必等候.
根据孟德尔遗传理论,红黄两种番茄杂交第二代结红果植株和结黄果植株的比率为3:1,现在种植杂交种400株,试求结黄果植株介于83和117之间的概率.
解:将观察一株杂交种的果实颜色看作是一次试验,并假定各次试验是独立的.在400株杂交种中结黄果的株数记为,则.
由德莫佛—拉普拉斯极限定理,有
其中,即有
四、林德贝格-勒维中心极限定理
若是独立同分布的随机变量序列,假设,则有
证明:设的特征函数为,则
的特征函数为
又因为,所以
于是特征函数的展开式
从而对任意固定的,有
而是分布的特征函数.因此,
成立.
在数值计算时,数用一定位的小数来近似,误差.设是用四舍五入法得到的小数点后五位的数,这时相应的误差可以看作是上的均匀分布.
设有个数,它们的近似数分别是,.,.令
用代替的误差总和.由林德贝格——勒维定理,
以,上式右端为,即以的概率有
设为独立同分布的随机变量序列,且互相独立,其中,证明:的分布函数弱收敛于.
证明:为独立同分布的随机变量序列,且互相独立,所以仍是独立同分布的随机变量序列,易知有
由林德贝格——勒维中心极限定理,知的分布函数弱收敛于,结论得证.
作业:
p222ex32,33,34,35
五、林德贝尔格条件
设为独立随机变量序列,又
令,对于标准化了的独立随机变量和
的分布
当时,是否会收敛于分布
除以外,其余的均恒等于零,于是.这时就是的分布函数.如果不是正态分布,那么取极限后,分布的极限也就不会是正态分布了.因而,为了使得成立,还应该对随机变量序列加上一些条件.从例题中看出,除以外,其余的均恒等于零,在和式中,只有一项是起突出作用.由此认为,在一般情形下,要使得收敛于分布,在的所有加项中不应该有这种起突出作用的加项.因为考虑加项个数的情况,也就意味着它们都要“均匀地斜.
设是独立随机变量序列,又,,这时
(1)若是连续型随机变量,密度函数为,如果对任意的,有
(2)若是离散型随机变量,的分布列为
如果对于任意的,有
则称满足林德贝尔格条件.
以连续型情形为例,验证:林德贝尔格条件保证每个加项是“均匀地斜.
证明:令,则
于是
从而对任意的,若林德贝尔格条件成立,就有
这个关系式表明,的每一个加项中最大的项大于的概率要小于零,这就意味着所有加项是“均匀地斜.
六、费勒条件
设是独立随机变量序列,又,,称条件为费勒条件.
林德贝尔格证明了林德贝尔格条件是中心极限定理成立的充分条件,但不是必要条件.费勒指出若费勒条件得到满足,则林德贝尔格条件也是中心极限定理成立的必要条件.
七、林德贝尔格-费勒中心极限定理
引理1对及任意的,
证明:记,设,由于
因此,,其次,对,
用归纳法即得.
由于,因此,对也成立.
引理2对于任意满足及的复数,有
证明:显然
因此,
由归纳法可证结论成立.
引理3若是特征函数,则也是特征函数,特别地
证明定义随机变量
其中相互独立,均有特征函数,服从参数的普哇松分布,且与诸独立,不难验证的特征函数为,由特征函数的性质即知成立.
林德贝尔格-费勒定理
定理设为独立随机变量序列,又.令,则
(1)
与费勒条件成立的充要条件是林德贝尔格条件成立.
证明:(1)准备部分
记
(2)
显然(3)
(4)
以及分别表示的特征函数与分布函数,表示的分布函数,那么(5)
这时
因此林德贝尔格条件化为:对任意,
(6)
现在开始证明定理.设是任意固定的实数.
为证(1)式必须证明
(7)
先证明,在费勒条件成立的假定下,(7)与下式是等价的:
(8)
事实上,由(3)知,又因为
故对一切,
把在原点附近展开,得到
因若费勒条件成立,则对任意的,只要充分大,均有
(9)
这时
(10)
对任意的,只要充分小,就可以有
(11)
因此,由引理3,引理2及(10),(11),只要充分大,就有
(12)
因为可以任意小,故左边趋于0,因此,证得(7)与(8)的等价性.
(2)充分性
先证由林德贝尔格条件可以推出费勒条件.事实上,
(13)
右边与无关,而且可选得任意小;对选定的,由林德贝尔格条件(6)知道第二式当足够大时,也可以任意地小,这样,费勒条件成立.
其次证明林德贝尔格条件能保证(1)式成立.注意到(3)及(4),可知,
当时,
当时,
因此
(14)
对任给的,由于的任意性,可选得使,对选定的,用林德贝尔格条件知只要充分大,也可使.因此,已证得了(8),但由于已证过费勒条件成立,这时(8)与(7)是等价的,因而(7)也成立.
(3)必要性
由于(1)成立,因此相应的特征函数应满足(7).但在费勒条件成立时,这又推出了(8),因此,
(15)
上述被积函数的实部非负,故
而且
(16)
因为对任意的,可找到,使,这时由(15),(16)可得
故林德贝尔格条件成立.
八、李雅普诺夫定理
设为独立随机变量序列,又.令,若存在,使有
则对于任意的,有
一,大数定律的证明
二,中心极限定理的证明
§中心极限定理
我们曾特别强调了正态分布在概率论与数理统计中的地位与作用.为什么客观实际中许多随机变量服从正态分布是经验猜测还是确有科学的理论依据,下面我们就来解释这一问题.
我们已经知道,炮弹的弹着点射击误差服从正态分布,我们来分析其原因.要知道误差是什么样的随机变量,有必要研究一下造成误差的原因是什么每次射击后,炮弹会因为震动而造成很微小的偏差x1,炮弹外形细小的差别而引起空气阻力不同而出现的误差x2,炮弹前进时遇到的空气流的微小扰动而造成的误差x3,……等等,有许多原因,每种原因引起一个微小的误差都是随机的,而弹着点的总误差x是许多随机误差的总和,即x=xk,而且xk之间可以看成是相互独立的,因此要讨论x的分布就要讨论这些相互独
k
立的随机变量之和的分布.
在概率论中,我们把研究在一定条件下,大量独立随机变量和的极限分布是正态分布的那些定理通常叫做中心极限定理.本节只介绍两个条件简单,也较常用的中心极限定理.
定理4(同分布中心极限定理)设随机变量x1,x2,…,xn…相互独立,服从同一分布,且具有有限的数学期望和方差,e(xk)=,d(xk)=(k=1,2,…)则随机变量
2xk-nk=1
n的分布函数对任意的x,满足
nnxk-nk=1nx12e-xt2
2dt
中心极限定理及其应用
【摘要】中心极限定理的产生具有一定的客观背景,最常见的是德莫佛-拉普拉斯中心极限定理和林德贝格-勒维中心极限定理。
它们表明了当n充分大时,方差存在的n个独立同分布的随机变量和近似服从正态分布,在实际中的应用相当广泛。
本文讨论了中心极限定理的内容、应用与意义。
【关键词】:中心极限定理正态分布随机变量
一、概述
概率论与数理统计是研究随机现象、统计规律性的学科。
随机现象的规律性只有在相同条件下进行大量重复的实验才会呈现出来,而研究大量的随机现象常常采用极限的形式,由此导致了对极限定理的研究。
极限定理的内容很广泛,中心极限定理就是其中非常重要的一部分内容。
中心极限定理主要描述了在一定条件下,相互独立的随机变量序列x1、x2、…xn、…的部分和的分布律:当n→∞时的极限符合正态分布。
因此中心极限定理这个结论使正态分布在数理统计中具有很重要的地位,也使得中心极限定理有了广泛的应用。
二、定理及应用
1、定理一(林德贝格—勒维定理)
若
k1,=a,2,…是一列独立同分布的随机变量,且ed
k=kx2(2>0),k=1,2,…则有limp(k1
nnnax)n
n12et22dt。
当n充分大时,k1kna
n~n(0,1),k1nk~n(na,n)2
2、定理二(棣莫弗—拉普拉斯中心极限定理)
在n重伯努利试验中,事件a在每次试验中出现的概率为错误!未找到引用源。
,错误!未
找到引用源。
为n次试验中事件a出现的次数,则limp(nnnpnpqx)21xet22dt
其中q1p。
这个定理可以简单地说成二项分布渐近正态分布,因此当n充分大时,可
以利用该定理来计算二项分布的概率。
同分布下中心极限定理的简单应用
独立同分布的中心极限定理可应用于求随机变量之和sn落在某区间的概率和已知随机变量之和sn取值的概率,求随机变量的个数。
例1:设各零件的重量都是随机变量,它们相互独立且服从相同的分布,其数学期望为,均方差为,问5000只零件的总重量超过2510kg 的概率是多少
解:设xi(i=1,2,…,5000)表示第i个零件的重量x1,x2,…,x5000独立同分布且e(xi)=,d(xi)=。
由独立同分布的中心极限定理可知
[3]
=i-φ()=
=
例2:一生产线生产的产品成箱包装,每箱的重量是随机的且同分布,设每箱平均重50kg,标准差为5kg,若用最大载重为50吨的汽车承运,每辆车最多可以装多少箱才能保证不超载的概率大于解:设xi(i=1,2,…,n)是装运第i箱的重量,n为所求箱数。
由条件可把x1,x2,…,xn看作独立同分布的随机变量,而n箱的总重量为tn=x1+x2+…+xn,是独立同分布的随机变量之和。
由e(xi)=50、d(xi)=52得:e(tn)=50n,d(tn)=52n
根据独立同分布的中心极限定理:
[3]
即最多可以装98箱。
例3:报名听心理学课程的学生人数k是服从均值为100的泊松分布的随机变量,负责这门课的教授决定,如果报名人数不少于120,就分成两班,否则就一班讲授。
问该教授讲授两个班的概率是多少分析:该教授讲授两个班的情况出现当且仅当报名人数x不少于120,精确解为p(x≥120)=e-100100i/i!很难求解,如果利用泊松分布的可加性,想到均值为100的泊松分布随机变量等于100个均值为1的独立泊松分布随机变量之和,即x=xi,其中每个xi具有参数1的泊松分布,则我们可利用中心极限定理求近似解。
[2]
解:可知e(x)=100,d(x)=100
教授讲授两个班的概率是。
例4:火炮向目标不断地射击,若每次射中目标的概率是0、1。
(1)求在400次射击中击中目标的次数在区间[30,50]内的概率。
(2)问最少要射击多少次才能使击中目标的次数超过10次的概率不小于
分析:显然火炮射击可看作是伯努利实验。
[1]即
我们知道,正态分布可近似于二项分布,而且泊松分布可近似于二项分布,当二项分布b(n,p),n较大、p较小时可用泊松分布估计近似值。
如果p接近1,有q=l-p很小,这时也可用泊松分布计算;但
是当n较大,p不接近0或1时,再用泊松分布估计二项分布的概率就不够精确了,这时应采用拉普拉斯定理来计算。
解:(1)设在射击中击中目标的次数为yn,所求概率(30≤yn<50)等于:
最小正整数n=147就是所要求的最小射击数。
以上例子都是独立同分布的随机变量,可以用中心极限定理近似估算,但是如果不同分布,中心极限定理是否也成立呢
李雅普诺夫定理
当随机变量xi独立,但不一定同分布时,中心极限定理也成立。
定理3[2](李雅普诺夫定理):
设x1,x2,…,xn,…为独立随机变量序列,且e(xn)=an,d(xn)=σn2存在,bn2=σn2(n=1,2,…),若存在δ>0,使得:也就是说,无论各个随机变量xi服
从什么分布,只要满足李雅普诺夫条件,当n很大时,它们的和近似服从正态分布。
由于在大学本科阶段接触的不同分布的样本较少,本文对它的应用将不举例说明。
中心极限定理以严格的数学形式阐明了在大样本条件下,不论总体的分布如何,样本均值总是近似地服从正态分布。
正是这个结论使得正态分布在生活中有着广泛的应用。
四、中心极限定理的意义
首先,中心极限定理的核心内容是只要n足够大,便可以把独立同分布的随机变量和的标准化当作正态变量,所以可以利用它解决很多实际问题,同时这还有助于解释为什么很多自然群体的经验频率呈现出钟形曲线这一值得注意的事实,从而正态分布成为概率论中最重要的分布,这就奠定了中心极限定理的首要功绩。
其次,中心极限定理对于其他学科都有着重要作用。
例如数理统计中的参数(区间)估计、假设检验、抽样调查等;进一步,中心极限定理为数理统计在统计学中的应用铺平了道路,用样本推断总体的关键在于掌握样本特征值的抽样分布,而中心极限定理表明只要样本容量足够地大,得知未知总体的样本特征值就近似服从正态分布。
从而,只要采用大量观察法获得足够多的随机样本数据,几乎就可以把数理统计的全部处理问(更多内容请访问好范文网)题的方法应用于统计学,这从另一个方面也间接地开辟了统计学的方法领域,其在现代推断统计学方法论中居于主导地位。
参考文献
[1]邓永录着应用概率及其理论基础.清华大学出版社。
[2]魏振军着概率论与数理统计三十三讲.中国统计出版社。
[3]程依明等着概率论与数理统计习题与解答.高等数学出版社。
中心极限定理
中心极限定理(centrallimittheorems)
什么是中心极限定理
大数定律揭示了大量随机变量的平均结果,但没有涉及到随机变量的分布的问题。
而中心极限定理说明的是在一定条件下,大量独立随机变量的平均数是以正态分布为极限的。
中心极限定理是概率论中最着名的结果之一。
它提出,大量的独立随机变量之和具有近似于正态的分布。
因此,它不仅提供了计算独立随机变量之和的近似概率的简单方法,而且有助于解释为什么有很多自然群体的经验频率呈现出钟形(即正态)曲线这一事实,因此中心极限定理这个结论使正态分布在数理统计中具有很重要的地位,也使正态分布有了广泛的应用。
中心极限定理的表现形式
中心极限定理也有若干个表现形式,这里仅介绍其中四个常用定理:
(一)辛钦中心极限定理
设随机变量相互独立,服从同一分布且有有限的数学期望a和方差σ2,则
随机变量,在n无限增大时,服从参数为a
和的正态分布即n→∞时,
将该定理应用到抽样调查,就有这样一个结论:如果抽样总体的数学期望a和方差σ2是有限的,无论总体服从什么分布,从中抽取容
量为n的样本时,只要n足够大,其样本平均数的分布就趋于数学期望为a,方差为σ2/n的正态分布。
(二)德莫佛——拉普拉斯中心极限定理
设μn是n次独立试验中事件a发生的次数,事件a在每次试验中发生的概率为p,则当n无限大时,频率设μn/n
趋于服从参数为的正态分布。
即:
该定理是辛钦中心极限定理的特例。
在抽样调查中,不论总体服从什么分布,只要n充分大,那么频率就近似服从正态分布。
(三)李亚普洛夫中心极限定理
设
差:是一个相互独立的随机变量序列,它们具有有限的数学期望和方。
记,如果能选择这一个正数δ>0,使当n→∞
时,
,则对任意的x有:
该定理的含义是:如果一个量是由大量相互独立的随机因素影响所造成的,而每一个别因素在总影响中所起的作用不很大,则这个量服从或近似服从正态分布。
(四)林德贝尔格定理
设是一个相对独立的随机变量序列,它们具有有限的数学期望和方差满足林德贝尔格条件,则当n→∞时,对任意的x
,有。
中心极限定理案例分析
案例一:中心极限定理在商业管理中的应用
水房拥挤问题:假设西安邮电学院新校区有学生5000人,只有一个开水房,由于每天傍晚打开水的人较多,经常出现同学排长队的现象,为此校学生会特向后勤集团提议增设水龙头。
假
设后勤集团经过调查,发现每个学生在傍晚一般有1%的时间要占用一个水龙头,现有水龙头45个,现在总务处遇到的问题是:(1)未新装水龙头前,拥挤的概率是多少
(2)至少要装多少个水龙头,才能以95%以上的概率保证不拥挤解:(1)设同一时刻,5000个学生中占用水龙头的人数为x,则x~b(5000,)
拥挤的概率是
有定理2,n=5000,p=,q=
,
故
即拥挤的概率
p(ζ>45)=1=
(2)欲求m
,使得
即
由于
即
查表
即
需装62个水龙头。
问题的变形:
(3)至少安装多少个水龙头,才能以99%以上的概率保证不拥挤解:欲求m,使得
即
由
即
查表
即m≥
故需要装67个水龙头。
(4)若条件中已有水龙头数量改为55个,其余的条件不变,1,2两问题结果如何解:(1)
(2)同上。
(5)若条件中的每个学生占用由1%提高到%,其余的条件不变,则(1),
(2)两问题结果如何
解:(1)设同一时刻,5000个学生中占用水龙头的人数为x,则
x-b(5000,
已知n=5000,p=,q=,np=75
,
拥挤的概率达
(2)欲求m,使得
即
由
即
查表
即m≥
故需装90个水龙头。
中心极限定理以严格的数学形式阐明了在大样本条件下,不论总体的分布如何,样本的均值总是近似地服从正态分布。
如果一个随机变量能够分解为独立同分布的随机变量序列之和,则可以直接利用中
心极限定理进行解决。
总之,恰当地使用中心极限定理解决实际问题有着极其重要意义。
第五章大数定理及中心极限定理
中心极限定理-第四章练习题
浅谈中心极限定理及其应用论文
4中心极限定理
中心极限定理和概率统计。