中心极限定理的一个推广及其应用
谈谈中心极限定理及其应用
谈谈中心极限定理及其应用作者:付苗苗来源:《科学导报·学术》2020年第55期【摘要】中心极限定理是概率论与数理统计课程中一个非常重要的定理,衔接着概率论的知识与数理统计的相关知识,既是教学重点又是难点。
中心极限定理证明了,一般的情况下,无论随机变量服从什么样的分布,个相互独立的随机变量的和,当趋向于无穷大时的极限分布,就是正态分布。
本文仅介绍其中两个最基本的中心极限定理,并通过举例简介它的应用。
【关键词】中心极限定理;正态分布;随机变量;应用在概率论与数理统计中,正态分布是一种最重要的分布,它不仅最常见,而且还具有良好的性质。
在现实生活中,许多随机变量都服从正态分布,即使有些原来并不服从正态分布的独立的随机变量序列,它们的和的分布也近似服从正态分布,一般地,如果随机现象的某个数量指标受到众多不确定因素的影响,而且这些不确定因素彼此之间没有什么依存关系,且谁也没有特别突出的影响,那么,这些不确定因素对该数列指标影响的“累积效应”将会使该数列指标近似地服从正态分布。
中心极限定理从理论上证明了,在一般的情况下,无论随机变量服从什么样的分布,个相互独立的随机变量的和,当趋向于无穷大时的极限分布,就是正态分布。
因此,中心极限定理不仅给我们提供了计算相互独立随机变量之和的概率的近似简单方法,而且解释了在现实生活中,为什么很多数量指标都服从或近似服从正态分布这一事实。
根据不同的假设条件,有多个中心极限定理。
这里我们仅介绍两个常用的最基本的中心极限定理,然后,再加以应用。
一、独立同分布的中心极限定理定理1(林德贝格一列维定理)(独立同分布的中心极限定理):设随机变量序列相互独立,且服从同一分布,又具有有限的相同的数学期望和方差,且,则对于随机变量,有。
定理中随机变量的相互独立是说随机变量之间不相互影响,而同分布是指随机变量在序列的前n项部分和中的地位相同,或者说,每个随机变量对前n项的部分和的影响都是微小的。
中心极限定理
概率论与数理统计第四章正态分布§13 中心极限定理暨南大学电气信息学院苏保河主讲第四章正态分布§13 中心极限定理主要内容一、林德伯格—莱维中心极限定理二、棣莫弗—拉普拉斯中心极限定理三、李雅普诺夫中心极限定理暨南大学电气信息学院苏保河主讲例1炮火轰击敌方防御工事100 次, 每次轰击命中的炮弹数服从同一分布, 其数学期望为2, 均方差为1.5. 若各次轰击命中的炮弹数是相互独立的, 求100 次轰击(1)至少命中180发炮弹的概率;(2)命中的炮弹数不到200发的概率.一、林德伯格—莱维中心极限定理解设X k 表示第k 次轰击命中的炮弹数,2()2,() 1.5,1,,100,k k E X D X k ==="相互独立,12100,,,X X X "苏保河主讲设X 表示100 次轰击命中的炮弹数, 由独立同分布的中心极限定理, 例1 解(续1)2()2,() 1.5,k k E X D X ==苏保河主讲1001,k k X X ==∑则2()200,()15,E X D X ==~(200,225).X N 近似地有{180}P X ≥1((180200)/15)Φ≈−−(1.33)Φ=(1)至少命中180发炮弹的概率;1( 1.33)Φ=−−0.9082.=1{180}P X =−<设X 表示100 次轰击命中的炮弹数, 由独立同分布的中心极限定理,例1 解(续2)2()2,() 1.5,k k E X D X ==苏保河主讲1001,k k X X ==∑则()200,()225,E X D X ==2~(200,15).X N 近似地有(2)命中的炮弹数不到200发的概率.{0200}P X ≤<((200200)/15)((0200)/15)ΦΦ≈−−−(0)(13.33)ΦΦ=−−0.5000.=例2检验员逐个检查某产品, 每查一个需用10秒钟. 但有的产品需重复检查一次,再用去10 秒钟. 若产品需重复检查的概率为0.5, 求检验员在8 小时内检查的产品多于1900 个的概率.解在8 小时内检查的产品多于1900 个,即检查1900 个产品所用时间小于8 小时.设X为检查1900 个产品所用的时间(秒),设Xk 为检查第k个产品所用的时间(单位为秒), k= 1, 2, …, 1900.苏保河主讲例3某车间有200 台车床独立地工作,开工率为0.6, 开工时每台耗电为r 千瓦.问供电所至少要供给这个车间多少电力,才能以99.9% 的概率保证这个车间不会因供电不足而影响生产?解设至少要供给该车间a千瓦的电力, X为开工的车床台数, 则X~ B(200, 0.6),由棣莫弗—拉普拉斯中心极限定理,X~ N(120, 48) (近似),欲求a, 使{0}99.9%.P rX a≤≤=苏保河主讲李雅普诺夫中心极限定理的意义如果随机变量X 可以看成许多相的总和,互独立的起微小作用的因素Xk则X 服从或近似服从正态分布.苏保河主讲苏保河主讲1. 离散型随机变量的数学期望第三章内容小结定义1设X 是离散型随机变量, 其分布律是P {X = x k } = p k (k = 1, 2, …),如果收敛, 定义X 的数学期望1||k k k x p ∞=∑1()k k k E X x p ∞==∑一、数学期望2. 连续型随机变量的数学期望定义2设X 是连续型随机变量,()()d E X x f x x∞−∞=∫收敛, 定义X 的数学期望||()d x f x x ∞−∞∫其密度函数为f (x ), 如果苏保河主讲4. 数学期望的性质1.设C 是常数, 则E (C ) = C .4.设X , Y 独立, 则E (XY ) = E (X )E (Y ).2.若k 是常数, 则E (kX ) = kE (X ).3.E (X 1 + X 2) =E (X 1) + E (X 2).条件: X 1,X 2, …, X n 相互独立.11()().n n i i i i i i E C X C E X ===∑∑推广:11()().n n i i i i E X E X ===∏∏推广:苏保河主讲3. 方差的性质1)设a 是常数, 则D (a ) = 0.2)若a 是常数, 则D (aX ) = a 2D (X ).4)若X 1 与X 2相互独立, 则D (X 1±X 2) = D (X 1) + D (X 2).推广:若X 1, X 2, …, X n 相互独立, 则11[](),n ni i i i D X D X ===∑∑211[]().n n i i i i i i D C X C D X ===∑∑3)若a , b 是常数, 则D (aX + b ) = a 2D (X ).苏保河主讲4. 协方差的定义定义对于二维随机变量(X, Y),称E{[X-E(X)][Y-E(Y)]} 为X与Y 的协方差, 记为Cov(X, Y), 即Cov(X, Y) = E{[X-E(X)][Y-E(Y)]}.5. 协方差的计算公式Cov(X,Y)=E(XY)–E(X)E(Y)推论: 若X 与Y 独立, 则Cov(X,Y) = 0.苏保河主讲6. 协方差的性质(1)Cov(X,Y)=Cov(Y,X)(2)Cov(aX,bY)=ab Cov(X,Y), a,b是常数(3)Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)苏保河主讲若X 1, X 2, …, X n 两两独立, 则D (X +Y ) = D (X )+D (Y )+2Cov(X , Y )7. 随机变量和的方差与协方差的关系11()().n ni i i i D X D X ===∑∑11()()2Cov(,)n ni i i j i i i j D X D X X X ==<=+∑∑∑苏保河主讲9. 相关系数的性质2)|| 1.XY ρ≤0,XY ρ=1) X 和Y 独立时但其逆不真.定义对于随机变量X , 如果E (X k )( k = 1, 2, …) 存在, 则称它为X 的k 阶原点矩或k 阶矩.10. 矩和中心矩如果E {[X -E (X )]k } ( k = 1, 2, …) 存在, 则称它为X 的k 阶中心矩.苏保河主讲三、切比雪夫不等式与大数定理1. 马尔科夫不等式2. 切比雪夫不等式3. 切比雪夫大数定理4. 独立同分布下的大数定理5. 伯努利大数定理苏保河主讲用X 表示n 重伯努利试验中事件A 出现(成功)的次数, 其分布律称r.v. X 服从参数为n 和p 的二项分布, 注当n = 1 时, 称X 服从参数为p 的伯努利分布,或0-1 分布.1. 二项分布{}(1),k k n k n P X k C p p −==−0,1,,k n ="记作X ~ B (n , p ).苏保河主讲四、几个重要的随机变量苏保河主讲(),()(1).E X np D X np p ==−如果X ~ B (n , p ),结论:{}(1),k k n k n P X k C p p −==−0,1,,,k n ="2. 超几何分布定义将N个元素分为2 类, M个属于第一类, N-M个属于第二类, 从中按不放回抽样随机取n个元素. 令X表示这n 个元素中第一类元素的个数, 则称X服从超几何分布, 记为X h n N M~(,,)苏保河主讲。
中心极限定理的发展
中心极限定理的创立和发展1141010113 万帅关键词:中心极限定理,创立,严格证明,新的发展,三阶段。
引言:这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量近似服从正态分布的条件。
该定理为人们用正态分布来描述和解决大量的概率问题提供了坚实的理论基础。
中心极限定理,是概率论中讨论随机变量和的分布以正态分布为极限的一组定理。
这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量近似服从正态分布的条件。
该定理为人们用正态分布来描述和解决大量的概率问题提供了坚实的理论基础。
“中心极限定理”这一名称的来源有两种说法。
波利亚认为这个定理十分重要,在概率论中具有中心地位,所以他加上了“中心”这一名称,于1920年引入这一术语。
另一种说法是,现代法国概率论学派认为极限定理描述了分布函数中心的情况,而不是尾部的情况。
历史上有不少数学家对中心极限定理的研究做出了贡献。
中心极限定理的发展主要分为三个阶段。
创立阶段:1733-----1853年人们通常认为,法国数学家隶莫弗在1733年首次证明了,二项发布近似正态分布。
然而,当时正态发布的概念,隶莫弗并不知道自己本质上证明了“中心极限定理”法国数学家拉普拉斯写了很多论文,想推广棣莫弗的工作。
他意识到需要一种新的数学技巧,并在1785年成功地发明了这个技巧:特征函数的简单形式和反演公式。
拉普拉斯把他的两个主要研究方向结合起来得到了这个方法-----母函数和积分的监禁展开。
通过把母函数中的t换成it e ,就得到了特征函数。
然而,直到1810年他才发表了特征函数与反演公示的一般理论,并证明了中心极限定理。
他之所以推迟到1810年,有一种解释是,从1786年开始,他就专注于《天体力学》的写作,这本书1805年才完成。
1810年,拉普拉斯证明了中心极限定理,先是服从均匀发布的连续随机变量的情形,接着是服从任意分布的随机变量。
拉普拉斯的证明显然对独立有界的随机变量和成立,证明过程使用了现在所谓的特征函数,或傅里叶变换,即itXEe(t为实数)。
大数定律和中心极限定理课件
中心极限定理可以帮助我们在不确定 的情况下做出决策。例如,通过模拟 大量可能的结果并计算其分布,可以 评估不同决策的风险和收益。
04
大数定律与中心极限定理的 关联与区别
关联性分析
大数定律和中心极限定理都是概率论中 的重要定理,它们在某些方面存在关联。
大数定律描述了在大量独立重复试验中, 大数定律是中心极限定理的一种特例, 某一事件的相对频率趋于该事件的概率, 当随机变量数量趋于无穷时,中心极限
而中心极限定理则说明无论独立随机变 定理可以看作是大数定律的一种推广。 量的分布是什么,它们的和或积的分布
都趋于正态分布。
差异性分析
大数定律和中心极限定理在适用范围和表现形式 上存在差异。
大数定律的结论是相对频率趋于概率,而中心极 限定理的结论是随机变量和的分布趋于正态分布。
大数定律适用于大量独立重复试验中某一事件的 相对频率,而中心极限定理则适用于独立随机变 量的和或积的分布。
02
中心极限定理
定义
• 中心极限定理:在大量独立同分布的随机变量下,这些随机变 量的平均值的分布趋近于正态分布,即无论这些随机变量的分 布是什么,只要样本量足够大,其平均值的分布都将呈现出正 态分布的特征。
适用范 围
中心极限定理适用于大量独立同分布的随机变量,这些随 机变量的分布可以是离散的也可以是连续的。
在金融领域,中心极限定理也被广泛应用。例如,股票价格的波动可以看作是大 量投资者决策的独立同分布的随机变量,因此股票价格的平均值(即指数)的分 布也呈现出正态分布的特征。
03
大数定律与中心极限定理的 应用
在统计学中的应用
样本均值和总体均值的近似
大数定律表明,当样本量足够大时,样本均值趋近于总体均值,这为统计学中的参数估计提供了基础。
概率论与数理统计§中心极限定理
• 引言 • 中心极限定理的基本概念 • 中心极限定理的证明 • 中心极限定理的应用 • 中心极限定理的扩展与推广 • 案例分析与实践应用 • 总结与展望
01
引言
主题简介
中心极限定理是概率论与数理统计中的重要概念,它描述了在独立同分布的随机 变量序列下,无论这些随机变量的分布是什么,它们的平均值的分布将趋近于正 态分布。
03
中心极限定理的证明
证明方法概述
方法一:基于特征函数的 证明
方法二:基于概率密度函 数的证明
ABCD
通过对特征函数的性质进 行分析,利用泰勒展开和 收敛性质,证明中心极限 定理。
通过分析概率密度函数的 性质,利用大数定律和收 敛定理,证明中心极限定 理。
重要极限公式
公式一: $lim_{{n to infty}} frac{S_n}{sqrt{n}} = N(0,1)$
中心极限定理的应用范围广泛,不仅限于金融、保险、医学等领域,还涉来研究的展望
01
随着大数据时代的到来,中心极限定理在处理大规模数据和复杂 随机现象方面的应用价值将更加凸显。未来研究可以进一步探索 如何优化中心极限定理的应用,提高其在实际问题中的适用性和 准确性。
02
随着数学和其他学科的交叉融合,中心极限定理与其他理 论或方法的结合应用将成为一个重要的研究方向。例如, 如何将中心极限定理与机器学习、人工智能等新兴技术相 结合,以解决更加复杂和具体的问题。
03
中心极限定理的理论基础和证明方法仍有进一步完善的空 间。未来研究可以深入探讨中心极限定理的数学原理,发 现新的证明方法和技巧,推动概率论与数理统计理论的进 一步发展。
07
总结与展望
(完整版)8-第五章大数定律和中心极限定理解析
(完整版)8-第五章⼤数定律和中⼼极限定理解析第五章⼤数定律和中⼼极限定理⼤数定律和中⼼极限定理是概率论中两类极限定理的统称,前者是从理论上证明随机现象的“频率稳定性”,并进⼀步推⼴到“算术平均值法则”;⽽后者证明了独⽴随机变量标准化和的极限分布是正态分布或近似正态分布问题,这两类极限定理揭⽰了随机现象的重要统计规律,在理论和应⽤上都有很重要的意义。
§5.1 ⼤数定律设ΛΛ,,,,21n X X X 是互相独⽴的⼀列随机变量,每个随机变量取值于⼆元集合{0,1},并有相同的概率分布函数()()0,1,1j j P X q P X p p q ====+=易计算它们的数学期望和⽅差为 (),()j j E X p D X pq ==如果取这些j X 的部分和 n n X X X S +++=Λ21并考虑它们的平均值∑==n j j n n Xn S 1/)(/,易知它的数学期望和⽅差为;nnS S pq E p D n n n == ? ?利⽤定理4.2.13给出的切⽐雪夫不等式可知:对任何⼀个正数t 有2n S pq P p t n t n-≥≤ ? 令∞→n ,有2lim lim 0n n n S pq P p t n t n→∞→∞??-≥≤= 即lim 0n n S P p t n →∞??-≥=(5.1.1) 可见当n 很⼤时,部分和的平均值/n S n 与p 相距超过任何⼀个数0>t 的概率都很⼩,⽽当∞→n 时, 这个概率趋于0。
(5.1.1)式的结果称为弱⼤数定律,也称伯努利⼤数定律, 因为这个定律是伯努利在1713年⾸先证明的,是从理论上证明随机现象的频率具有稳定性的第⼀个定律。
注意式(5.1.1)等价于lim 1n n S P p t n →∞??-≤=(5.1.2) 把它完整地叙述如以下定理:定理5.1.1(伯努利⼤数定律)设ΛΛ,,,,21n X X X 是互相独⽴的取值于⼆元集合{0,1}的⼀列随机变量,并有相同的概率分布函数()()0,1,1j j P X q P X p p q ====+=⼜设 n n X X X S +++=Λ21则 lim 0n n S P p t n →∞??-≥=或等价地lim 1n n S P p t n →∞??-≤=。
泊松分布极限-概述说明以及解释
泊松分布极限-概述说明以及解释1.引言1.1 概述概述泊松分布是概率论中重要的分布之一,它描述了在一定时间或空间范围内随机事件发生的次数。
泊松分布常常被用于模拟和分析各种实际问题,如交通流量、电话呼叫数量、网站访问量等。
本文旨在介绍泊松分布的定义、特征以及它在实际应用领域中的重要性。
同时,我们将讨论泊松分布的极限定理,即当事件发生的次数足够多时,泊松分布将趋近于正态分布。
在正文部分,我们首先会详细介绍泊松分布的定义和特征。
泊松分布是一种离散概率分布,描述了在一个固定的时间间隔或空间区域内,某事件发生的次数符合泊松分布的概率。
其次,我们将探讨泊松分布在各个应用领域中的重要性。
由于其简单性和灵活性,泊松分布被广泛应用于各种实际问题的建模和分析中。
例如,在交通领域中,泊松分布可以用来描述车辆通过某个路口的速率和流量。
在通信领域,泊松分布可以用来模拟电话呼叫的数量和到达时间间隔。
在互联网领域,泊松分布可以用来分析网站的访问量和用户的点击行为。
最后,我们将研究泊松分布的极限定理。
当事件发生的次数足够多时,根据中心极限定理,泊松分布的近似分布将趋近于正态分布。
这一定理在实际应用中具有重要的意义,它使得我们可以应用正态分布的性质来分析和预测泊松分布相关问题。
总结起来,本文将介绍泊松分布的定义、特征和应用领域,并分析其极限定理。
通过对泊松分布的深入研究,我们可以更好地理解和应用这一概率分布,为实际问题的建模和解决提供更精确和有效的方法。
对于未来的研究和应用方向,我们也将展望泊松分布在更多领域中的发展和思考。
1.2文章结构文章结构文章将按照以下结构展开:1. 引言1.1 概述1.2 文章结构1.3 目的2. 正文2.1 泊松分布的定义和特征2.2 泊松分布的应用领域2.3 泊松分布的极限定理3. 结论3.1 总结泊松分布的重要性和应用3.2 对泊松分布极限的意义和影响进行讨论3.3 展望泊松分布在未来的研究和应用方向在本文中,我们将首先在引言部分对泊松分布进行简要介绍和背景阐述。
中心极限定理应用
中心极限定理及其应用【摘要】中心极限定理的产生具有一定的客观背景,最常见的是德莫佛-拉普拉斯中心极限定理和林德贝格-勒维中心极限定理。
它们表明了当n 充分大时,方差存在的n 个独立同分布的随机变量和近似服从正态分布,在实际中的应用相当广泛。
本文讨论了中心极限定理的内容、应用与意义。
【关键词】:中心极限定理 正态分布 随机变量一、概述概率论与数理统计是研究随机现象、统计规律性的学科。
随机现象的规律性只有在相同条件下进行大量重复的实验才会呈现出来,而研究大量的随机现象常常采用极限的形式,由此导致了对极限定理的研究。
极限定理的内容很广泛,中心极限定理就是其中非常重要的一部分内容。
中心极限定理主要描述了在一定条件下,相互独立的随机变量序列X1、X2、…Xn 、…的部分和的分布律:当n →∞时的极限符合正态分布。
因此中心极限定理这个结论使正态分布在数理统计中具有很重要的地位,也使得中心极限定理有了广泛的应用。
二、定理及应用1、定理一(林德贝格—勒维定理)若ξ1,ξ2,…是一列独立同分布的随机变量,且E kξ=a,D kξ=σ2(σ2>0) ,k=1,2,…则有dt ex nnap xt nk kn ⎰∑∞--=∞→=≤-21221)(lim πσξ。
当n 充分大时,nnank kσξ∑=-1~N (0,1),∑=nk k1ξ~N (2,σn na )2、定理二(棣莫弗—拉普拉斯中心极限定理)在n 重伯努利试验中,事件A 在每次试验中出现的概率为错误!未找到引用源。
, 错误!未找到引用源。
为n 次试验中事件A 出现的次数,则dt ex npqnpp xt nn ⎰∞--∞→=≤-2221)(lim πμ其中1q p =-。
这个定理可以简单地说成二项分布渐近正态分布,因此当n 充分大时,可以利用该定理来计算二项分布的概率。
同分布下中心极限定理的简单应用独立同分布的中心极限定理可应用于求随机变量之和Sn落在某区间的概率和已知随机变量之和Sn取值的概率,求随机变量的个数。
大数定律与中心极限定理的关系及其应用
论文题目:大数定律与中心极限定理的关系及其应用摘要:本文通过对概率论的经典定理——大数定律与中心极限定理在独立同分布和不同分布两种情况下的结论作了比较系统的阐述,揭示了随机现象最根本的性质——平均结果的稳定性.经过对中心极限定理的讨论,给出了独立随机变量之和的分布可以用正态分布来表示理论依据.关于大数定律方面,较全面地分析和叙述了几种最常用的大数定律.同样中心极限定理的内容也从独立同分布与独立不同分布两个角度来进行讨论;另外,叙述了各种大数定律以及中心极限定理各自之间,大数定律与中心极限定理之间的关系.同时通过举出很多相关的反例说明二者的关系.最后给出了一些简便的大数定律与中心极限定理在数理统计、误差、彩票学、近似计算、保险业及数学分析等几个方面的应用,来进一步地阐明了大数定律与中心极限定理在各分支学科中的重要作用和应用价值.关键词:随机变量序列;大数定律;中心极限定理;应用ITitle:Law of large numbers and the relationship between the centrallimit theorem and its applicationAbstract: Based on the probability of a classic theorem : the law of large numbers central limit theorem in the independent distribution ; with the different distribution of both cases, it made more systematic exposition, and revealed the phenomenon of the random nature of the most fundamental an average of the results of the Stability . Trough the central limit theorem discussion it will give out the random variables and the distribution of the normal distribution .About the law of large numbers, there are more comprehensive analysis and described several of the most commonly used on it. The content of the same central limit theorem also discussed the independent distribution and independent distribution of the two different perspectives. Also, it will discussed the relationship between the variety of narrative and the law of large numbers between their respective central limit theorem, and that of the law of large numbers and the central limit theorem. At the same time, it demonstrated the relationship between the two aspects through lots of anti-related examples. Finally ,it gave out several aspects of application of a number of simple law of large numbers and the central limit theorem in mathematical statistics, error, lottery school, the approximate calculation, and the insurance industry and mathematical analysis, to further clarify the law of large numbers and the central limit theorem in all branches of the important role and value.Keywords: Random variables ; Law of large numbers; Central limit theorem; ApplicationII目录摘要 (I)Abstract (II)第1章引言 (1)第2章大数定律及其证明 (2)2.1 几个相关定义 (2)2.2 大数定律及其证明 (4)第3章中心极限定理 (8)3.1 中心极限定理的提法 (8)第4章大数定律与中心极限定理的关系 (11)4.1 服从大数定律, 但不服从中心极限定理 (11)4.2 服从中心极限定理, 但不服从大数定律 (12)4.3 大数定律与中心极限定理都不服从 (13)4.4 大数定律、中心极限定理都服从 (13)第5章应用 (14)5.1“概率”及“数学期望”的确切定义 (14)5.2 解释测量(随机) 误差 (14)5.3 在数学分析中的应用 (15)5.4 在计算精确的近似概率方面的应用 (16)5.5 在彩票和保险业的应用 (17)结语 (20)参考文献 (21)致谢 (22)附录 (23)IIIIV第1章引言概率论与数理统计是研究随机现象的统计规律的科学,而随机现象的统计规律性只有在相同条件下进行大量重复试验或观察才呈现出来. 从概率的统计定义中可以看出:一个事件发生的频率具有稳定性,即随着试验次数的增多,事件的频率逐渐稳定在某个常数附近. 人们在实践中观察其他一些随机现象时,也常常会发现大量随机个体的平均效果的稳定性. 这就是说,无论个别随机个体以及它们在试验进行过程中的个别特征如何,大量随机个体的平均效果与每一个体的特征无关,且不再是随机的. 深入考虑后,人们会提出这样的问题:稳定性的确切含义是什么? 在什么条件下具有稳定性? 这就是大数定律要研究的问题.众所周知,中心极限定理是概率论中最重要、最基本的一个定理.中心极限定理揭示了离散型随机变量与连续型随机变量之间的内在联系, 为用连续型随机变量的分布,特别是标准正态分布对离散型随机变量进行概率计算提供了理论基础.基于中心极限定理的概率统计方法在生活中的应用,本文利用中心极限定理,分析了保险业和近似计算中的应用.第 1 页共27页第 2 页 共 27 页第2章 大数定律及其证明2.1 几个相关定义定义1[1] 设n (1,2,)n ξ= 为概率空间(,,)F P Ω上定义的随机变量序列(简称随机序列),若存在随机变数ξ,使对任意0ε>,恒有:l i m {}0nn p ξξε→∞-≥=或lim {}1n n p ξξε→∞-≤=, 则称随机序列{}n ξ概率收敛于随机变量ξ(ξ也可以是一个常数),并用下面的符号表示:lim ()n n p ξξ→∞=或pn ξξ−−→.定义 2[2][6][8] 设{}n ξ为随机变量序列, 数学期望n E ξ存在()1n ≥,如果对任意的0ε>.恒有:1111lim (())1nniin i i p E nnξξε→∞==-<=∑∑, 则称随机变量序列{}n ξ服从大数定律.定义 3 设{}n ξ为随机变量序列, 如果存在常数序列{}n a .对任意的0ε>.恒有:11lim ()1nin n i p a nξε→∞=-<=∑, 则称随机变量序列{}n ξ服从大数定律.注:定义2和定义3两种大数定律定义的讨论所谓大数定律, 它是揭示大量随机现象的平均结果稳定于平均值的极限理论.而大量随机现象即{}n ξ的平均结果是11nii n ξ=∑(n 充分大),其平均值是11()nii E nξ=∑.因此, 从这一角度来考虑,定义2是恰当的.定义3与定义2的不同点在于它并不要求随机变量n ξ的期望n E ξ存在(1n ≥),只要存在常数序列{}n a ,使对任意的0ε>.恒有11l i m ()1ni n n i pa nξε→∞=-<=∑即可.为了弄清这两种定义的异同,我们必须讨论数列{}n a 与数列{11()nii E nξ=∑}之间的关系.首先,当n E ξ(1n ≥)存在时,我们不难证明:0δ∀>,11lim (())0nn in i p a E nξδ→∞=-≥=∑这个结果表明在n E ξ(1n ≥)异存在时,只需取11()nn ii a E nξ==∑,(1n ≥).此时, 定义2 与定义第 3 页 共 27页3 是等价的.其次,当n E ξ(1n ≥)不存在时, 由定义2知{}n ξ不服从大数定律, 而此时, 存在常数列{}n a 使定义3仍然成立.综合上述定义2与定义3不是等价的.定义3不仅在形式上而且在内涵上比定义2更广泛.定义 4[3] 设{()}n F x 是分布函数序列,若存在一个非将函数()F x ,对于它的每一连续点x ,都有li m ()()n n F x F x →∞=,()()w n F x F x −−→,则称分布函数序列{()}n F x 弱收敛于()F x .定义5 设n ()(1,2,)F x n = , ()F x 分别是随机变量(1,2,)n n ξ= 及ξ的分布函数,若()()wn F x F x −−→,则称{}n ξ依分布收敛于ξ,亦记为Ln ξξ−−→,且有: (1)若p n ξξ−−→,则Ln ξξ−−→; (2)设c 为常数,则p n c ξ−−→的充要条件是Ln c ξ−−→. 逆极限定理:设特征函数列{()}n f x 收敛于某一函数()f t ,且()f t 在0t =时连续,则相应的分布函数列{()}n F x 弱收敛于某一分布函数()F x ,而且()f t 是()F x 的特征函数.车比雪夫不等式[4]:设ξ是一个随机变量,它的数学期望为a ,方差为2σ,则对任意的正常数ε恒有:22{},p a σξεε-≥≤(2-1)或有22{}1p a σξεε-<≥- (2-2)称(2-1)式或(2-2)式为车比雪夫不等式.以下就连续型随机变量来证明这个不等式.证 设的密度函数为()f x ,则有222()()()()()x EX x EX DX x EX f x dx x EX f x dx f x dx εεε+∞-∞-≥-≥=-≥-≥⎰⎰⎰{}22()x EX f x dx P x E X εεεε-≥==-≥⎰,第 4 页 共 27 页于是 {}2D XP x E X εε-≥≤这个不等式可解释为:对任意给定的正常数ε,可以作为两个区间(,)a ε-∞-和(,)a ε++∞.(1)式表示,在一次试验中,随机变量ξ的取值落在(,)(,)a a εε-∞-⋃++∞的概率小于等于22σε.不等式说明D X 越小,则X 的取值越集中在E X 附近.这进一步说明了方差是反映随机变量取值的离散程度的.2.2 大数定律及其证明大数定律形式有很多,我们仅介绍几种最常用的大数定律. 定理1[5][6] (车比雪夫大数定律)设随机变量12n ,,,,ξξξ 相互独立,它们的数学期望依次为12n ,,,,a a a ,方差依次为22212,,,,n σσσ 而且存在正常数k ,使得对一切1,2,i = 有2i k σ<,则对任意给定的正常数ε,恒有1111lim {}1nniin i i p annξε→∞==-<=∑∑证 设11nii nξξ==∑,则ξ的数学期望和方差分别为: 111111nnni ii i i i E E E a nn nξξξ===⎛⎫===⎪⎝⎭∑∑∑,222111111n nni iii i i D D D n n nξξξσ===⎛⎫===⎪⎝⎭∑∑∑由车比雪夫不等式,对任意给定的正数ε,有11111{}nni i i i p a nnξε==≥-<∑∑=22221222{}1111ni i D p E nk n k n n σξξξεεεεε=-<≥-=->-=-∑即 211111{}1nniii i p a k n nnξεε==≥-<=-∑∑.对不等式取极限,则得1111lim {}1nniin i i p a nnξε→∞==-<=∑∑车比雪夫大数定律表明,在一定条件下,当n 充分大时,n 个随机变量的算术平均值11nii nξ=∑偏离其数学期望的可能性很小.这也正是用一系列测量值的平均值来近似代替真值的做法的原则.第 5 页 共 27页推论 1 设随机变量12n ,,,,ξξξ 相互独立,且它们具有相同的分布及有限的数学期望和方差:E a ξ=,2(1,2,)D i ξσ== ,则对任意给定的正数ε,有11lim {}1nin i p a nξε→∞=-<=∑.此推论证明:n 个相互独立的具有相同数学期望和方差的随机变量,当n 很大时,它们的算术平均值几乎是一个常数,这个常数就是它们的数学期望.定理 2[7](辛钦大数定律)设12n ,,,,ξξξ 是相互独立的随机变量,而且有相同是的分布,具有有限的数学期望k ,(1,2,)E a k ξ== ,则对任意给定的0ε>,有11lim {}1nkn k p a nξε→∞=-<=∑.注:定理2中条件比定理1中的条件要宽,在定理1中要求方差有限,而定理2不需要这个条件.辛钦大数定律说明独立同分布的随机变量的算术平均值依概率收敛于它的数学期望值,它为在实际应用中用算术平均值估计数学期望提供了理论依据.证 因为12n ,,,,ξξξ 是具有相同分布的随机变量序列,故它们有相同的特征函数.设它们的特征函数为()f t ,由于k E ξ存在,故()f t 有展开式:'()(0)(0)()1()f t f f t ti a t οο=++=++,其中()t ο表示关于t 的高阶无穷小量. 再由独立性知,11nk k n ξ=∑的特征函数为:1nnt t t f ia n n n ο⎡⎤⎡⎤⎛⎫⎛⎫=++ ⎪ ⎪⎢⎥⎢⎥⎝⎭⎝⎭⎣⎦⎣⎦.对任意取定的数t ,有lim lim 1n niat n n t t t f ia e n n n ο→∞→∞⎡⎤⎡⎤⎛⎫⎛⎫=++= ⎪ ⎪⎢⎥⎢⎥⎝⎭⎝⎭⎣⎦⎣⎦.而iat e 是连续函数,且是单点分布的特征函数,由逆极限定理知:11nk k nξ=∑的分布函数弱收敛于()F x .其中,1,(),0,x a F x x a>⎧=⎨=⎩因此,11,nLkk a nξ=−−→∑由(2)式知:11nPkk anξ=−−→∑.定理 3[8](贝努利大数定律)设n μ是n 次独立试验中事件A 发生的次数, p 是事件A 在每次试验中发生的概率,则对任意给定的正数ε,有lim {}1nn p p nμε→∞-<= 或 lim {}0nn p p nμε→∞-≥=第 6 页 共 27 页证 令 0,1,2,1n k A Y k k A ⎧==⎨⎩ 第试验不发生,,第试验发生.显然12n n Y Y Y μ=+++ ,由于各次试验是独立的,从而12,,,,n Y Y Y 相互独立,又k Y 服从参数为P 的两点分布,所以(),()(1),(1,2,k k E Y P D Y P Pk ==-= . 由定理1有 lim {}1nn p p nμε→∞-<=.此定理表明:当n 很大时, n 重贝努利试验中事件A 发生的频率几乎等于事件A 在每次试验中发生的概率,这个定理以严格的数学形式刻画了频率的稳定性,因此,在实际应用中,当试验次数很大时,便可以用事件发生的频率来代替事件的概率.证 作一次观察时n μ是定值, 作多次观察时n μ是随机变量,而且(,),n B n p μ 因此:n E np μ=,n D npq μ=,()n E n pμ=,()n D n pq n μ=.在车比雪夫不等式中,取 n n ξμ=,则a p =,2pq n σ=,于是对任意给定的正数ε,有21{}11()npq p p n nn μεε≥-<≥-→→∞,因而lim {}1nn p p nμε→∞-<=.定理 4 (泊松大数定律)设12n ,,,,ξξξ 是相互独立的随机变量, P{1}n n P ξ==, P{0}n n q ξ== (其中n P 1n q =-) ,则{}n ξ服从大数定律.证 由定理所设可得:11E()nn ini P P nξ===∑,2221111111()()24nnnn n n iiii i i P q D D P qnnnn ξξ===+⎛⎫==≤= ⎪⎝⎭∑∑∑. 由车比雪夫不等式得,对任意0ε>,有22()10{}4n n n D P P n ξξεεε≤-≥≤≤.两边取极限,得lim {}0n n n P P ξε→∞-≥=.泊松大数定律是贝努利大数定律的推广, 贝努利大数定律证明了事件在完全相同条件下重复进行的随机试验中频率的稳定性;而泊松定理表明,当独立进行的随机试验的条件变化时, 频率仍然具有稳定性:随着n 的无限增大,在n 次独立试验中,事件 A 的频率趋于稳定在各次试验中事件A 出现概率的算术平均值附近.定理5[9][10] 马尔可夫(Marrkov) 大数定律)设{}k ξ是随机变量序列,若211lim()0nk n k D nξ→∞==∑,则对任意>0ε,均有1111lim {}1nnkkn k k p E nnξξε→∞==-<=∑∑,即{}k ξ服从大数定律.证 车比雪夫不等式得212111()111{}1nk nnk kkk k D np E nnξξξεε===≥-<≥-∑∑∑,取极限得:1111lim {}1nnkkn k k p E nnξξε→∞==-<=∑∑注:车比雪夫大数定律可又马尔可夫大数定律推出,更重要的是马尔可夫大数定律已经没有任何关于独立性的规定.第3章 中心极限定理直观上,如果一随机变量决定于大量(乃至无穷多个)随机.因素的总合,其中每个随机因素的单独作用微不足道,而且各因素的作用相对均匀,那么它就服从(或近似地服从)正态分布,下面我们将按严格的数学形式来表述这一直观.3.1 中心极限定理的提法定理 6[3][11](林德贝格——列维定理(Lindeberg-Levy)中心极限定理)设随机变量12,,ξξ 是一列独立同分布的随机变量,并且具有数学期望k E a ξ=和方差22(0),1,2,k D k ξσσ=>= ,则对任意实数x ,有22lim ()t nkx n na P x edt x ξ--∞→∞⎛⎫-⎪⎪<==Φ ⎪ ⎪⎝⎭∑ (3-1)证 设k a ξ-的特征函数为()t ϕ,1nknk na ξ=-=∑∑的特征函数为nϕ⎡⎤⎢⎥⎣⎦又因为()()20,k k E a D a ξξσ-=-=,所以'''2(0)0,(0)ϕϕσ==- 于是特征函数()t ϕ有展开式:2'''22221()()(0)(0)()1()22tt t t t t t ϕϕϕϕοσο=+++=-+,从而对任意固定的t ,有22221(),2nntt t t e n n n ϕο-⎡⎤⎡⎤=-+→→∞⎢⎥⎢⎥⎣⎦⎣⎦ 而22te-是()0,1N 分布的特征函数,因此由特征函数的连续性定理即知(3-1)成立,定理得证.定理6又称独立同分布的中心极限定理,它表达了正态分布在概率论中的特殊地位,尽管k ξ的分布是任意的,但只要n 充分大,nkna ξ-∑近似服从标准正态分布(0,1)N .或者说,当n 很大时,独立同分布的随机变量kξ的和1nk k ξ=∑ 近似地服从正态分布2(,)N n n μσ.这就是那些(可以看作有许多微小的、独立的随机因素作用的总结果,而每一个因素的影响却都很小)随机变量,一般都可以近似地服从正态分布的理论依据,因而正态分布在理论上和应用上都具有极大的重要性.若(,)B n p ξ ,则当n 很大时,有()P a b ξ⎛⎫⎛⎫≤≤≈Φ-Φ⎝定理 7 (棣莫弗—拉普拉斯(De Moivre-Laplace)中心极限定理) 设随机变量n η服从二项分布(,)B n p ,则对于任意区间[,]a b ,恒有22lim t nkb an na P a b dt ξ-→∞⎛⎫- ⎪ ⎪≤<=⎪ ⎪⎝⎭∑⎰二项分布的极限分布是正态分布 即如果(,)X B n p ,则221()()t nk b anaP a b dt b a ξ-⎛⎫- ⎪ ⎪≤<≈=Φ-Φ ⎪ ⎪⎝⎭∑⎰一般地,如果(,)X B n p ,则()P a X b P ⎛⎫≤<=≤<⎝b np a np --≈Φ-Φ说明:这个公式给出了n 较大时二项分布的概率计算方法.引理 设12,,ξξ 是独立随机变量序列,又k k E a ξ=,2(1,2,)k k D k ξσ== ,221nnkk B σ==∑,这时:(1) 若{}k ξ是连续型随机变量,密度函数为{}()n P x ,如果对任意0τ>,有2211lim()()0k nnk k x a B n k n x a P x dx Bτ->→∞=-=∑⎰(2) 若{}k ξ是离散型随机变量,k ξ的分布列为(),1,2,n nj nj P x P j ξ=== ,如果对任意0τ>,有()2211lim0nj k nnnjk kj n k x a B nxa P B τ→∞=->-=∑∑则称{}k ξ满足林德贝尔格条件.定理 8 (林德贝格定理) 设独立随机变量序列12,,ξξ 满足林德贝尔格条件,则当时,对任意的,有()2211lim y nx k k n k nP a x edy B ξ--∞→∞=⎛⎫-<=⎪⎝⎭∑这个定理证明了由大量微小而且独立的随机因素引起并积累而成的变量,必将是一个正态随机变量,由林德贝尔格条件可看到定理并不要求各个加项“同分布”,因而它比前述的林德贝尔格——勒维定理更强,事实上林德贝尔格——勒维定理可以由它推出.定理 9 (李雅普诺夫定理) 设12,,ξξ 是独立随机变量序列,又k kE a ξ=,2(1,2,)k k D k ξσ== ,记221nnkk B σ==∑,若存在0δ>,使有22110,nk kk nE a n B δδξ++=-→→∞∑,则对任意的实数x ,有()2211lim y nx k k n k n P a x edy B ξ--∞→∞=⎛⎫-<= ⎪⎝⎭∑定理9又称独立非同分布的中心极限定理,李雅普诺夫定理可以解释如下:假定被研究的随机变量可以表示为大量独立随机变量的总和,且总和中的每个单独的随机变量对于总和又不起主要作用,那么可以认为这个随机变量近似地服从正态分布.讨论了独立随机变量和的分布的极限问题,在一定条件下,这些分布弱收敛于退化分布,这就是大数定律.凡是在一定条件下断定随机变量之和的极限分布是正态分布的定理,在概率论中统称为中心极限定理.具体一点说,中心极限定理回答的是(独立或弱相依)随机变量之和的极限分布在什么条件下是正态的.中心极限定理是揭示产生正态分布的源泉,是应用正态分布来解决各种实际问题的理论基础.第4章 大数定律与中心极限定理的关系概率论中关于独立随机变量序列的极限理论, 已相当完整, 各种问题已有了令人满意的回答,但由于一般教材中, 特别是工科教材, 只介绍一、二个最简单的基本定理,若弱大数定律只介绍切比契夫定理的特殊情况, 中心极限定理只介绍同分布的林德贝格——列维定理(Lindeberg-Levy)的特殊情况——德莫弗—拉普拉斯(De Moivre-Laplace)定理.仅少数教材提及林德贝格条件. 这几个定理的条件又都是充分条件, 我们容易产生这样的问题: 大数定律与中心极限定理之间究竟有什么关系? 服从大数定律的是否服从中心极限定理? 反之又如何? 是否有两者都服从或都不服从的随机序列?因教材知识所限, 这些问题不太好回答, 现拟补充几个定理, 以简单的例子加以说明.定理10[12](格涅坚克定理) 设有相互独立的随机变量序列{}k ξ, 则对0ε∀>,11lim {()}1nkk n k p E nξξε→∞=-<=∑的充要条件是2221()lim[]0()nk k n k k k E E nE ξξξξ→∞=-=+-∑.定理11 (马尔科夫定理) 随机变量序列{}k ξ, 若211()0nk k D nξ=→∑,则对0ε∀>, 有11lim {()}1nkk n k p E nξξε→∞=-<=∑.定理12 (费勒定理) 对相互独立随机变量序列{}k ξ, 若∃常数n M ,使1max k n k nM ξ≤≤≤,且limn n nM B →∞=, 则{}k ξ服从中心极限定理.设{}k ξ为相互独立的随机变量序列, 以下在,,()k k j k j P P ξα==中, 令,,,k j k j P α取不同的值, 以说明不同的情形.4.1[12][13] 服从大数定律, 但不服从中心极限定理令(),1,1210,121k k P k α==-+,(),2,221,21k k k P k α==+,(),3,321,21k k k P k α==+,1,2,3,k = ,即()21(0)11k P k ξ==-+,()21()()21k k P k P k k ξξ===-=+可知0,k E ξ=()2221k k kD E k ξξ==+,()222111nnnk k k kB D k ξ====+∑∑因222110,n B n n nn<⋅→→∞, 由马尔科夫定理知, 大数定律成立, 但中心极限定理不成立. 这是因为12111(0)(0,0,,0)(0)(0)nnk n kkk k k P P P P ξξξξξξ∞==========≥=∑∏∏()2111(1)021nk k ==-=>+∏若服从中心极限定理,则取120,0x x <>,有22211211()t nx kx k nP x x edt B ξ-=<<=∑, 当12,x x 充分靠近 0 时,222112t x x e dt -<. 这就出现了矛盾. 所以中心极限定理不成立.4.2 服从中心极限定理, 但不服从大数定律取,,()k k j k j P P ξα==,为1()2k P k ξ==,1()2k P k ξ=-=,1,2,,k = 可知0,k E ξ=2k D kξ=,221nn k B k ==∑, 又 3333322221(1)(1)lim limlim3(1)n n n nn nnn n n n BB B n →∞→∞→∞++-+-===-+,即 313223limlim13n n nnnn B B -→∞→∞==,()12133lim1n nnB -→∞=又 1ax k k nM n ξ≤≤≤,()1213limlim03n n nn nB n→∞→∞-==则由费勒定理知中心极限定理成立, 但不服从大数定律, 这是因为2()x x R n x∈+, 为凸函数, 由琴生不等式222222222()kkkkE kE n n E n kξξξξ≥=+++,而 222222111111,244nnn k k k kkn k n n knnnn===+≥==→→∞++∑∑∑由格涅坚克定理知, {}k ξ不服从大数定律.4.3 大数定律与中心极限定理都不服从取,,()k k j k j P P ξα==,为1(2)2k k P ξ==,1(2)2k k P ξ=-=,可知0,k E ξ=4k k D ξ=,21144(41)3nnknnk k k B D ξ=====-∑∑, 当 n充分大时24n n B >,即2n n B >21112222(21)2n nn n n kk k k ξξ+==≤≤+++=-<∑∑,112nkk nB ξ=<∑故11lim (2)1(2)(2)1nkn k nP B ξ→∞=<=≠Φ-Φ-<∑可知不服从中心极限定理, 又22222222111144()44kknnnnkkknk k k k kkE E nn E n n ξξξξ====≥=>++++∑∑∑∑22111444(41),4433nknnnk n n n ===⋅-→→∞++∑,由格涅坚克定理知不服从大数定律.4.4 大数定律、中心极限定理都服从若{}k ξ为同分布且有有限期望及大于零的方差, 则由教材中定理易知两者都服从. 这时有11lim (())1nkk n k P E nξξε→∞=-<=∑.但括号中的事件概率, 究竞有多大? 大数定律未能回答. 而根据中心极限定理有22111(())()x nnkk kk k k P E P E edx nεξξεξξσ-==≤-<=-<≈∑其中2k D σξ=, 这样看来在所假定的条件下, 中心极限定理比大数定律更精确.第5章 应用大数定律以严格的数学形式表达了随机现象最根本的性质——平均结果的稳定性,它是随机现象统计规律性的具体表现. 因此,大数定律在理论和实际中都有广泛的应用.5.1[3] “概率”及“数学期望”的确切定义在给出二者定义时,都采用“稳定”一词,这是一种不确切的描述.依据大数定律可给出更确切的表达,即:概率——独立重复实验中,事件A 出现的频率11nPii Pnξ=−−→∑,则该常数P 即为概率.数学期望——对于任一0ε>,有11lim ()1nin i p nξμε→∞=-<=∑,则()k E μξ=称为数学期望.5.2 解释测量(随机) 误差根据大数定律,对于随机误差12,,,n δδδ ,应有11nPii nδ=−−→∑.这说明当测量次数较多时, 实测数据的平均值11nii a nδ=+∑和预测真值a 的差值能以很大概率趋于0,因此,用求样本数据平均值的方法来进行测量是可行的.例1[14] 某种仪器测量已知量A 时,设n 次独立得到的测量数据为12,,,n x x x ,如果仪器无系统误差,问:当n 充分大时, 是否可取作为仪器测量误差的方差的近似值?解 把(1,2,,)i x i n = 视作n 个独立同分布的随机变量的观察值,则()i E x μ=,2(),(1,2,,)i D x i n σ== .仪器第i 次测量的误差i x A -的数学期望()i E x A A μ-=-,方差2()i D x A σ-=.设2(),1,2,,i i Y x A i n =-= ,则i Y 也相互独立服从同一分布.在仪器无系统误差时()0i E x A -=,即有A μ=,222()()()()(1,2,,)i i i i i E Y E x A E x Ex D x i n σ⎡⎤⎡⎤=-=-===⎣⎦⎣⎦由车比雪夫定律,可得: 211lim {}1nin i p Ynσε→∞=-<=∑即 ()2211lim {}1nin i p x A nσε→∞=--<=∑从而确定,当n →∞时,随机变量()211ni i x A n=-∑依概率收敛于2σ,即当n 充分大时可以取()211nii x A n=-∑作为仪器测量误差的方差.5.3 在数学分析中的应用例2[1] 假设()22212121,,,:,0,,12n n n n nG x x x x x x x x ⎧⎫=+++≤≤≤⎨⎬⎩⎭,求其极限. 解 假设随机变量(1,2,)n n ξ= 在[]0,1上有均匀分布,而且相互独立,有112D ξ=,2112E ξ=,易见(){}22111,,2nn n n n Gn dx dx P G P ξξξξ⎧⎫=∈=++≤⎨⎬⎩⎭⎰⎰ ()()222222211111111111266nn n ii P P E P E n n nξξξξξξξ=⎧⎫⎧⎫⎧⎫=++≤=++-≤≥-≤⎨⎬⎨⎬⎨⎬⎩⎭⎩⎭⎩⎭∑ 由1,,n ξξ 独立同分布,可见221,,,n ξξ 独立同分布.根据辛钦大数定律知:2111lim ()16ni i n i p E nξξ→∞=-≤=∑从而1lim1nn G n dx dx →∞=⎰⎰ .例3 用概率方法证明维尔斯特拉斯[w eierstrass ]定理.假定()f x 在闭区间[],a b 上是连续的,那么,存在一列多项式12(),(),B x B x ,一致收敛于函数()f x ,[],x a b ∈.证 不妨设0,1a b ==.假设()f x ,[]0,1x ∈是连续函数,那么()f x 在[]0,1上一致连续并且有界.对于任意[]120,0,0,1x x ε>≤∈存在0δ>,使12()()2f x f x ε-<,只要12x x ε-<.此外,对于一切01x ≤≤,有()f x k ≤(常数).现在,建立一多项式:()(1)nm m n m n n n m m B x Ef f C x x n n ξ-=⎛⎫⎛⎫==- ⎪ ⎪⎝⎭⎝⎭∑,其中n ξ服从二项分布, 参数为1n ≥, 而[]0,1x ∈, 显然(0)(0)n B f =,(1)(1)n B f =.由贝努利大数定律知()limnn x P nξ→∞=,[]0,1x ∈现在证明()n n B x f n ξ⎛⎫= ⎪⎝⎭一致收敛于()f x ,[]0,1x ∈.由于0(1)1nm m n m n m C x x -=-=∑,可见()()0()(1)nmmn mn n m m B x f x f f x C x x n -=⎡⎤⎛⎫-=-- ⎪⎢⎥⎝⎭⎣⎦∑,由此可得:()()0()(1)nm m n m n n m m B x f x f f x C x x n -=⎛⎫-≤-- ⎪⎝⎭∑()()(1)(1)m m n m m m n mn n mm x x nnm m f f x C x x f f x C x x n n δδ---<-≥⎛⎫⎛⎫=--+-- ⎪ ⎪⎝⎭⎝⎭∑∑2(1)222m m n mn n mx nkC x x kP x n δεεξδ--<⎧⎫<+-=+-≥⎨⎬⎩⎭∑. 由于对任意[]0,1x ∈,Pnxnξ−−→可见存在N ,使当时n N ≥,4nP x n kξεδ⎧⎫-≥≤⎨⎬⎩⎭ 从而,当n N ≥时,对于一切[]0,1x ∈,有:()()22422n B x f x k kεεεεε-<+=+= .即()n B x 关于[]0,1x ∈一致收敛于()f x .5.4 在计算精确的近似概率方面的应用例4[15] 现有一大批种子,其中良种占1/6 ,今在其中任选6000 粒,试分别用切比雪夫不等式估计和用中心极限定理计算在这些种子中良种所占的比例与1/6之差小于1%的概率是多少?解 设取出的种子中的良种粒数为X ,则1(6000,)6X B 于是1600010006E X n p ==⨯= 155(1)60001000666D X np p =-=⨯⨯=⨯(1) 要估计的规律为{}1110006060006100XP P X ⎧⎫-<=-<⎨⎬⎩⎭相当于在切比雪夫不等式中取60ε=,于是{}21110006016000610060X D X P P X ⎧⎫-<=-<≥-⎨⎬⎩⎭ 由题意得 25111100010.23150.76856063600D X-=-⨯⨯=-= 即用切比雪夫不等式估计此概率不小于0.7685.(2) 由拉普拉斯中心极限定理,对于二项分布1(6000,)6B ,可用正态分布5(1000,1000)6N ⨯近似, 于是所求概率为{}11940106060006100X P P X ⎧⎫-<=<<⎨⎬⎩⎭ 2(2.0785)10.9625≈Φ-Φ≈Φ-≈从本例看出:用切比雪夫不等式只能得出来要求的概率不小于0.7685,而用中心极限定理可得出要求的概率近似等于0.9625.从而知道由切比雪夫不等式得到的下界是十分粗糙的.但由于它的要求比较低,只要知道X 的期望和方差,因而在理论上有许多运用.当i X 独立同分布(可以是任何分布),计算1()n P a X X b <++≤ 的概率时,利用中心极限定理往往能得到相当精确的近似概率,在实际问题上广泛运用.5.5[16][17] 在彩票和保险业的应用大数定律和中心极限定理是概率论中两类具有极大意义的重要定理. 大数定律证明了在大样本条件下,样本平均值可以看作是总体平均值(数学期望) ,它是“算术平均值法则”的理论基础;中心极限定理比大数定律更为详细具体,它以严格的数学形式阐明了在大样本条件下,不论总体的分布如何,样本均值总是近似的服从正态分布. 正是这个结论使得正态分布在数理统计和误差分析中占有特殊的地位,是正态分布得以广泛应用的理论基础. 本文通过对彩票学和保险业等几个具体事例的引用展现了大数定律和中心极限定理的实际应用.大数定理在实际生活中应用十分广泛,我们现在以生活中最平常的但都很感兴趣的事情——彩票为例来详细阐述一下大数定理在彩票学中的应用.我们知道概率论是研究现实世界随机现象的科学,是近代数学的重要组成部分. 它在自然科学以及经济工作中都有着广泛的应用,同时也是数理统计的基础. 彩票投注的中奖概率分布完全符合它的原理. 彩票的投注方法是一个玩数字游戏. 彩票号码的摇出是随机事件,也可以说是一随机现象,属概率论的一个基本概念. 首先我们应该先清楚什么是随机现象? 我们说随机现象的特点是:事先不能预言其结果,具有偶然性;另一方面,在相同条件进行大量的重复试验,会呈现出某种规律性(特别是随机开奖次数的不断增多).例如:在相同条件下,多次抛掷质量均匀的同一枚硬币,则出现正面向上的次数约占总抛次数的一半,而且随着抛掷次数的增加,正面向上次数是总抛次数的12.这就是概率论的统计结果.(请看下面5次抛币的试验结果)有人曾经做过抛掷硬币的试验,试验结果记录如下:投掷次数N,正面向上次数M.M0.5181=2048N=1061N M==4040M0.5069N=2048N M=M0.5016N=6019=12000N M=M0.5005=24000N=12012N M==30000M0.4996N=14984N M=M0.5011N=36124=72088N M=由上述情况可以看出投掷次数很大时,其频率稳定于0.5彩票每期摇出的中奖号码(基本号码和特别号码)是一个随机事件,既然是随机事件,必有其分布规律.1. 2001010期至2001023期“上海风采”电脑福利彩票开奖计14期共摇出14*8112=个球.2. 每个球平均出现3.6次3. 奇数出现59次;偶数出现53次4. 小于或等于15的数47次;大于或等于16的数出现65次由此,我们引入彩票的一对常用语“冷门号码”及“热门号码”.有了“冷门号码”及“热门号码”,我们只要扑捉到这种机会,将会提高中奖纪律.概率分布的四条法则:1. 奇数.偶数出现的次数应占总数的12(由于不确定因素除外).2. 大数.小数出现的次数应占总数的12(由于不确定因素除外).3. 1-10区段,11-20区段,21-31区段,三区段出现的数个占总数的13(由于不确定因素除外).4. 各数出现的次数,随着实验(开奖)次数的增加不断靠近平均值(由于不确定因素除外).综上所述,随机的摇球事件随着实验(开奖)次数的增加都会显示出它的某些规律性,而这种规律性可以借助概率论的知识,利用小概率统计法,分析判断号码.通过数字统计,运用概率论原理来判断冷热号码出现的周期. 分析号码可能出现的区段. 缩小精选号码范围. 为新一期选择号码提供参考依据,从而达到提高中奖得率.实际上,对于彩票而言,也不是完全没有规律可循,只要经过大量的观察,根据大数定律就可以进行统计预测,提高中奖的几率. 概率论是一门系统学科,一般人了解的概率,不是从理论上认识,仅仅限于经验. 时间的表层认识. 与其硬着头皮去盲目猜测,不如运用简单的概率学统计分析方法更简单,更容易掌握. 把每期中奖号码出现的次数累加起来,一一进行统计,累计到一定量后,就能发现奖项及其相关指标的概率波动特性. 彩民再根据这些进行选号投注,就可以大大提高中奖几率.中心极限定理指出:如果一个随机变量有众多的随机因素所引起,每个因素在总的变化里起着不大作用,就可以推断描述这个随机现象的随机变量近似的服从正态分布,所以要求随机变量之和落在某个区间上的概率,只要把它标准化,用正态分布作近似计算即可. 中心极限定理还及时了离散型随机变量与连续型随机变量的内在联系,即离散型随机变量的极限分布是正态分布.中心极限定理对保险业更是具有指导性的意义,一个保险公司的亏盈,是否破产,我们通过学习中心极限定理的知识都可以做到估算和预测. 大数定律是近代保险业赖以建立的基础. 根据大数定律中心极限定理,我们知道承保的危险单位越多,损失概率的偏差越小,反之,承保的危险单位越少,损失概率的偏差越大. 因此,保险人运用大数法则就可以比较精确的预测危险,合理的拟定保险费率. 下面我们以一道具体的有关保险业的实例来阐述一下大数定律和中心极限定理在保险业中的重要作用和具体应用.例 5已知在某人寿保险公司里有10000个同一年龄段的人参加保险,在同一年里这些人死亡率为0.1% ,参加保险的人在一年的头一天交付保险费10元,死亡是家属可以从保险公司领取2000元的抚恤金. 求保险公司一年中获利不少于40000 元的概率;保险公司亏本的概率是多少?解设一年中死亡的人数为x人. 死亡概率为0.001P= ,把考虑10000人在一年里是否死亡看成10000重贝努里试验,保险公司每年收入为10000*10100000=元,付出2000x元.(1) P(保险公司获利不少于40000 元){}=->=(1000002000)40000P x。
广义中心极限定理
广义中心极限定理1.引言1.1 概述广义中心极限定理是概率论中的重要定理之一。
它描述了一类独立随机变量之和的分布趋近于正态分布的现象。
该定理被广泛运用于统计学、经济学、物理学等领域,在实际问题中具有重要的应用价值。
在统计学中,我们常常需要估计总体的某个参数,比如平均值或方差。
然而,总体往往很大,难以获得全部数据。
因此,我们常常采用样本来代表总体,运用统计量进行参数估计。
而广义中心极限定理则为我们提供了一种重要的工具,使我们能更好地理解和运用样本的分布。
广义中心极限定理的基本思想是,一个随机变量序列的和,当样本容量足够大时,其分布函数会趋近于正态分布。
这意味着,无论任何类型的随机变量,只要满足一定的条件,其样本和的分布都将逼近于正态分布。
这为我们处理各种复杂问题提供了方便,使得我们能够将问题简化为正态分布的情况,从而进行更准确的分析和推理。
广义中心极限定理的应用非常广泛。
在统计学中,它被用来解释抽样分布的性质,帮助我们进行参数估计和假设检验。
在经济学中,它被用来分析经济变量的分布特征,比如收入分布、经济增长率等。
在物理学中,它被用来描述粒子的行为,帮助我们理解和预测实验结果。
总之,广义中心极限定理是概率论中一项重要的理论成果,对于统计学、经济学、物理学等领域具有重要的意义和应用价值。
它不仅为我们提供了便捷的计算工具,也帮助我们更深入地理解随机变量的分布特征,推动了数理统计学和应用统计学的发展。
文章结构部分的内容应该对整篇文章的组织和章节安排进行介绍。
以下是对该部分的内容进行补充的一个示例:1.2 文章结构本文将按照以下结构展开讨论广义中心极限定理。
首先,在引言部分(第1节),将对广义中心极限定理的概述进行介绍,包括其定义、应用范围以及重要性。
随后,将说明文章的结构以便读者了解整体框架。
正文部分(第2节)将分两个小节详细讨论广义中心极限定理。
首先,在第2.1节,将介绍广义中心极限定理的定义,包括其数学表达式以及相关的概念和条件。
样本均值的分布中与心极限定理
在金融领域的应用
风险评估
中心极限定理用于估计金融资产收益率的分布,帮助投资者评估投 资组合的风险。
资本充足率
银行利用中心极限定理计算资本充足率,以确保其风险承受能力符 合监管要求。
保险精算
保险公司使用中心极限定理来评估不同年龄和性别群体的预期寿命和 死亡风险。
切比雪夫不等式:对于任意的正数ε,至少有$1 - varepsilon$的概率,样本均值与总体均值之差的绝对 值小于或等于$σ/sqrt{n}$。
切比雪夫不等式是中心极限定理的特例,它表明当样本量足够大时,样本均值近似服从正态分布。
依概率收敛
依概率收敛:当样本量趋于无穷大时, 样本均值以概率1收敛于总体均值。
重对数律
总结词
重对数律是概率论中的一个定理,它描述了 在独立同分布随机变量序列中,样本均值与 总体均值的差的二阶对数律收敛于0。
详细描述
重对数律表明,当样本量足够大时,样本均 值与总体均值的差的二阶对数律收敛于0, 即样本均值与总体均值的差距的平方根的平 方趋于0。这个定理在统计学中也有着重要 的应用,特别是在处理大样本数据时。
样本均值的分布与中心极限定理
目录
• 中心极限定理简介 • 样本均值的分布 • 中心极限定理的应用 • 中心极限定理的证明 • 中心极限定理的扩展与推广
01 中心极限定理简介
定义与意义
定义
中心极限定理是指无论总体分布是什 么,只要样本量足够大,样本均值的 分布就会趋近于正态分布。
意义
中心极限定理是概率论和统计学中的 基本定理之一,它为许多统计方法和 推断提供了理论基础,特别是在大样 本统计中,我们常常利用中心极限定 理进行推断和决策。
中心极限定理历史
社会科学中的应用
经济学
在经济学中,中心极限定理被用于分析经济数据的分布和变化。例如,研究某个经济指标的长期趋势时,可以利 用历史数据的样本均值和标准差来预测未来可能的变化范围。
THANKS
概率论起源于17世纪中叶,当时数学 家们开始研究赌博游戏中的随机现象 。
雅各布·伯努利在1713年提出了伯努 利大数定律,揭示了相对频率稳定性 ,为概率论的发展奠定了基础。
03
棣莫弗的工作
亚伯拉罕·棣莫弗在18世纪初对概率论 做出了重要贡献,他研究了二项分布 的正态近似,并推导出了棣莫弗-拉普 拉斯定理。
02
该定理指出,在满足一定条件下,独立同分布的随机变量的 标准化和依分布收敛于标准正态分布。
03
费勒定理不仅适用于独立同分布的情况,还可应用于某些相 依随机变量的场合,具有广泛的应用价值。
多元中心极限定理
01
02
03
多元中心极限定理是中心极限定 理在多维情况下的推广,由林德 伯格和列维在20世纪20年代提出。
社会学
社会学家经常需要研究社会现象的分布和变化。通过收集大量样本数据,并利用中心极限定理进行分析,可以对 社会现象的发展趋势和影响因素进行深入探讨。
06
中心极限定理的意义与影响
对概率论和统计学的影响
提供了正态分布的理论基础
中心极限定理表明,在适当条件下,大量独立随机变量的和近似服从正态分布,从而为正态分布 在概率论和统计学中的广泛应用提供了理论支撑。
问题。
揭示中心极限定理的理论意义和实践价值,以及对后续统计学
03
大数定律和中心极限定理例题与解析
在大量随机选取的人群中测量身高, 这些身高的平均值将接近正 态分布, 这也是中心极限定理的一个应用实例。
中心极限定理的应用
概率论与统计学
中心极限定理是概率论和统计学中的基本原理 之一, 用于研究随机变量的分布和统计推断。
金融领域
中心极限定理在金融领域中也有广泛应用, 例如在资 产定价、风险管理和投资组合优化等方面。
例题一解析
要点一
题目
一个班级有30名学生, 每个学生随机选择一个1-100之间的整 数。求这30个随机数的平均数大于50的概率。
要点二
解析
首先, 根据大数定律, 当试验次数足够多时, 随机数的算术平 均值趋近于期望值。在本题中, 每个随机数的期望值是50, 因 此30个随机数的平均数期望值是50。其次, 根据中心极限定 理, 当试验次数足够多时, 随机变量的算术平均值的分布趋近 于正态分布。因此, 这30个随机数的平均数大于50的概率可 以通过正态分布的概率密度函数计算得出。
大数定律的实例
抛硬币实验
如果我们抛硬币1000次,虽然单次抛 硬币的结果是随机的,但当我们计算 正面朝上的频率时,会发现这个频Βιβλιοθήκη 会逐渐趋近于50%。生日悖论
在一个有30人的房间里,存在一定概 率两个人生日相同,这个概率随着人 数的增加而趋近于100%。
大数定律的应用
概率论与统计学
大数定律是概率论和统计学中的 基本原理, 用于估计概率和预测未 来的随机事件。
例题三解析
题目
一个彩票公司发行了100万张彩票, 每张彩票都有一个独立 的随机数生成器生成的一个随机数。求至少有1张彩票的随 机数小于1的概率。
解析
首先, 根据大数定律, 当试验次数足够多时, 随机数的频率趋 近于概率。在本题中, 每张彩票的随机数小于1的概率是 1/100(即每张彩票生成的随机数小于1的概率是固定的)。 其次, 根据中心极限定理, 当试验次数足够多时, 随机变量的 独立同分布的随机变量和的分布趋近于正态分布。因此, 这 100万张彩票中至少有1张彩票的随机数小于1的概率可以 通过正态分布的概率密度函数计算得出。
三个大数定律之间的关系
三个大数定律之间的关系三个大数定律是指大数定律、中心极限定理和辛钦定理。
它们是概率论和统计学中的重要定理,用于描述随机事件的规律性。
三个定律之间存在密切的关系,相互之间可以互相推导和支持。
首先,大数定律是指一系列随机变量的均值在某些条件下趋于一个确定值的现象。
根据大数定律,当随机事件独立且按照相同的概率分布时,样本的均值会收敛于总体均值,即样本数量越大,样本均值越接近总体均值。
大数定律告诉我们,通过增加观测次数,我们可以更准确地估计总体的特征。
其次,中心极限定理是指当抽样量足够大时,随机变量的均值的分布会趋近于正态分布。
中心极限定理是统计学中最重要的定理之一,它告诉我们不管总体的分布形态如何,只要样本量足够大,样本均值的分布会近似于正态分布,并且随着样本量的增加,逼近程度越高。
这个定理的重要性在于可以用来进行统计推断和假设检验,即使总体分布未知,也可以使用正态分布的性质进行近似计算。
最后,辛钦定理是指随机变量的极差的分布会趋近于指数分布。
辛钦定理是大数定律和中心极限定理的推广,它给出了随机变量极差的分布形态。
辛钦定理告诉我们,当样本容量增加时,极差的分布会逐渐趋近于指数分布,这对于概率分布的研究和参数估计具有重要意义。
三个大数定律之间的关系是这样的:大数定律是中心极限定理的基础,而中心极限定理是辛钦定理的基础。
大数定律告诉我们,样本均值逐渐趋近于总体均值;中心极限定理说明了样本均值的分布逐渐趋近于正态分布;辛钦定理则给出了极差的分布形态。
因此,三个大数定律是建立在彼此基础上的,它们共同构成了概率论和统计学的核心内容。
此外,三个大数定律也相互支持和补充。
大数定律告诉我们样本均值的收敛性,中心极限定理给出了收敛后的分布形态,而辛钦定理则补充了极差的分布特点。
它们共同揭示了随机事件的规律性,并且为后续的统计推断和数据分析提供了理论依据。
综上所述,三个大数定律之间存在着密切的关系。
大数定律、中心极限定理和辛钦定理相互推导和支持,共同构成了概率论和统计学的重要内容。
解释中心极限定理的含义
解释中心极限定理的含义中心极限定理是阐明有些即使原来并不服从正态分布的一些独立的随机变量,它们的总和的分布渐近地服从正态分布。
一般来说,这些随机变量受到大量独立的因素中每项因素的影响是均匀的,微小的没有一项因素起特别突出的影响。
那么就可以断言,这些随机变量的和的分布,近似于正态分布。
中心极限定理,是指概率论中讨论随机变量序列部分和分布渐近于正态分布的一类定理。
这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量近似服从正态分布的条件。
它是概率论中最重要的一类定理,有广泛的实际应用背景。
在自然界与生产中,一些现象受到许多相互独立的随机因素的影响,如果每个因素所产生的影响都很微小时,总的影响可以看作是服从正态分布的。
中心极限定理就是从数学上证明了这一现象。
最早的中心极限定理是讨论重点,伯努利试验中,事件A出现的次数渐近于正态分布的问题。
简介及其历史发展它是概率论中最重要的一类定理,有广泛的实际应用背景。
在自然界与生产中,一些现象受到许多相互独立的随机因素的影响,如果每个因素所产生的影响都很微小时,总的影响可以看作是服从正态分布的。
中心极限定理就是从数学上证明了这一现象。
最早的中心极限定理是讨论n重伯努利试验中,事件A出现的次数渐近于正态分布的问题。
1716年前后,A.棣莫弗对n重伯努利试验中每次试验事件A出现的概率为1/2的情况进行了讨论,随后,P.-S.拉普拉斯和A.M.李亚普诺夫等进行了推广和改进。
自P.莱维在1919~1925年系统地建立了特征函数理论起,中心极限定理的研究得到了很快的发展,先后产生了普遍极限定理和局部极限定理等。
极限定理是概率论的重要内容,也是数理统计学的基石之一,其理论成果也比较完美。
长期以来,对于极限定理的研究所形成的概率论分析方法,影响着概率论的发展。
同时新的极限理论问题也在实际中不断产生。
中心极限定理有着有趣的历史。
这个定理的第一版被法国数学家棣莫弗发现,他在1733年发表的卓越论文中使用正态分布去估计大量抛掷硬币出现正面次数的分布。