中心极限定理及其应用论文
中心极限定理及其在统计学中的应用
中心极限定理及其在统计学中的应用中心极限定理是概率论中一个十分重要的定理,简称CLT。
它经常被用在统计学中,帮助我们了解所测量的数据中包含的误差大小,并且为我们的研究提供了很多的参考意见。
中心极限定理的证明很复杂,但是它本质上的含义很简单。
这个定理告诉我们,在许多同等规模的样本数据集中,每个数据点的变化趋势和总体数据的平均值之间的差异都是随机的,而这个随机性可以被用来去除数据中的误差。
假设我们进行了一个抽样调查,样本容量为n,每个样本数据都是来自同一总体分布,但是每个样本数据都有点小的差异。
如果我们把每个样本的平均值绘制在一个可视化图表中,我们会发现这些平均值随机地分布在总体平均值的周围。
当样本容量n足够大时,这些平均值会呈现出一种类似正态分布的形状。
这个正态分布的均值是总体平均值,而标准差可以被估算出来。
所以,如果我们要进行充分利用这个观察到的正态分布,我们可以用标准差来对测量误差进行纠正。
如果我们对一个样本进行多次测量,并得到一个平均值,标准差就是将这些结果四舍五入再取平均值之后的值。
中心极限定理可以帮助我们在不知道总体分布的情况下,做到对误差进行校正,这是多数数据收集和分析过程中必须做到的。
CLT可以被用来评估一组数据和总数据之间的关系,并且它们在统计学的应用中非常常见。
例如,当我们在统计化学实验中测量某个物质的属性时,如果我们重复测量多次,结果会有所不同。
中心极限定理告诉我们,如果我们可以收集到足够多的数据,我们就可以估计这个物质属性的平均值,并且计算出误差(标准差)。
中心极限定理也可以应用于数据分析,允许我们从样本数据中推断整个总体的信息。
例如,如果我们需要对一个产品进行质量控制,我们可以抽取样本并对其进行一系列的测试。
通过应用中心极限定理,我们可以比较容易地估计整个产品批次的平均实际值。
此外,我们还可以计算出我们测得的数据与总体平均值之间的差异,从而评估产品的质量。
总之,中心极限定理是统计学中一个十分重要的定理,它可以帮助我们准确地评估数据的误差和信心水平,并且可以用于预测整个总体的表现。
【毕业论文】中心极限定理的理论及其应用
摘 要本文从随机变量序列的各种收敛与它们间的关系谈起,通过对概率经典定理——中心极限定理在独立同分布和不同分布两种条件下的结论作了比较系统的阐述,揭示了随机现象最根本的性质——平均结果的稳定性。
经过对中心极限定理的讨论,给出了独立随机变量之和的分布用正态分布来表示的理论依据。
同样中心极限定理的内容也从独立分布与独立不同分布两个角度来进行讨论。
同时通过很多相关的正反例子,进行说明这些定理所给出的条件是否是充要条件;强调在实际问题中灵活的应用和辨别是否服从我们给出的定理条件。
最后了解一些简便的中心极限定理在数理统计、管理决策、近似计以及保险业等方面的应用,来进一步地阐明了中心极限定理分支学科中的重要作用和应用价值。
关键词:随机变量,独立随机变量,特征函数,中心极限定理Abstrac tThis paper concerns on the convergence and relation of the series of random variable. By means of the studying on laws of large numbers and central---limit theorems under the condition either of independent and identically distribution or independent but different---distributions comprehensively,we illuminate that the mean value is stable which is the essential property for the event. And we enplaned the rules that the sum of in dependent random variables submitted the normal distribution according to central--limit theorems. At the same time,we analyzed and stated the Markov theorem under the different terms and conditions,so its theorems,i.e. Chebyshev theorem,Bemoulli theorem,Poisson theorem including Khintchine theorem based on the distribution. Moreover,we have got the strong law of large numbers in the sense of its probability with1 by generalization. Central---limit theorems were studied in the same way. In addition,we showed the relations between various law of large numbers,Various central---limit theorems and themselves mutually. The more interesting is that plenty of correlative examples including Positive and negative are illustrated to emphasize the importance of identifying the conditions of these theorems in all sorts of their applications. At last,we brought forth the value of laws of large numbers and central---limit Theorems in some subjects such as mathematical statistics,administrative Decision---making,approximate calculation,insurance and so on.Keywords: convergence of random variables,independent random variables,Characteristic function,central-limit theorem目录第一章 绪论 (1)1.1课题的研究意义 (1)1.2国内外研究现状 (1)1.3研究目标 (2)第二章 中心极限定理 (3)2.1中心极限定理的提法 (3)2.2独立同分布情形 (6)2.3独立不同分布情形下的中心极限定理 (9)第三章 中心极限定理的应用和推广 (10)3.1中心极限定理在经济中的应用 (13)3.2中心极限定理在商场管理中的应用 (19)参考文献 (20)致 谢 (21)声 明 (22)第一章 绪 论1.1 课题的研究意义概率统计学是一门研究随机现象统计规律性的数学学科,它的应用十分广泛,涉及自然科学、社会经济学科、工程技术及军事科学、农医学科、企业管理部门等。
中心极限定理及其应用
中心极限定理及其应用在统计学中,中心极限定理是一个十分重要的理论,它指出,对于任何分布,如果进行足够多次的独立随机实验,那么其各自的样本平均值的分布将变得越来越接近正态分布。
这个定理在实际应用中有着广泛的应用,可以帮助我们更好地理解许多不同领域的现象。
一、中心极限定理的原理首先,我们需要理解中心极限定理的原理。
其基本假设是,我们有一个特定的总体(即一个随机变量的总体),其均值为μ、方差为σ2。
我们对这个总体进行随机抽样实验,每次实验都独立于前一次实验。
如果我们将每次实验的结果加起来,那么总和将逐渐趋近于正态分布。
具体来说,如果我们进行n次实验,每次实验得到的随机变量的分布都相同,且有限,那么这些随机变量的总和的分布将逐渐趋近于正态分布,而随着n的增加,趋近的速度会越来越快。
但是注意:这个定理只适用于样本中的随机变量的数量足够多,而且不能是无限多。
二、中心极限定理的应用中心极限定理在实际应用中有着非常广泛的用途。
它可以帮助我们更好地理解许多不同领域的现象。
1. 物理学在物理学中,中心极限定理可以帮助我们更好地理解热力学的基本原理。
热力学是描述物质在不同状态下的性质的一门学科,其中体积、温度、压力等参数都是连续变化的。
中心极限定理告诉我们,当我们观察足够多个分子时,它们的运动状态将趋向于正态分布,从而使我们更好地理解宏观物理系统的运动规律。
2. 经济学在经济学中,中心极限定理可以帮助我们更好地理解市场的波动。
市场波动是一个复杂而强烈的现象,但中心极限定理告诉我们,当我们对市场涨跌幅进行足够多的抽样时,这些涨跌幅的总和将趋向于正态分布。
这使得经济学家能够更好地预测市场的走向,从而使投资策略更加精细化。
3. 生物学中心极限定理也可以应用于生物学中,帮助我们更好地理解生物群落的变化。
生物群落中的物种数量随着时间或空间的变化而发生变动,并且往往受到众多因素的影响。
中心极限定理告诉我们,当我们对大量的随机抽样进行实验时,这些样本的总数将趋向于正态分布。
中心极限定理的内涵和应用
中心极限定理的涵和应用在概率论与数理统计中,中心极限定理是非常重要的一节容,而且是概率论与数理统计之间承前启后的一个重要纽带。
中心极限定理是概率论中讨论随机变量和的分布以正态分布为极限的一组定理。
这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量之和近似服从于正态分布的条件。
故为了深化同学们的理解并掌握其重要性,本组组员共同努力,课外深入学习,详细地介绍了中心极限定理的涵及其在生活实践中的应用。
一、独立同分布下的中心极限定理及其应用在对中心极限定理的研究中,我们不妨由浅入深地来学习,为此我们先来研究一下在独立同分布条件下的中心极限定理,即如下的定理1:定理l (林德伯格-勒维中心极限定理)设{}n X 是独立同分布的随机变量序列,且0)(,)(2>==σμi i X Var X E 存在,若记nn XY ni in σμ-=∑=1则对任意实数y ,有{}⎰∞--∞→=Φ=≤yt n n t y y Y P .d e π21)(lim 22(1) 证明:为证明(1)式,只须证}{n Y 的分布函数列弱收敛于标准正态分布。
由定理可知:只须证}{n Y 的特征函数列收敛于标准正态分布的特征函数。
为此,设μ-n X 的特征函数为)(t ϕ,则n Y 的特征函数为nY n t t n ⎥⎦⎤⎢⎣⎡=)()(σϕϕ又因为E(μ-n X )=0,Var(μ-n X )=2σ,所以有()0ϕ'=0,2)0(σϕ-=''。
于是,特征函数)(t ϕ有展开式)(211)(2)0()0()0()(22222t o t t o t t +-=+''+'+=σϕϕϕϕ从而有=⎥⎦⎤⎢⎣⎡+-=+∞→+∞→nn Y n n t o nt t n )(21lim )(lim 22ϕ22t e -而22t e-正是N(0,1)分布的特征函数,定理得证。
这个中心极限定理是由林德贝格和勒维分别独立的在1920年获得的,定理告诉我们,对于独立同分布的随机变量序列,其共同分布可以是离散分布,也可以是连续分布,可以是正态分布,也可以是非正态分布,只要其共同分布的方差存在,且不为零,就可以使用该定理的结论。
中心极限定理及其初步应用
中心极限定理及其初步应用【摘要】中心极限定理的产生具有一定的客观背景,最常见的是德莫佛-拉普拉斯中心极限定理和林德贝格-勒维中心极限定理。
它们表明了当n充分大时,方差存在的n个独立同分布的随机变量和近似服从正态分布,在实际中的应用相当广泛。
本文讨论了中心极限定理在定期寿险业、决策问题及生产供应需求三个方面的应用,说明其与现实有紧密的联系。
【关键词】中心极限定理,定期寿险, 决策问题【Abstract】The production of the central limit theorem has objective background, the most common forms are the De Moivre -Laplace central limit theorem and Lindeberg-Levy central limit theorem. They show that when n is sufficiently large and variance exists, the sum of n independence identity distribution random variables approximates normal distribution. So it has widespread application in reality. The article discusses the application of the central limit theorem in three aspects, which are the regular life insurance industry, the policy-making question and producti on’s supply and demand. They have the close relation with the reality.【Keywords】central limit theorem,regular life insurance, policy-making question目录第一章中心极限定理 (4)1.1中心极限定理产生的客观背景 (4)1.2常见的中心极限定理 (4)1.2.1德莫佛-拉普拉斯中心极限定理 (4)1.2.2林德贝格-勒维中心极限定理 (4)1.3中心极限定理的意义 (5)第二章中心极限定理的应用 (6)2.1中心极限定理在定期寿险中的应用 (6)2.1.1保险学的概率论数学原理 (6)2.1.2定期寿险的保险金给付模型 (7)2.1.3定期寿险业的盈亏预测 (9)2.1.4实例分析 (10)2.2中心极限定理在决策问题中的应用 (11)2.3中心极限定理在生产供应需求中的应用 (14)2.1.1根据现有生产能力及用户需求状态,估算能满足社会需求的可靠程度 (14)2.1.2根据社会需求状态来确定生产任务 (15)2.1.3根据需求及产品质量情况来确定生产量 (15)2.1.4例题分析 (16)第三章结束语 (19)参考文献 (20)致谢 (21)附录一:文献综述 (22)附录二:外文文献译文1 (25)原文1 (31)译文2 (37)原文2 (43)附录三:远雄人寿千喜男性一年定期寿险费率表 (49)附录四:中国人寿保险业经验生命表(1990-1993)(男性) (50)第一章 中心极限定理1.1 中心极限定理产生的客观背景在实际问题中,常常需要考虑许多随机因素所产生的总的影响,如测量误差、炮弹射击的落点与目标的偏差等。
论中心极限定理及应用
似地 服从 均值为 方差 为 o a / 2的正态 分布. 这 一结果 是数
理统计 中大样 本统计推 断的理论基础.
2 棣 莫 佛 一 拉 普 拉 斯定 理
量 独 立 随 机 变 量 和 的问 题 .
注 2 : 易见 , 棣莫弗一拉普 拉斯 中心极 限定理就 是 L i n — d e b e r g - - - L e v y中心极限定理的一个特殊情况. 注 3 :中心极 限定理存在 的条件 整理为如 下几个关 键 词: 独立 、 同分 布、 数学期望与方差存在 ; 当随机 变量序列满 足 中心极 限定理时 ,难点是求解 随机变量 和函数的数学期 望和方差 ,进而进行标准化就可 以得 到近似服从标 准正态
E ( X ) = 1 0 0 X E ( X O = I O 0 0 0 , 、 俪
有
= l o o , 由中心极限定理
1
注 1 : 该 定 理 表 明: 当 n充 分 大 时 , n个 具 有 期 望 和 方 差 的
独立 同分布 的随机变量之和近似服从 正态分 布. 虽然在一般 情况下 ,我们很难求 出 x + x : + . . ・ + x 的分布 的确切形式 , 但
分布.
3 应 用 举 例
中心极 限定理回答了大量独立随机变量 和的近似分布 问题 , 其结论表 明: 当一个量受许多随机 因素( 主导 因素除外)
的共 同影 响而随机取值,则它的分布就近似服从正态 分布. 而正 态分 布有许多完美 的理论 ,从而可 以获得 即实用又简 单 的统计分析结果.本文仅介 绍其 中两个最基本 的结论 , 并
中心极限定理应用[五篇范例]
中心极限定理应用[五篇范例]第一篇:中心极限定理应用中心极限定理及其应用【摘要】中心极限定理的产生具有一定的客观背景,最常见的是德莫佛-拉普拉斯中心极限定理和林德贝格-勒维中心极限定理。
它们表明了当n充分大时,方差存在的n个独立同分布的随机变量和近似服从正态分布,在实际中的应用相当广泛。
本文讨论了中心极限定理的内容、应用与意义。
【关键词】:中心极限定理正态分布随机变量一、概述概率论与数理统计是研究随机现象、统计规律性的学科。
随机现象的规律性只有在相同条件下进行大量重复的实验才会呈现出来,而研究大量的随机现象常常采用极限的形式,由此导致了对极限定理的研究。
极限定理的内容很广泛,中心极限定理就是其中非常重要的一部分内容。
中心极限定理主要描述了在一定条件下,相互独立的随机变量序列X1、X2、…Xn、…的部分和的分布律:当n→∞时的极限符合正态分布。
因此中心极限定理这个结论使正态分布在数理统计中具有很重要的地位,也使得中心极限定理有了广泛的应用。
二、定理及应用1、定理一(林德贝格—勒维定理)若ξk1,=a,ξ2,…是一列独立同分布的随机变量,且EξDξk=kσ⎰x2(σ2>0),k=1,2,…则有limp(k=1n→∞∑ξn-na≤x)=σnn12π-∞e-t22dt。
当n充分大时,∑ξk=1k-naσn~N(0,1),k=1∑ξnk~N(na,nσ)22、定理二(棣莫弗—拉普拉斯中心极限定理)在n重伯努利试验中,事件A在每次试验中出现的概率为错误!未找到引用源。
, 错误!未μ找到引用源。
为n次试验中事件A出现的次数,则limp(n→∞n-npnpq≤x)=⎰2π1x-∞e-t22dt其中q=1-p。
这个定理可以简单地说成二项分布渐近正态分布,因此当n充分大时,可以利用该定理来计算二项分布的概率。
同分布下中心极限定理的简单应用独立同分布的中心极限定理可应用于求随机变量之和Sn落在某区间的概率和已知随机变量之和Sn取值的概率,求随机变量的个数。
理解中心极限定理及其应用
理解中心极限定理及其应用中心极限定理是统计学中一项重要的概念,它描述了当样本容量足够大时,样本均值的分布将接近于正态分布。
这个定理在实际应用中具有广泛的意义,可以帮助我们更好地理解和分析数据。
首先,让我们来了解一下中心极限定理的基本原理。
假设我们有一个总体,其中包含了许多独立同分布的随机变量。
我们从这个总体中抽取出一定数量的样本,并计算这些样本的均值。
根据中心极限定理,当样本容量足够大时,这些样本均值的分布将近似于正态分布。
这个定理的应用非常广泛。
例如,在市场调研中,我们经常需要对一定数量的样本进行调查,并通过分析这些样本的均值来推断总体的特征。
中心极限定理告诉我们,当样本容量足够大时,我们可以使用正态分布来描述样本均值的分布情况,从而更准确地进行推断。
此外,在质量控制中,中心极限定理也扮演着重要的角色。
假设我们要检验某个生产过程的平均值是否符合要求。
通过抽取一定数量的样本,并计算这些样本的均值,我们可以利用中心极限定理来推断总体平均值的分布情况。
如果样本均值的分布接近于正态分布,并且符合要求,我们可以认为生产过程的平均值是可接受的。
中心极限定理还可以应用于假设检验。
假设我们想要判断某个总体的均值是否等于某个特定值。
通过抽取一定数量的样本,并计算这些样本的均值,我们可以利用中心极限定理来推断总体均值的分布情况。
如果样本均值的分布接近于正态分布,并且与特定值之间存在显著差异,我们可以得出结论,总体均值不等于特定值。
除了上述应用外,中心极限定理还可以帮助我们进行抽样调查的样本容量确定。
在进行抽样调查时,我们需要确定样本的大小,以保证推断结果的准确性。
中心极限定理告诉我们,当样本容量足够大时,样本均值的分布将近似于正态分布。
因此,我们可以根据所需的推断精度和置信水平,利用中心极限定理来确定样本容量的大小。
总之,中心极限定理是统计学中一项重要的概念,它描述了当样本容量足够大时,样本均值的分布将接近于正态分布。
中心极限定律的应用
中心极限定律的应用中心极限定律是概率论中的重要定理,它描述了独立随机变量和的分布趋近于正态分布的现象。
在实际应用中,中心极限定律有着广泛的应用,能够帮助我们解决各种实际问题。
中心极限定律在统计学中有着重要的作用。
在统计学中,我们经常需要对一组样本进行分析,以了解总体的一些特征。
根据中心极限定律,当样本容量足够大时,样本均值的分布会逐渐趋近于正态分布。
这个特性使得我们可以利用样本均值的正态分布性质进行统计推断,例如计算置信区间、进行假设检验等。
在质量控制领域,中心极限定律也有着重要的应用。
当我们需要对生产过程中的质量进行抽样检验时,中心极限定律可以帮助我们确定合适的样本容量。
根据中心极限定律,当样本容量足够大时,样本均值的分布会逐渐趋近于正态分布。
这意味着我们可以通过计算样本均值的方差来估计总体均值的方差,并据此确定合适的样本容量。
在金融领域中,中心极限定律也有着广泛的应用。
金融市场的价格变动往往是随机的,而且受到多种因素的影响。
根据中心极限定律,当我们对金融市场进行大量独立观察时,这些观察值的平均值会趋近于正态分布。
这使得我们可以利用正态分布的性质来进行风险管理、投资决策等。
中心极限定律还在信号处理、图像处理、机器学习等领域有着重要的应用。
在这些领域中,我们经常需要对信号或数据进行处理和分析。
根据中心极限定律,当我们对大量独立的信号进行处理时,处理结果的分布会趋近于正态分布。
这使得我们可以利用正态分布的统计性质来进行信号分析、数据挖掘等。
中心极限定律作为概率论中的重要定理,在实际应用中发挥着重要的作用。
它帮助我们解决了许多实际问题,如统计推断、质量控制、金融风险管理、信号处理等。
中心极限定律的应用使得我们能够更加准确地理解和分析随机现象,为决策提供科学的依据。
浅谈中心极限定理及其应用
浅谈中心极限定理及其应用中心极限定理(CentralLimitTheorem,简称CLT)是统计学中最基本的定理,可以提供数学理论支持和方便的引用,以解决许多实际问题。
这个定理的完整表述是:当抽取的样本量足够大的时候,样本平均数的分布曲线接近于正态分布,即属于类正态分布,其平均值接近于总体平均数,其标准差接近于总体标准差的平方根。
中心极限定理的应用方面,可以涉及到许多方面:一、测定总体参数。
中心极限定理可以用来估计总体参数,包括总体均值、总体方差和总体分布等。
二、假设检验。
中心极限定理可以用于检验统计模型的参数,即样本和总体的分布形式是否一致,研究者可以利用其来进行假设检验,从而评估统计模型的正确性。
三、置信区间估计。
中心极限定理也可以利用来估计总体参数所处的置信区间,在样本量足够大的情况下,置信区间会变得紧密,从而使得置信度得到提高。
四、回归分析。
在回归分析中,中心极限定理可用于评估模型的参数置信区间,也可用于评估线性回归模型的拟合程度,从而推出结论。
具体来讲,中心极限定理的应用非常灵活,并且无处不在,几乎所有的统计分析和统计模型都可以借助它求解。
在实际数据处理中,中心极限定理是统计学中最基本定理,将它运用在模型构建中,将有助于增强模型的可靠性和准确性。
总之,中心极限定理可以用来估计总体参数,也可以用于假设检验,能够确定模型的参数,估计总体参数所处的置信区间范围,及对回归分析进行验证。
它是统计学基础理论,在数据处理中起着重要作用,为研究者提供了便利。
中心极限定理实际上是一个概率模型,它可以分析我们观察到的大量数据,帮助我们做出更准确的决策。
而且,它也是数据挖掘和机器学习的基础理论,对于统计数据处理和模型建立有着重要意义。
数学与应用数学毕业论文-中心极限定理探讨及应用(精品doc)
目录摘要 (II)1绪论 (3)1.1课题的研究意义 (3)1.2国内外研究现状 (3)1.3研究目标 (4)2关于独立分布的中心极限定理的探讨 (5)2.1中心极限定理的提法 (5)2.2独立同分布情形的两个定理. (5)2.2.1 林德伯格-----勒维中心极限定理 (6)2.2.2隶莫弗——拉普拉斯定理 (7)2.3独立不同分布情形下的中心极限定理 (8)2.3.1林德贝格中心极限定理 (8)2.3.2李雅普诺夫中心极限定理 (12)2.4本章小结 (14)3中心极限定理在商业管理中的应用 (15)3.1水房拥挤问题 (15)3.2设座问题 (17)3.3盈利问题 (18)3.4抽样检验问题 (19)3.5供应问题 (20)结语 (20)参考文献 (22)附录 (22)中心极限定理探讨及应用摘要:本文从随机变量序列的各种收敛与它们间的关系谈起,通过对概率论的经典定理—中心极限定理在独立同分布和不同分布两种情况下的结论作了比较系统的阐述,揭示了随机现象最根本的性质—平均结果的稳定性.经过对中心极限定理的讨论,给出了独立随机变量之和的分布可以用正态分布来表示的理论依据.同样中心极限定理的内容也从独立同分布与独立不同分布两个角度来进行讨论;最后给出了一些中心极限定理在数理统计、管理决策、近似计算、以及保险业等方面的应用,来进一步地阐明了中心极限定理在各分支学科中的重要作用和应用价值.关键词:弱收敛;独立随机变量;特征函数;中心极限定理.1绪论1.1课题的研究意义概率统计学是一门研究随机现象统计规律性[1]的数学学科,它的应用十分广泛,涉及自然科学、社会经济学科、工程技术及军事科学、农医学科、企业管理部门等.而大数定律和中心极限定理是概率论中最重要的内容之一,甚至可以说概率论的真正历史开始于极限定理的研究,在这以前概率论还仅局限于古典概率的直接计算,而且主要是赌博中的概率计算[2].极限定理最早的成果有:伯努利大数定律,棣莫佛一拉普拉斯定理和泊松定理,这些定理开辟了概率论中的重要研究方向—大数定律、中心极限定理及以正态分布和泊松分布为代表的无穷可分分布的研究.概率论中讨论随机变量序列部分和的分布渐近于正态分布的一类定理是概率论中最重要的一类定理,有广泛的实际应用背景.在自然界与生产中,一些现象受到许多相互独立的随机因素的影响,如果每个因素所产生的影响都很微小时,总的影响可以看作是服从正态分布的.中心极限定理就是从数学上证明了这一现象.最早的中心极限定理是讨论n重伯努利试验中,某事件A出现的次数渐近于正态分布的问题.1716年前后,棣莫佛对n重伯努利试验中每次试验事件A出现的概率为1/2的情况进行了讨论,随后,拉普拉斯和李亚普诺夫等进行了推广和改进.自莱维在1919-1925年系统地建立了特征函数理论起,中心极限定理的研究得到了很快的发展,先后产生了普遍极限定理和局部极限定理等.无论是在概率论的发展史上还是在现代概率论中,极限定理的研究都占特别重要的地位,也是数理统计学的基石之一,其理论成果也比较完美.长期以来,对于极限定理的研究所形成的概率论分析方法,影响着概率论的发展.同时新的极限理论问题也在实际中不断产生.这样中心极限定理在概率论中占有重要的地位,同时极限定理的研究引起了现代概律论的发展,并且在统计分析和近似计算等方面具有一定的应用,所以中心极限定理的研究具有一定的理论和实际意义.1.2国内外研究现状中心极限定理作为概率论的重要内容,其理论成果相对比较完善.这方面的文章较多,它们的结果也比较完美.但是他们注重于研究单一的方向,而几个定律之间的关系和应用方面的较少.出于这种现状本文通过对独立条件下的中心极限定理做系统的分析,主要研究和讨论几个中心极限定理之间的关系以及中心极限定理所揭示的理论意义和他们的应用.同时对文中出现的定理和结论做系统的分析和证明,所以对教学和科研方面具有一定的参考价值.1.3研究目标通过对独立随机序列的中心极限定理做系统的分析,阐明中心极限定理它们之间的关系以及举例说明中心极限定理在实际问题中的应用为教学和科研供参考.2 关于独立分布的中心极限定理的探讨凡是在一定条件下断定随机变量之和的极限分布是正态分布的定理,在概率论中统称中心极限定理.具体一点说,中心极限定理回答的是(独立或弱相依)随机变量之和的极限分布在什么条件下是正态的.中心极限定理是揭示产生正态分布的源泉,是应用正态分布来解决各种实际问题的理论基础.2.1中心极限定理的提法直观上,如果一随机变量决定于大量(乃至无穷多个)随机.因素的总合,其中每个随机因素的单独作用微不足道,而且各因素的作用相对均匀,那么它就服从(或近似地服从)正态分布,下面我们将按严格的数学形式来表述这一直观.在许多情形下,一随机变量X 可以表示为或近似地表示为大量独立随机变量之和,12n X ξξξ=++⋅⋅⋅ (a)这里,每个i ξ直观上表示一种随机因素的效应,假如式(a)包含了决定X 的充分多的随机因素的效应(即n 充分大),则1ni i ξ=∑的分布就近似于X 的分布.中心极限定理就是要说明,在什么条件下大量独立随机变量之和近似地服从正态分布,即,在什么条件下,当n →∞时,独立随机变量之和的极限分布是正态分布的.中心极限定理的名称最早是由仆里耶(1920年)提出来的,中心极限定理的一般形式最早是由切比雪夫(1821年—1894年)提出来的下面我们介绍四个主要定理:1)林德伯格一勒维定理2)棣莫弗一拉普拉斯定理2)林德伯格定理3)李雅普诺夫定理.其中林德伯格定理是最一般的,其它情形可以看作它的推论.2.2独立同分布情形的两个定理.中心极限定理有多种不同的形式,它们的结论相同,区别仅在于加在各被加项12,,ξξ⋅⋅⋅上的条件不同.独立同分布随机变量列的中心极限定理,是中心极限定理最简单又最常用(特别在数理统计中)的一种形式,通常称做林德伯格----勒维定理.历史上最早的中心极限定理一棣莫弗一拉普拉斯(积分)定理是它的特殊情形.设(1,2,)k k ξ=⋅⋅⋅的方差D ξ,大于0,令2221,,nk k k n k k a E b D B b ξξ====∑ (1)我们说,随机变数列{}k ξ服从中心极限定理,如果关于1x R ∈均匀的有22111lim ().2t nxk k n k nP a x edt B ξπ--∞→∞=⎧⎫-≤=⎨⎬⎩⎭∑⎰(2)(2)表示:随机变量数11()nkk k na B ξ=-∑的分布函数关于x 均匀的趋于正态分布(0,1)N 的分布函数.独立同分布的两个定理:2.2.1 林德伯格-----勒维中心极限定理设12,,,,n x x x ⋅⋅⋅⋅⋅⋅相互独立,服从同一分布,具有数学期望和方差:2(),()0.i i E x Var x μσ==>记 12...n n X X X n Y nμσ*+++-=则对任意实数y ,有221l i m ()().2t y n n p Y y y e d t π-*-∞→+∞≤=Φ=⎰(3)证明 为证(1)式,只须证{}*n Y 的分布函数列若收敛于标准正态分布.又由定理4.3.4[3],只须证{}*n Y 的特征函数列收敛于标准正态分布的特征函数.为此设n X μ-的特征函数为()t ϕ,则*n Y 的特征函数为*()()nnY t t n ϕϕσ⎡⎤=⎢⎥⎣⎦ 又因为2()0,()n n E X Var X μμσ-=-=,所以有 (0)0ϕ'=, 2(0)ϕσ''=- 于是特征函数()t ϕ有展开式22()(0)(0)(0)()2t t t t ϕϕϕϕο'''=+++ 22211()2t t σο=-+从而有2*2222lim ()lim 1()2n nt Y n n t t t e nn ϕο-→+∞→+∞⎡⎤=-+=⎢⎥⎣⎦,而22t e-正是(0,1)N 分布的特征函数,定理得证.例1某汽车销售点每天出售的汽车辆数服从参数为2λ=的泊松分布.若一年365天都经营汽车销售,且每天出售的汽车数是相互独立的,求一年中售出700辆以上汽车的概率.解:设x 某汽车销售点每天出售的汽车辆数,则12365Y x x x =++⋅⋅⋅+,为一年的总销量.由()()2i i E x Var x ==,知()()3652730E Y Var Y ==⨯=.利用林德贝格---勒维中心极限定理可得, 700730(700)1(700)1()1(111)0.8665730P Y P Y ->=-≤≈-Φ=-Φ-= 这表明一年中售出700辆以上汽车的概率为0.86652.2.2隶莫弗——拉普拉斯定理在n 重贝努里试验中,事件A 在每次试验中出现的概率为p (0<p<1),n μ为n 次试验中事件A 出现的次数,且记n n npY npqμ*-=且对任意实数y ,有221l i m ()().2t y n n p Y y y e d t π-*-∞→+∞≤=Φ=⎰此定理由定理1马上就得出,也就是说定理2是定理1的推论.例2 某保险公司多年的统计资料表明,在索赔户中被盗索赔户占20%,以x 表示在随意抽查的100个索赔户中因被盗向保险公司索赔的户数.(1)写出x 的分布列;(2)求被盗户不少于14户且不多于30户的概率近似值. 解:(1) x 服从100,0.2n p ==的二项分布(100,2)b ,即100()0.20.8,1,2,,k k n p x k k n k -⎛⎫===⋅⋅⋅ ⎪⎝⎭(2)利用隶莫弗---拉普拉斯中心极限定理,有30.51000.213.51000.2(1430)(13.530.5)()()1000.20.81000.20.8p x p x -⨯-⨯≤≤=<<≈Φ-Φ⨯⨯⨯⨯(2.625)( 1.625)(2.625)1(1.625)0.9956510.9480.9437=Φ-Φ-=Φ-+Φ=-+=这表明被盗户不少于14户且不多于30户的概率近似值为0.9437.2.3独立不同分布情形下的中心极限定理对于独立同分布随机变量序列12,,ξξ⋅⋅⋅只要它们的方差有穷,中心极限定理就成立.而在实际问题中说诸i ξ具有独立性是常见的,但是很难说诸i ξ是“同分布”的随机变量,正如前面提到的测量误差n Y 的产生是由大量“微小的”相互独立的随机因素叠加而成的,即1nn i i Y ξ==∑则i ξ间具有独立性,但不一定同分布,所以我们有必要讨论独立不同分布随机变量和的极限分布问题,目的是给出极限分布为正态分布的条件.林德伯格(Lideberg)于1922年找到了独立随机变量服从中心极限定理的最一般的条件,通常称做林德伯格条件.2.3.1林德贝格中心极限定理设独立随机变量序列{}n X 满足林德贝格条件,则对任意的x ,有22111lim ().2t nxi i n i nP X x edt B μπ--∞→∞=⎧⎫-≤=⎨⎬⎩⎭∑⎰为证此,先证下列三个不等式:对任意实数a ,有1ia e a -≤; (4)212!iaa e ia --≤ (5)22123!iaa a e ia --+≤ (6) 实际上,对0a =上三式明显.设0a >,则01ai a i x e e d x a -=≤⎰;21(1)2!aaiaixa e ia e dx xdx --=-≤=⎰⎰;21(1)2ai ai xa e i a e i x d x --+=--⎰ 2212!3!aaixx a e ixdx dx ≤--≤=⎰⎰利用cos sin ia e a i a =+,可见(4)(5)(6)方都是a 的偶函数,故他们对0a <也成立.定理三的证明,先把记号简化.令k knk na B ξξ-=(7)以()nk t f 、()nk x F 分别表nk ξ的特征函数与分布函数,因而()()(),nk x k n k k n k F P B x a F B x a ξ=≤+=+ (8) ()20,knk nk x nk nD E xdF D B ξξξ+∞-∞==⎰, (9)2()211111nnnnknk x k k k k n D x dF D B ξξ+∞-∞======∑∑∑⎰(10) 在这些记号下,由(6)22()()21()()kk nnk x a k nk x k x x a B B nnx a x a dF dF B B ττ-->>--=⎰⎰ 2()nnk y y B y dF τ>=⎰故林德贝格条件可化为:对任意0τ>, 2()1lim 0nnk x x n k x dF τ>→∞==∑⎰; (11)而(2)式化为:对τ均匀的有2211l i m .2t nynk n k P x e dt ξπ--∞→∞=⎧⎫≤=⎨⎬⎩⎭∑⎰(12)如果在条件(11)下,能够证明1nnk k ξ=∑的特征函数22()1()()t nn nk t k t f en ϕ-==→→∞∏亦即2()1log ()log ,()2nn nk t k t t f n ϕ==→-→∞∑ (13)那么根据定理3.2.3[4],(12)成立;再由定理3.1.3,(12)中收敛对1x R ∈还是均匀的,于是定理3得以证明.现在也就是只要证出(13)成立 则问题得证为了证明(13),分两步.(甲)先证log ()n t ϕ可展开为 ()1log ()(1)()nn nk t n k t f R t ϕ==-+∑, (14)其中函数()n R t 在任意有穷t 区间内趋于0 实际上,由(9)中前一式()()1(1)itx nk t nk x f e itx dF +∞-∞-=--⎰ (15)根据(5)22222()()()()122nk t nk x nk x nk x x x t t f x dF x dF x dF εε+∞-∞≤>⎡⎤-≤=+⎢⎥⎣⎦⎰⎰⎰ 222()2nk x x t x dF εε>⎡⎤≤+⎢⎥⎣⎦⎰. (16)其中0ε>任意.由(11),对一切充分大的n 有22()(1)nk x x x dF k n εε><≤≤⎰;从而关于(1)k k n ≤≤及任何有限区间[],T T -中的t ,同时有2222()()11;m a x1n k t n k tk nf T f T εε≤≤-≤-≤ 因而对任意[],t T T ∈-,均匀的有()1lim max 10nk t n k nf →∞≤≤-=. (17)特别,当[],t T T ∈-时,对一切充分大的n ,下式成立: ()112nk t f -< (18) 因此,在[],T T -中,有展开式()()11log ()log log 1(1)nnn nk t nk t k k t f f ϕ==⎡⎤==+-⎣⎦∑∑第 11 页 共 23页()1(1)()nnk t n k f R t ==-+∑ (19)其中1()12(1)()(1)s ns n nk t k s R t f s -∞==-=-∑∑由(18)2()()121()111()12211n ns nk t n nk t k s k nk t f R t f f ∞===-≤-=--∑∑∑2()11nnk t k f =≤-∑()()11m a x 11nn k t n k tk nk f f≤≤=≤--∑;但由(16)中第一个不等式及(10) 222()()11122nn nk t nk x k k t t f x dF +∞-∞==-≤=∑∑⎰故2()1()max 12n nk t k nt R t f ≤≤≤-由(17)可见当n →∞时,关于任意有穷区间[],T T -中的t 均匀的有()0n R t → (20) (乙)令2()1()(1)2n itxn nk x k t t e itx dF ρ+∞-∞==+--∑⎰由(15)得2()1(1)()2nnk t n k t f t ρ=-=-+∑. (21)如果能够证明:对任意有穷区间[],T T -中的t 均匀的有l i m()0n n t ρ→∞=. (22) 那么以(21)代入(14)并联合(甲)中的结论即得证(13),而且(13)中的收敛对任意有穷区间内的t 均匀,从而定理得以完全证明.今证(22),由(10)1222()1()22n nk x k t itx dF +∞-∞==-∑⎰对任意0ε>,2()1()()12nitx n nk x x k itx t e itx dF ερ≤=⎡⎤=---⎢⎥⎣⎦∑⎰ 22()112nitx nk x x k t x e itx dF ε>=⎡⎤+--+⎢⎥⎣⎦∑⎰ 由(4)(5)得 3322()()11()6nnn nk x nk x x x k k tt x dF tx dF εερ≤>==≤+∑∑⎰⎰3222()()116nn nk x nkx x x k k tx dF tx dF εεε≤>==≤+∑∑⎰⎰由(10)可见:对t T ≤,有 322()1()6nn nk x x k T t Tx dF ερε>=≤+∑⎰(23)对任意0η>,可选0ε>使362T ηε<又由(11),存在正整数(,,)N N T ηε=,使对此ε及n N ≥,有2()212nnk x x k x dF Tεη>=<∑⎰(24)于是当n N ≥时,对一切[],t T T ∈-,有 ()n t ρη<2.3.2李雅普诺夫中心极限定理如对独立随机变数列{}k ξ,存在常数0σ>,使当n →∞时有 22110nkkk n E a Bσσξ++=+→∑ (25)则(2)对x 均匀的成立.第 13 页 共 23页证.只要验证林德贝格条件满足,由(25)2211()()k nnk k x a B k nx a dF x B τ->=-∑⎰2211()()k nnkk x a B k n x a dF x B B σσττ+->=≤-∑⎰221110,()nkkk n E a n Bσσσξτ++=≤+→→∞∑例3 一份考卷由99个题目组成,并按由易到难顺序排列.某学生答对第1题的概率为0.99;答对第2题的概率为0.98;一般地,他答对第i 题的概率为1100,1,2,i i -= .加入该学生回答各题目是相互独立的,并且要正确回答其中60个题目以上(包括60个)才算通过考试.试计算该学生通过考试的可能性多大?解 设⎩⎨⎧=.01题,若学生答错第题;,若学生答对第i i X i 于是i X 相互独立,且服从不同的二点分布: (1)1100,(0)1100,i i i i p X p i p X p i ===-==-= 1,2,,99i = 而我们要求的是991(60)i i p X =≥∑.为使用中心极限定理,我们可以设想从100X 开始的随机变量都与99X 同分布.且相互独立.下面我们用1δ=来验证随机变量序列{}n X 满足李雅普诺夫条件(25),因为11()(1),()n nn iiii i B Var X p p n ====-→+∞→+∞∑∑,333()(1)(1)(1)i i i i i i i i E X p p p p p p p -=-+-≤-, 于是31231111()0(1)n i i n i n i i i E X p B p p ==-≤→⎡⎤-⎢⎥⎣⎦∑∑ ()n →+∞, 即{}n X 满足李雅普诺夫条件(25),所以可以使用中心极限定理.14又因为999999111()(1)49.5100i i i i i iE X p =====-=∑∑∑ 999929911()(1)()16.665100100i i i i i B Var X ====-=∑∑ 所以该学生通过考试的可能性为99991149.56049.5(60)16.66516.665i i i i X p X p ==⎧⎫-⎪⎪-⎪⎪≥=≥⎨⎬⎪⎪⎪⎪⎩⎭∑∑1(2.5735)0.≈-Φ=. 由此看出:此学生通过考试的可能性很小,大约只有千分之五.2.4本章小结这一章从独随机变量之和的极限分布为正态分布的定理引入了中心极限定理的内容,可分为分独立同分布和不同分布两种情况下讨论随机变量的分布趋于正态分布的情况.由于极限定理的研究直接联系到大n 场合的二项分布的计算,所以我们也通过一些例子来讨论二项分别的近似计算问题.最后通过举出反例,以及在相同条件下比较大数定律与中心极限定理,说明了中心极限定理在近似计算中更精确.至于中心极限定理名称的得来是由于随机变量和的分布收敛于正态分布的极限定理的研究在长达两个世纪的时间内成了概率论研究的中心课题,因此也得到了中心极限定理的名称.第 15 页 共 23页3 中心极限定理在商业管理中的应用3.1 水房拥挤问题假设某高校有学生5000人,只有一个开水房,由于每天傍晚打开水的人较多,经常出现同学排长队的现象,为此校学生会特向学校后勤集团公司提议增设水龙头.假设后勤集团公司经过调查,发现每个学生在傍晚一般有1%的时间要占用一个水龙头,现有水龙头数量为45个,现在总务处遇到的问题是: (1)未新装水龙头前,拥挤的概率是多少?(2)需至少要装多少个水龙头,才能以95%以上的概率保证不拥挤?解:(1)设同一时刻,5000个学生中占用水龙头的人数为X ,则X ~B (5000,0.01)拥挤的概率是45500050000(45)1(045)10.010.99kk k k p p C ξξ-=>=-≤≤=-⨯⨯∑直接计算相当麻烦,我们利用隶莫佛-拉普拉斯定理.已知n=5000,p=0.01,q=0.99,.04.7,50==npq np故()().2389.01.771.004.750004.75045)450(=-Φ--Φ=⎪⎭⎫ ⎝⎛-Φ-⎪⎭⎫ ⎝⎛-Φ≈≤≤ξP从而 (45)10.23890.7611p ξ>=-=.怪不得同学们有不少的抱怨.拥挤的概率竟达到76.11%.(2)欲求m ,使得95.0)450(≥≤≤ξP即 95.004.750004.750≥⎪⎭⎫⎝⎛-Φ-⎪⎭⎫ ⎝⎛-Φm 由于 ()009.704.7500≈-Φ=⎪⎭⎫⎝⎛-Φ 即 95.004.750≥⎪⎭⎫ ⎝⎛-Φm16查标准正态分布表,得 645.104.750≥-m即 6.61≥m 故需要装62个水龙头. 问题的变形:(3)需至少安装多少个水龙头,才能以99%以上的概率保证不拥挤? 解:欲求m ,使得99.0)450(≥≤≤ξP即 99.004.750004.750≥⎪⎭⎫ ⎝⎛-Φ-⎪⎭⎫ ⎝⎛-Φm由于 ()009.704.7500≈-Φ=⎪⎭⎫⎝⎛-Φ.76即 99.004.750≥⎪⎭⎫⎝⎛-Φm查标准正态分布表,得325.204.750≥-m 即 4.66≥m 故需要装67个水龙头.(4)若条件中已有水龙头数量改为55个,其余的条件不变,1,2两问题结果如何?解:(1)5550(55)1()1(0.71)0.23897.04p ξ->=-Φ=-Φ=. (2) 同上.(5)若条件中的每个学生占用由1%提高到1.5%,其余的条件不变,则(1),(2)两问题结果如何?解:(1) 设同一时刻,5000个学生中占用水龙头的人数为X ,则X ~B (5000,0.015),已知n=5000,p=0.015,q=0.985,.60.8,75==npq np拥挤的概率是().149.3160.875451)45(≈-Φ-=⎪⎭⎫ ⎝⎛-Φ-=>ξP拥挤的概率竟达到100%. (2) 欲求m ,使得第 17 页 共 23页95.0)450(≥≤≤ξP即 95.060.875060.875≥⎪⎭⎫⎝⎛-Φ-⎪⎭⎫ ⎝⎛-Φm由于 060.8750≈⎪⎭⎫⎝⎛-Φ即 95.060.875≥⎪⎭⎫⎝⎛-Φm查标准正态分布表,得645.160.875≥-m 即 14.89≥m 故需要装90个水龙头.3.2设座问题甲、乙两戏院在竞争500名观众,假设每个观众完全随意地选择一个戏院,且观众之间选择戏院是彼此独立的,问每个戏院至少应该设多少个座位才能保证观众因缺少座位而离开的概率小于5%.解: 由于两个戏院的情况相同,故只需考虑甲戏院即可.设甲戏院需设m 个座位,设.5000,,3,2,1,0,1 =⎩⎨⎧=i i X i ,否则个观众选择甲电影院第则 .5000,,1,1,5.0)0()1( =====i X P X P i i 若用X 表示选择甲戏院的观众总数,则∑==50001i i X X问题化为求m 使05.0)(≤≥m X P即 .95.0)(≤≤m X P 因为 5.0)()(==i i X D X E 由隶莫佛-拉普拉斯中心极限定理95.055250)(≥⎪⎪⎭⎫⎝⎛-Φ≈≤m m X P18查标准正态分布表知 2501.64555m -≥, 从而解得269≥m ,即每个戏院至少应该设269个座位.3.3盈利问题盈利问题[5]:假设一家保险公司有10000个人参加保险,每人每年付12元保险费,在一年内一个人死亡的概率为0.006,死亡时,家属可向保险公司领得1000元,问(1)保险公司亏本的概率有多少?(2)保险公司一年的利润不少于40000元,60000元,80000元的概率各为多少? 解: 设X 为一年内死亡的人数,则)06.1,10000(~B X ,即由德莫佛-拉普拉斯中心极限定理(1)≈.0)77.7(1≈Φ-7809(2)设123,,A A A 分别表示一年的利润不少于40000元,60000元,80000元的事件,则1(){80}p A p X =≤⎭⎬⎫⎩⎨⎧⨯⨯⨯-≤⨯⨯⨯-=994.006.01000006.010********.006.01000006.010000X P9952.0)59.2(=Φ≈2(){60}p A p X =≤⎭⎬⎫⎩⎨⎧⨯⨯⨯-≤⨯⨯⨯-=994.006.01000006.010********.006.01000006.010000X P5.0)0(=Φ≈3(){40}p A p X =≤第 19 页 共 23页⎭⎬⎫⎩⎨⎧⨯⨯⨯-≤⨯⨯⨯-=994.006.01000006.010********.006.01000006.010000X P0048.0)59.2(1=Φ-≈3.4抽样检验问题抽样检验问题[6]:某药厂断言,该厂生产的某药品对医治一种疑难的血液病治愈率为0.8.医院检验员任取100个服用此药的病人,如果其中多于75个治愈,就接受这一断言,否则就拒绝这一断言.(1)若实际上此药对这种病的治愈是0.8,问接受这一断言的概率是多少?(2)若实际上此药对这种病的治愈率是0.7,问接受这一断言的概率是多少?解: 引入随机变量表示抽查的100个人中被治愈的人数,则(1) {}⎭⎬⎫⎩⎨⎧>=>∑=10017575i i X P X P1000.8751000.81000.80.21000.80.2i X p ⎧⎫-⨯-⨯⎪⎪≈>⎨⎬⨯⨯⨯⨯⎪⎪⎩⎭∑751000.811000.80.2-⨯⎛⎫≈-Φ ⎪⨯⨯⎝⎭()1.25=Φ0.8944=实际治愈率为0.8时,接受这一断言的概率为0.8944. (2)20实际治愈率为0.7时,接受这一断言的概率为0.1379.3.5供应问题假设某车间有200台车床独立地工作着,开工率各为0.6,开工时耗电各为1000瓦,问供电所至少要给该车间多少电力,才能使99.9%的概率保证这个车间不会因供电不足而影响生产?解: 设任一时刻工作着的机床数为X ,则X 服从参数为6.0,200==p n ,的二项分布,该时刻的耗电量为X 千瓦,如果用k 表示供电所给该车间的最少电力,则此题所求即为:k 取何值时,有{}999.04.06.02006.020004.06.02006.02000=⎪⎪⎭⎫⎝⎛⨯⨯⨯-Φ-⎪⎪⎭⎫ ⎝⎛⨯⨯⨯-Φ≈≤≤k kX P查表得解之得即只要给该车间141千瓦的电力,就能以99.9%的概率保证该车间不会因电力不足而影响生产.结 语概率论中讨论随机变量序列部分和的分布渐近于正态分布的一类定理.概率论中最重要的一类定理,有广泛的实际应用背景.在自然界与生产中,一些现象受到许多相互独立的随机因素的影响,如果每个因素所产生的影响都很微小时,总的影响可以看作是服从正态分布的.中心极限定理就是从数学上证明了这一现象.本文主要问题和研究方向,即系统的阐明两种分布的极限定理及进行详尽的证明,及对中心极限定理的简单应精品用,可以使读者轻松牢固的掌握中心极限定理.中心极限定理,是概率论中讨论随机变量和的分布以正态分布为极限的一组定理.这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量近似服从正态分布的条件.中心极限定理是刻画有些即使原来并不服从正态分布的一些独立的随机变量,但它们的总和渐进地服从正态分布.本文通过实例介绍了中心极限定理在商业管理中的应用,化抽象的理论概念为身边的实际例子.利于大家对这一定理的理解及对数理统计方法的掌握.这是我们数理统计教学中要重视与探索的问题之一.第21 页共23页参考文献[1]王梓坤.概率论基础及其应用[M].北京:科学出版社,1976.138-145.[2]卯诗松.程依明.概率论与数理统计教程[M].北京:高等教育出版社,2004.129-118.[3]刘光祖.概率论与应用数理统计[M].北京:高等教育出版社,2001.130.[4]盛骤.概率论与数理统计习题全解指南[M].第四版.浙江:浙江大学,1990.120.[5]孙荣恒.概率论和数理统计[M] .重庆:重庆大学出版社,2000.120-121.[6]盛聚.概率论与数理统计习题全解指南[M].二、三版.浙江:浙江大学,2002.121.[7]YS.Chow; H. Teieher.Probability Theory[M].1978.146-151.[8]周概容.概率论与数理统计[M].北京:高等教育出版社,1984.125-126.[9]朱学军.中心极限定理在管理中的简单应用问题研究[J].北京:高等教育出版社,1996.17-18.[10]魏宗舒.概率论与数理统计教程[M].北京:高等教育出版社.1983.63.[11] (美)E·勒克斯著.概率论与数理统计(引论)[A].北京:人民教育出版,1982.124-135.[12]范恩贵.中心极限定理在抽样推断中的应用[N].张家口师专学报,1994.5.23(自然科学版).[13]杨维权,邓集贤.概率统计教学参考书[M].北京:高等教育出版社,1996. 65-67.[14]姜炳麟.概率与数理统计习题解析[M].北京:北京邮电大学出版社,2003 156-172.[15] W.费勒,胡迪鹤.林向清译.概率论及其应用(上册)[M].北京:科学出版社,1980. 126-128.[16]丁正生.概率论与数理统计简明教程[M].北京:高等教育出版社,2005. 88-94.[17]盛骤,谢式千,潘承毅.概率论与数理统计[M].北京:高等教育出版社,1989. 140.附录22第 23 页 共 23页 林德贝格条件:设{}n X 是一个相互独立随机变量序列,它们具有有限的数学期望和方差:()i i E X μ=,2()i i Var X σ=,1,2,i =⋅⋅⋅.()n n B Y σ=, 其中n Y 是独立随机变量序列和.则只要对任意的0τ>,有22211lim ()()0i n ni i x B n i n x p x dx B μτμτ->→∞=-=∑⎰.。
中心极限定理应用
中心极限定理及其应用【摘要】中心极限定理的产生具有一定的客观背景,最常见的是德莫佛-拉普拉斯中心极限定理和林德贝格-勒维中心极限定理。
它们表明了当n 充分大时,方差存在的n 个独立同分布的随机变量和近似服从正态分布,在实际中的应用相当广泛。
本文讨论了中心极限定理的内容、应用与意义。
【关键词】:中心极限定理 正态分布 随机变量一、概述概率论与数理统计是研究随机现象、统计规律性的学科。
随机现象的规律性只有在相同条件下进行大量重复的实验才会呈现出来,而研究大量的随机现象常常采用极限的形式,由此导致了对极限定理的研究。
极限定理的内容很广泛,中心极限定理就是其中非常重要的一部分内容。
中心极限定理主要描述了在一定条件下,相互独立的随机变量序列X1、X2、…Xn 、…的部分和的分布律:当n →∞时的极限符合正态分布。
因此中心极限定理这个结论使正态分布在数理统计中具有很重要的地位,也使得中心极限定理有了广泛的应用。
二、定理及应用1、定理一(林德贝格—勒维定理)若ξ1,ξ2,…是一列独立同分布的随机变量,且E kξ=a,D kξ=σ2(σ2>0) ,k=1,2,…则有dt ex nnap xt nk kn ⎰∑∞--=∞→=≤-21221)(lim πσξ。
当n 充分大时,nnank kσξ∑=-1~N (0,1),∑=nk k1ξ~N (2,σn na )2、定理二(棣莫弗—拉普拉斯中心极限定理)在n 重伯努利试验中,事件A 在每次试验中出现的概率为错误!未找到引用源。
, 错误!未找到引用源。
为n 次试验中事件A 出现的次数,则dt ex npqnpp xt nn ⎰∞--∞→=≤-2221)(lim πμ其中1q p =-。
这个定理可以简单地说成二项分布渐近正态分布,因此当n 充分大时,可以利用该定理来计算二项分布的概率。
同分布下中心极限定理的简单应用独立同分布的中心极限定理可应用于求随机变量之和Sn落在某区间的概率和已知随机变量之和Sn取值的概率,求随机变量的个数。
论中心极限定理及应用
论中心极限定理及应用作者:王伟珠来源:《赤峰学院学报·自然科学版》 2013年第19期王伟珠(辽宁对外经贸学院基础课教研部,辽宁大连 116052)摘要:中心极限定理是De Moivre在18世纪首先提出的,定理在很一般的条件下证明了无论随机变量Xi(i=1,2…)服从什么分布,n个随机变量的和,当n→∞时的极限分布是正态分布.本文仅介绍其中两个最基本的结论并举例应用.关键词:中心极限定理;结论;应用中图分类号:O211.9 文献标识码:A 文章编号:1673-260X(2013)10-0001-02在实际问题中,许多随机现象是由大量相互独立的随机因素综合影响所形成,其中每一个因素在总的影响中所起的作用是微小的.这类随机变量一般都服从或近似服从正态分布.以一门大炮的射程为例,影响大炮的射程的随机因素包括:大炮炮身结构的制造导致的误差,炮弹及炮弹内炸药在质量上的误差,瞄准时的误差,受风速、风向的干扰而造成的误差等.其中每一种误差造成的影响在总的影响中所起的作用是微小的,并且可以看成是相互独立的,人们关心的是这众多误差因素对大炮射程所造成的总影响.因此需要讨论大量独立随机变量和的问题.中心极限定理回答了大量独立随机变量和的近似分布问题,其结论表明:当一个量受许多随机因素(主导因素除外)的共同影响而随机取值,则它的分布就近似服从正态分布.而正态分布有许多完美的理论,从而可以获得即实用又简单的统计分析结果.本文仅介绍其中两个最基本的结论,并通过举例加以应用.1 Lindeberg—Levy定理定理1(Lindeberg—Levy定理) 设X1,X2,…,Xn,…是独立同分布的随机变量序列,且注2:易见,棣莫弗—拉普拉斯中心极限定理就是Lindeberg—Levy中心极限定理的一个特殊情况.注3:中心极限定理存在的条件整理为如下几个关键词:独立、同分布、数学期望与方差存在;当随机变量序列满足中心极限定理时,难点是求解随机变量和函数的数学期望和方差,进而进行标准化就可以得到近似服从标准正态分布.3 应用举例例1 一盒同型号螺丝钉共有100个,已知该型号的螺丝钉的重量是一个随机变量,期望值是100g,标准差是10g,求一盒螺丝钉的重量超过10.2kg的概率..例3 某车间有200台车床,在生产期间由于需要检修、调换刀具、变换位置及调换工作等常需停车.设开工率为0.6,并设每台车床的工作是独立的,且在开工时需电力1千瓦.问应供应多少瓦电力就能以99.9%的概率保证该车间不会因供电不足而影响生产?解对每台车床的观察作为一次试验,每次试验观察一台车床在某时刻是否工作,工作的概率为0.6,共进行200次试验.用X表示在某时刻工作着的车床数,依题意,有例4 某市保险公司开办一年人身保险业务,被保险人每年需交付保险费160元,若一年内发生重大人身事故,其本人或家属可获2万元赔金.已知该市人员一年内发生重大人身事故的概率为0.005,现有5000人参加此项保险,问保险公司一年内从此项业务所得到的总收益在20万到40万元之间的概率是多少?例5 对于一个学校而言,来参加家长会的家长人数是一个随机变量,设一个学生无家长,1名家长,2名家长来参加会议的概率分别为0.05,0.8,0.15.若学校共有400名学生,设各学生参加会议的家长数相互独立,且服从同一分布,求参加会议的家长数X超过450的概率.解以Xk(k=1,2,…,400)记第k个学生来参加会议的家长数,则Xk的分布律为例6 设有1000人独立行动,每个人能够按时进入掩蔽体的概率为0.9.以95%概率估计,在一次行动中,至少有多少人能够进入掩蔽体.中心极限定理的应用很多,能解决更多的实际问题,有待于我们进一步的探讨.参考文献:〔1〕吴赣昌.概率论与数理统计(经管类·第三版).中国人民大学出版社,2009.〔2〕全国硕士研究生入学统一考试辅导用书编委会.数学考试参考书,高等教育出版社.。
大数定律与中心极限定理及其应用
重庆三峡学院毕业设计(论文)大数定律与中心极限定理及其应用分院数学与统计学院专业数学与应用数学(师范)班级 10数本1班学号201006034109姓名张永东指导教师陈飞翔 (讲师)2014年5月10日目录摘要. IAbstract. II1大数定律的应用 11.1 引言 11.2 预备知识 11.2.1 相关定义 11.2.2 切比雪夫不等式及其应用 11.3 几类重要的大数定律的应用 21.3.1 切比雪夫大数定律及其在测绘方面的应用 21.3.2 伯努利大数定律及其在重复事件方面的应用 31.3.3 辛钦大数定律及其在数学分析方面的应用 31.4 大数定律的意义 42 中心极限定理的应用 52.1 前言 52.2 几类重要的中心极限定理的应用 52.2.1 林德伯格定理及其在保险方面的应用 52.2.2 列维定理及其在极限求解方面的应用 62.2.3 棣莫弗-拉普拉斯定理及其在实际生活方面的应用 62.2.4 李雅普诺夫中心极限定理及其在具体分布方面的应用 93 大数定律和中心极限定理的比较应用 93.1 大数定律和中心极限定理的比较应用 9结论 10致谢 11参考文献 12大数定律与中心极限定理及其应用张永东(重庆三峡学院数学与统计学院数学与应用数学专业 2010级一班重庆万州 404000)摘要:大数定律和中心极限定理是概率论中很重要的定理,也是概率论与数理统计联系的关键所在,更是生活中不可缺少的一部分.较多文献给出了不同条件下存在的大数定律和中心极限定理,并利用大数定律和中心极限定理得到较多模型的收敛性.但对于它们的适用范围及在实际生活中的应用涉及较少.本文介绍了几种较为常见的大数定律和中心极限定理,并列举了它们在经济生活、数学分析、信息论等各个不同领域的应用.将理论具体化、将可行的结论用于具体的数学模型中,以使得枯燥的数学理论与实际相结合,使大家对大数定律与中心极限定理在实际生活中的应用价值有了更深的认识.关键词:大数定律;中心极限定理;期望;方差;应用Application of the law of large numbers and the centrallimit theoremZHANG yong-dong(Grade 2010, Mathematics and Applied Mathematics, School of Mathematics and Statistics ,Chongqing Three Gorges University, Wanzhou, Chongqing 404000 )Abstract:The law of large numbers and central limit theorem is very important in probability theory theorem,and it is not only the contact key of Probability theory and mathematical statistics,but also an indispensable part of life. Many literatures have given the dissimilar conditions of the law of large numbers and central limit theorem.Many literatures have given the dissimilar conditions of the law of large numbers,and have obtained the astringent using the law of large numbers and central limiting theorems.But here has no many results in practical life and applicable scope.Here I introduce several kinds of laws of large numbers and central limit theorems,then this paper enumerates some different applicants in economic life,mathematics and information theory and so on.It makes theory concretely,and considers some concrete mathematical model,and so makes mathematical theory reality,thus we can have deeper understanding on the law of large numbers and the central limiting theorem.Key words: The law of large numbers,Central limittheorem,Expectation, Variance, Application1大数定律的应用1.1 引言生产、生活及科学实验中的风险事故都具有不确定性,或者称为随机性.但是,任何事情的发生、发展都具有一定的客观规律.如果各种条件都能预知,则事物发生的结果也能予以正确地测定,此时虽然风险事故仍然存在,损失仍然会发生,但是,随机性将因此消失.如果有大量的事例可供考察研究,则这些未知的、不确定的力量将有趋于平衡的自然倾向,那些在个别事例中存在的随机风险将在大数中消失,这种结论就是概率论中的大数定律.它的结论也可叙述为:大量的随机现象由于偶然性相互抵消而呈现出某种必然的数量规律.1.2 预备知识1.2.1 相关定义在介绍大数定律之前,先介绍几个相关定义:定义1 设为概率空间上定义的随机变量序列(简称随即序列),若存在随即变数使对任意,恒有:或,则称随即序列{}依概率收敛于随机变量(也可以是一个常数),并用下面的符号表示:或定义2 设为一随即序列,数学期望存在,令,若,则称随机序列服从大数定律,或者说大数法则成立.定义3 设是分布函数序列,若存在一个非降函数,对于它的每一连续点,都有,,则称分布函数序列弱收敛于.定义4 设,分别是随机变量及的分布函数,若,则称依分布收敛于亦记为且有:(1)若则;(2)设c为常数,则的充要条件是.1.2.2 切比雪夫不等式及其应用切比雪夫不等式:设随机变量具有有限数学期望和方差,则对于任意正数,如下不等式成立,或有这个不等式可解释为:对任意给定的正常数,可以作出两个区间和,不等式表示,在一次试验中,随机变量的取值落在的概率小于等于.切比雪夫(Chebyshev)不等式的应用:(1)已知期望和方差,我们就可以利用切比雪夫不等式估计在期望的邻域的概率.(2)已知期望和方差,对确定的概率,利用切比雪夫不等式求出,从而得到所需估计区间的长度.(3)对n重伯努利试验,利用切比雪夫不等式可以确定试验次数.(4)它是推导大数定律和其他定理的依据.例1:已知正常男性成人血液中,每毫升白细胞数的平均值是7300,均方差是700,利用切比雪夫不等式估计每毫升血液含白细胞数在5200~9400之间的概率.解:设X表示每毫升血液中含白细胞个数,则,则而所以1.3 几类重要的大数定律的应用1.3.1 切比雪夫大数定律及其在测绘方面的应用切比雪夫大数定律:设独立随机变量序列的数学期望与方差都存在,并且方差是一致有上界的,即存在某一常数,使得,则对于任意的正数,有.推论1:设随机变量相互独立,且它们具有相同的分布及有限的数学期望和方差:,则对任意给定的正数,有.【1】此推论表明:n个相互独立的具有相同数学期望和方差的随机变量,当n很大时,它们的算术平均值几乎是一常数,这个常数就是它们的数学期望.例2:使用某仪器测量已知量,设n次独立得到的测量值为.如果仪器无系统误差,问n充分大时,是否可以用作为仪器误差的方差近似值?分析:用表示仪器误差的方差真值.如果,恒有,则n充分大时就可以看作是的近似值.解:依题意,可以将观察结果看作是相互独立具有相同分布的随机变量.则,仪器第次测量误差的数学期望设亦是相互独立的具有相同分布随机变量,在仪器无系统误差时有,即由切比雪夫大数定律,,有,即,有从而确定当时,随机变量依概率收敛于,即当充分大时,可以用作为仪器误差的方差近似值.1.3.2 伯努利大数定律及其在重复事件方面的应用伯努利大数定律(频率的稳定性):设是次独立试验中事件A发生的次数,p是事件A在每次试验中发生的概率,则对于任意正数ε,恒有或【2】表明:随着n的增大,事件A发生的频率与其概率p的偏差大于预先给定的精度的可能性愈来愈小,小到可以忽略不计.这就是频率稳定于概率的含义,或者说频率依概率收敛于概率.这个定理以严格的数学形式刻画了频率的稳定性,因此,在实际应用中,当试验次数很大时,便可以用时间发生的频率来代替事件的概率.伯努利大数定律提供了用频率来确定概率的理论依据.我们可通过多次重复一个试验,确定事件A在每次试验中出现的概率为.譬如,抛一枚硬币出现正面的概率p=0.5.若把这枚硬币连抛10次,则因为n较小,发生大偏差的可能性有时会大一些,有时会小一些.若把这枚硬币连抛n次,当n很大时,由切比雪夫不等式知:证明出现的概率与0.5的偏差大于预先给定的精度(若取精度=0.01)的可能性.当n=105时,大偏差放松的可能性小于.当n=106时,大偏差发生的可能性小于.可见试验次数愈多,偏差发生的可能性愈小.1.3.3 辛钦大数定律及其在数学分析方面的应用我们已经知道,一个随机变量的方差存在,则其数学期望必定存在;但反之不成立,即一个随机变量的数学期望存在,则其方差不一定存在.以上几个大数定律均假设随机变量序列的方差存在,以下的辛钦大数定律去掉了这一假设,仅设每个的数学期望存在,但同时要求为独立同分布的随机变量序列.伯努利大数定律仍然是辛钦大数定律的特例.辛钦大数定律:设为一独立同分布的随机变量序列,若的数学期望存在,则服从大数定律,即对任意的,有成立.辛钦大数定律提供了求随机变量数学期望的近似值的方法.设想对随机变量独立重复地观察次,第次观察值为,则应该是相互独立的,且它们的分布应该与的分布相同.所以,在存在的条件下,按照辛钦大数定律,当足够大时,可以把平均观察值作为的近似值.这样做法的一个优点是我们可以不必去管的分布究竟是怎样的,我们的目的只是寻找数学期望.事实上,用观察值的平均去作为随机变量的均值在实际生活中是常用的方法.譬如,用观察到的某地区5000个人的平均寿命作为该地区的人均寿命的近似值是合适的,这样做法的依据就是辛钦大数定律.概率论借助于数学分析,可以较好地描述、处理、解决随即现象的有关理论和应用问题.反之,用概率方法来解决数学分析中的一些问题,也是概率论的重要研究方向之一[3].数学分析中的有些问题,用数学分析的方法很难解决,但如果巧用概率论的方法,则变得比较容易处理了.再比如,许多极限的运算运数学分析的方法会很麻烦,但是运用概率论中相关的知识或许会达到事半功倍的效果.例3:假设,求其极限.解:假设随机变量在[0,1]上有均匀分布,而且相互独立,有易见由独立同分布,可见独立同分布.根据辛钦大数定律知从而1.4 大数定律的意义概率论与数理统计是研究随即现象的统计规律的科学,而随机现象的统计规律性只有在相同条件下进行大量重复试验或观察才呈现出来.大数定律是概率论中的重要内容,其目的是考察随机序列的稳定性.从概率的统计定义中可以看出:一个事件发生的概率具有稳定性,即随着试验次数的增多,事件的频率逐渐稳定在某个常数附近.人们在实践中观察其他一些随机现象时,也常常会发现大量随机个体的平均效果的稳定性.这就是说,无论个别随机个体以及它们在随机试验过程中的个别特征如何,大量随机个体的平均效果与每一个体的特征无关,且不再是随机的.深入考虑后,大数定律就是要研究在什么条件下具有稳定性的问题,同时大数定律是保险财政稳定性重要的理论基础,大数定律在概率论的所有部分中都有着应用.除此之外,许多学者利用概率论思想研究了大数定律在其他相关领域的应用.例如统计方面的应用,在信息论中的应用,在分析,数论等方面的应用.2 中心极限定理的应用2.1 前言大数定律讨论的是多个随机变量的平均的渐近性质,但没有涉及到随机变量的分布的问题.而概率论与数理统计中,正态分布是一种最常见而又最重要的分布.在实际应用中,有很多随机变量都服从正态分布.在实际应用中,有很多随机变量都服从正态分布,即使原来并不服从正态分布的一些独立的随机变量,它们的和分布也近似服从正态分布,自然要提出这样的问题:为什么正态分布如此广泛地存在,从而在概率论中占有如此重要的地位?应如何解释大量随机现象的这一客观规律性呢?事实上,这正是客观实际的反映,中心极限定理就是概率论中论证随机变量和的极限分布为正态分布的定理总称.概率论中有关论证独立随机变量的和的极限分布是正态分布的一系列定理称为中心极限定理.2.2 几类重要的中心极限定理的应用2.2.1 林德伯格定理及其在保险方面的应用林德伯格定理:设独立随机变量满足林德伯格条件,对于任意的正数,有.其中是随机变量的概率密度,则当时,我们有即其中是任何实数.林德伯格定理可以解释如下:假如被研究的随机变量可以表示为大量独立随机变量的和,其中每一个随机变量对于总和只起微小的作用,则可以认为这个随机变量实际上是服从正态分布的.例如,进行观测时,不可避免地有许多引起观测误差的随机因素影响着我们的观测结果,其中有些误差是由测量仪器的情况引起的,这些情况可以在温室、大气压力或其他因素的影响之下改变着;有些误差是属于观测站个人的误差,这些误差大多数是由于视觉或听觉引起的等等.这些因素中的每一个都可能使观测的结果产生很小的误差,然而由于所有这些误差共同影响着观测结果,于是我们得到的是一个“总的误差”.所以,实际观测的到的误差可以看作是一个随机变量,它是很多数值微小的独立随机变量的总和,按林德伯格定理,这个随机变量应该服从正态分布.此外,还可以举出很多类似的例子,这里具体举出一个例子[4].例4:某保险公司有2500个人参加保险,每人每年付1200元保险费,在一年内一个人死亡的概率为0.002,死亡时某家属可向保险公司领得20万元.问:(1)保险公司亏本的概率多大?(2)保险公司一年的利润不少于100万元,200万元的概率各位多大?解:(1)设X为一年内死亡的人数,则X~B(2500,0.002),,P(亏本)=保险公司亏本的概率为0.00007,几乎为零.(2) P(利润)P(利润)以上结果说明保险公司几乎不可能亏本,不过要记住,关键之处是对死亡率估计必须正确,如果所估计死亡率比实际低,甚至低得多,那么情况就会不同.2.2.2 列维定理及其在极限求解方面的应用列维定理:设随机变量相互独立,服从同一分布,且有有限的数学期望和方差,则随机变量的分布函数满足如下极限式,其中是任何实数.定理的应用:对于独立的随机变量序列,不管服从什么分布,只要他们是分布,且有有限的数学期望和方差,那么,当充分大时,这些随机变量之和近似地服从正态分布.大数定律和中心极限定理是概率论中的重要理论,是分析中的极限理论在概率论中的综合运用,同时极限定理中的一些结果也为分析中的许多极限问题提供了有力工具[5].例5:求极限解引入随机变量(参数为的泊松分布),,且相互独立,由泊松分布的再生性知,,所以P{}=,而E()=D{}=n,P{n}=P{}即:=P{}令n,由中心极限定理可知:=P{}==2.2.3 棣莫弗-拉普拉斯定理及其在实际生活方面的应用棣莫弗-拉普拉斯中心极限定理:设在独立试验序列中,事件A在各次试验中发生的概率为,随机变量表示事件A在次试验中发生的次数,则有,其中是任何实数.棣莫弗-拉普拉斯定理是概率论历史上的第一个中心极限定理,它是专门针对二项分布的,因此称为“二项分布的正态近似”.在之前概率论的学习中有“二项分布的泊松近似”,两者相比,一般在较小的时候,用泊松分布近似较好,而在和时,用正态分布近似较好.二项分布的极限分布是正态分布,即如果则一般地,如果,则说明:这个公式给出了较大时二项分布的概率计算方法.在给出棣莫弗-拉普拉斯定理应用之前,先说明两点:(1) 因为二项分布是离散分布,而正态分布是连续分布,所以用正态分布作为二项分布的近似计算中,作为修正可以提高精度.若均为整数,一般先作如下修正后再用正态近似.(2) 若记,则由棣莫弗—拉普拉斯极限定理给出的近似式,可用来解决三类计算问题:(1)已知求;(2)已知求;(3)已知求.以下我们就分这三类情况给出一些具体的例子.1 给定,求.例6:一复杂系统由100个相互独立工作的部件组成,每个不见正常工作的概率为0.9.一直真个系统中至少有85个不见正常工作,系统工作才正常.试求系统正常工作的概率.解:记=100,为100个部件中正常工作的部件数,则~b(100,0.9);;所求概率为② 已知,求.例7:某车间有同型号的机床200台,在一小时内每台机床有70%的时间是工作.假定各机床工作是相互独立的,工作时每台机床要消耗电能15kW.问至少要多少电能,才可以有95%的可能性保证此车间正常生产.解:记=200,为200台机床中同时工作的机床数,则:~b(200,0.7),.因为台机床同时工作需消耗15(kW)电能,所以设供电数为(kW),则正常生产为,由题设,其中查正态分布表得从中解得(kW),即此车间每小时至少需要2252(kW)电能,才有95%的可能性保证此车间正常生产.③ 已知,求.例8:某调查公司受委托,调查某电视节目在S市的收视率,调查公司将所有调查对象中收看此节目的频率作为的估计.现在要保证有90%的把握,使得调查所得收视率与真实收视率之间的差异不大于5%.问至少要调查多少对象?解:设共调查n个对象,记=0,当第i个调查对象收看此电视节目;=1,当第i个调查对象不看此电视节目.则独立同分布,且(=1)=,(=0)=,又记个被调查对象中,收看此电视节目的人数为,则有由大数定律,当很大时,频率与概率很接近,即用频率作为的估计是合适的.根据题意有,所以,查正态分布表得,从中解得:np(1-p)=p(1-p)×1082.41又因为,所以,即至少调查271个对象.例9:某单位有200台电话分机,每台有5%的时间要使用外线通话,假定每台分机是否使用外线是相互独立的,问该单位总机要安装多少条外线,才能以90%以上的概率保证分机用外线时不等待?解:设有部分机同时使用外线,则有,其中,,,设有条外线.由题意有由棣莫弗-拉普拉斯定理有查表得,故应满足条件.即,取,即至少要安装14条外线.2.2.4 李雅普诺夫中心极限定理及其在具体分布方面的应用设为独立随即变量序列,若存在,满足则对任意的,有其中,,例10:一份考卷由99个题目组成,并按由易到难顺序排列.某学生答对第1题的概率为0.99;答对第2题的概率为0.98;一般地,他答对第题的概率为1-,.假如该学生回答各题目是相互独立的,并且要正确回答其中60个题目以上(包括60个)才算通过考试.试计算该学生通过考试的可能性多大?解:设若学生答对第题,则;若学生答错第题,则.于是Xi相互独立,且服从不同的二点分布:,,.而我们要求的是,为使用中心极限定理,我们可以设想从开始的随机变量都与同分布,且相互独立.下面我们用来验证随机变量序列满足李雅普诺夫条件,因为,于是(n),即满足李雅普诺夫条件,所以可以使用中心极限定理.又因为,所以该学生通过考试的可能性为由此看出:此学生通过考试的可能性很小,大约只有千分之五.3 大数定律和中心极限定理的比较应用3.1 大数定律和中心极限定理的比较应用例11:现有一大批种子,其中良种占,今在其中任选6000粒,试分别用切比雪夫不等式估计和用中心极限定理计算在这些种子良种所占的比例与之差小于1%的概率是多少?解:(1)设取出的种子中的良种粒数为,则于是要估计的规律为,相当于在切比雪夫不等式中取,于是由题意得即用切比雪夫不等式估计此概率不小于0.7685.(2)由拉普拉斯中心极限定理,对于二项分布可用正态分布近似,于是所求概率为即用中心极限定理估计此概率不小于0.9625.从本例看出:用切比雪夫不等式只能得出来要求的概率不小于0.7685,而用中心极限定理可得出要求的概率近似等于0.9625.从而知道由切比雪夫不等式得到的下界是较低的.但由于它的要求比较低,只要知道X的期望和方差,因而在理论上有许多运用.当然,两者的比较还有在许多方面的应用,这里就不做详细的介绍了,只起到一个引导的作用.结论随着社会的飞速发展,市场竞争日趋激烈,决策者必须综合考察以往的信息及现状从而作出综合判断,决策概率分析这门学科越来越显示其重要性.利用数学方法,定量地对医学问题进行相关分析,使其结论具有可信度,更有利于促进对病人的对症施治等.本文详细介绍了大数定律和中心极限定理及其在生活各方面的应用.通过这些详细的讲述,可以看到这两个概率公式的应用是多方面的.灵活使用这两个概率公式会给我们的解题带来很大方便,而这两个概率定理的应用范围十分广泛,成为我们解决更复杂问题的有效工具.本次毕业论文的撰写,使我扩大了知识范围,锻炼了观察和思维能力,进一步提高了动手和实践能力.理论联系实际,使毕业论文中所应用的理论知识有了更可靠的依据.但由于研究周期较短,本研究还有很多不足之处,本文只是举了几个例子来说明它们的应用,事实上它们的应用远不止于此,还可以用来解决投资、保险、工程等一系列不确定的问题.另外还有什么样的问题应该用大数定律解决呢?什么样的问题应该用中心极限定理?什么样的问题要综合两个定理才能够解决?本文都没有得出明确的方法和分类,这些都是今后有待进一步深入研究的问题.总之这两大定理的正确应用有助于进一步研究多个随机过程的试验中目标事件及其条件下各诱发事件的概率,有助于把握随机事件间的相互影响关系,为生产实践提供更有价值的决策信息,成为我们解决问题的有效工具.致谢大学四年,生活其实很简单,只是一些读书、写字、考试和娱乐的周而复始.如果把这种单调的生活看作一场场的巡回演出,那么我只是一个安静的演员,无论台下有多少观众,即使是只说给自己听,在他谢幕时也总要感激一些人,是那些人帮助他走上舞台,成功或者不那么成功地“演出”.感谢我的导师,陈飞翔老师.我不是您最出色的学生,而您却是我最尊敬的老师.陈老师为人随和,治学严谨细心,在闲聊中他总是能像知心朋友一样鼓励你.陈老师工作繁忙,还要带我们组的毕业论文设计.在我写毕业论文的每个阶段,陈老师倾注了大量的心血,从选题到开题报告,从论文目录到一遍遍地指出初稿中的具体问题,陈老师在百忙之中多次审阅,对细节进行修改,并为本文的撰写提供了许多中肯而且宝贵的意见,在此我表示衷心感谢.当然也要感谢曾经教育和帮助过我的所有老师,我的点滴成就都来自你们,感谢四年来对我的栽培和教育.感谢我的室友,同窗好友,整个毕业论文的写作期间和我密切合作的同学,和曾经在各个方面给予我帮助的伙伴们,友谊情深,勿需多言.最后,我要感谢,感谢培育我的重庆三峡学院,学校浓厚的学术气氛,舒适的学习环境我将终身难忘!再次感谢我的家人、老师和那些永远也不能忘记的朋友,你们的支持与情感,是我永远的财富.参考文献[1]沈恒范编著.概率论与数理统计教程[M].高等教育出版社,2010:111-115.[2]茆诗松,程依明等编著.概率论与数理统计教程[M].高等教育出版社,2009:133-154.[3]李少辅等.概率论与数理统计[M].河南大学出版社,1996:88-99.。
浅谈中心极限定理及其应用 论文
浅谈中心极限定理及其应用李月 20091103558数学科学学院 信息与计算科学 09信息一班指导老师 韩文忠摘要: 概率论中讨论随机变量序列部分和的分布渐近于正态分布的一类定理。
在自然界与生产中,一些现象受到许多相互独立的随机因素的影响,如果每个因素所产生的影响都很微小时,总的影响可以看作是服从正态分布的。
中心极限定理就是从数学上证明了这一现象。
本文主要叙述中心极限定理在现实中的应用。
关键字:中心极限定理 随机变量 正态分布1.定理一(独立同分布的中心极限定理) 设随机变量1X ,2X ,…,n X ,…相互独立,服从同一分布,且具有数学期望和方差,μ=)(k X E ,)(k X D =2σ>0(k = 3,2,1),则随机变量之和∑=nk k X 1的标准化变量n Y =∑∑∑===-nk nk k nk k kX D X E X111)()(=μμn n Xnk K∑=-1的分布函数)(x F n 对于任意x 满足)(lim x F n =)(lim x F n n ∞→=xn n xP nk k≤-∑=μμ1{lim }=dt etx2221-∞-⎰π= ).(x Φ这就是说,均值为μ,方差为02>σ 的独立同分布的随机变量1X ,2X ,…,n X 之和∑=nk k X 1的标准化变量,当n 充分大时,有μμn n Xnk n-∑=1~)1,0(N1.1:一加法器同时接收20个噪声电压k V (k = 3,2,1,)20,设它们是相互独立的随机变量,且都在区间(0,10)上服从均匀分布,记∑==201k kV V ,求}105{>V P 的近似值。
解:易知12/100)(,5)(==k k V D V E (k = 3,2,1,)20,由定理一,随机变量 2012100201∑==K kVZ =2012100520⨯-V 近似服从正态分布)1,0(N ,于是}105{>V P ={P 2012100520⨯-V }2012100520105⨯->=2012100520⨯-V }387.0>=-1{P 2012100520⨯-V }387.0≤=-1.384.0)387.0(1212387.02=Φ-=-∞-⎰dt etπ即有34.0}105{≈>V P2.(李雅谱诺夫(Lyapunov )定理)设随机变量1X ,2X ,…,n X ,…相互独立,它们具有数学期望和方差,0)(,)(2>==KK k X D X E σμ,2,1 =k 记.121∑∑===nk kn k k σμ若存在正数δ,使得当∞→n 时,,0}{1122→-∑=++nk kk nX E Bδδμ则随机变量之和∑=nk k X 1的标准化变量nn k nk kknk k n k n k k kn B XXX D X E XZ ∑∑∑∑∑=====-=-=11111)()(的分布函数}{lim )(lim 11x B XP x F nnk nk kkn n n ≤-=∑∑==∞→∞→μ=dt etx2221-∞-⎰π= ).(x Φ此定理表明,在定理的条件下,随机变量nnk nk kkn B XXZ ∑∑==-=11当n 很大时,近似的服从正态分布),1,0(N 由此,当n 很大,∑=nk kX1∑=+=nk kn n Z B 1μ近似的服从正态分布),(12∑=nk n k B N μ.这就是说,无论各个随机变量)2,1( =k X k 服从什么分布,只要满足定理的条件,那么它们的和∑=nk kX1当n 很大时就近似地服从正态分布,在很多问题中所考虑的随机变量可以表示成很多个独立的随机变量之和。
大数定律与中心极限定理的关系及其应用
论文题目:大数定律与中心极限定理的关系及其应用摘要:本文通过对概率论的经典定理——大数定律与中心极限定理在独立同分布和不同分布两种情况下的结论作了比较系统的阐述,揭示了随机现象最根本的性质——平均结果的稳定性.经过对中心极限定理的讨论,给出了独立随机变量之和的分布可以用正态分布来表示理论依据.关于大数定律方面,较全面地分析和叙述了几种最常用的大数定律.同样中心极限定理的内容也从独立同分布与独立不同分布两个角度来进行讨论;另外,叙述了各种大数定律以及中心极限定理各自之间,大数定律与中心极限定理之间的关系.同时通过举出很多相关的反例说明二者的关系.最后给出了一些简便的大数定律与中心极限定理在数理统计、误差、彩票学、近似计算、保险业及数学分析等几个方面的应用,来进一步地阐明了大数定律与中心极限定理在各分支学科中的重要作用和应用价值.关键词:随机变量序列;大数定律;中心极限定理;应用ITitle:Law of large numbers and the relationship between the centrallimit theorem and its applicationAbstract: Based on the probability of a classic theorem : the law of large numbers central limit theorem in the independent distribution ; with the different distribution of both cases, it made more systematic exposition, and revealed the phenomenon of the random nature of the most fundamental an average of the results of the Stability . Trough the central limit theorem discussion it will give out the random variables and the distribution of the normal distribution .About the law of large numbers, there are more comprehensive analysis and described several of the most commonly used on it. The content of the same central limit theorem also discussed the independent distribution and independent distribution of the two different perspectives. Also, it will discussed the relationship between the variety of narrative and the law of large numbers between their respective central limit theorem, and that of the law of large numbers and the central limit theorem. At the same time, it demonstrated the relationship between the two aspects through lots of anti-related examples. Finally ,it gave out several aspects of application of a number of simple law of large numbers and the central limit theorem in mathematical statistics, error, lottery school, the approximate calculation, and the insurance industry and mathematical analysis, to further clarify the law of large numbers and the central limit theorem in all branches of the important role and value.Keywords: Random variables ; Law of large numbers; Central limit theorem; ApplicationII目录摘要 (I)Abstract (II)第1章引言 (1)第2章大数定律及其证明 (2)2.1 几个相关定义 (2)2.2 大数定律及其证明 (4)第3章中心极限定理 (8)3.1 中心极限定理的提法 (8)第4章大数定律与中心极限定理的关系 (11)4.1 服从大数定律, 但不服从中心极限定理 (11)4.2 服从中心极限定理, 但不服从大数定律 (12)4.3 大数定律与中心极限定理都不服从 (13)4.4 大数定律、中心极限定理都服从 (13)第5章应用 (14)5.1“概率”及“数学期望”的确切定义 (14)5.2 解释测量(随机) 误差 (14)5.3 在数学分析中的应用 (15)5.4 在计算精确的近似概率方面的应用 (16)5.5 在彩票和保险业的应用 (17)结语 (20)参考文献 (21)致谢 (22)附录 (23)IIIIV第1章引言概率论与数理统计是研究随机现象的统计规律的科学,而随机现象的统计规律性只有在相同条件下进行大量重复试验或观察才呈现出来. 从概率的统计定义中可以看出:一个事件发生的频率具有稳定性,即随着试验次数的增多,事件的频率逐渐稳定在某个常数附近. 人们在实践中观察其他一些随机现象时,也常常会发现大量随机个体的平均效果的稳定性. 这就是说,无论个别随机个体以及它们在试验进行过程中的个别特征如何,大量随机个体的平均效果与每一个体的特征无关,且不再是随机的. 深入考虑后,人们会提出这样的问题:稳定性的确切含义是什么? 在什么条件下具有稳定性? 这就是大数定律要研究的问题.众所周知,中心极限定理是概率论中最重要、最基本的一个定理.中心极限定理揭示了离散型随机变量与连续型随机变量之间的内在联系, 为用连续型随机变量的分布,特别是标准正态分布对离散型随机变量进行概率计算提供了理论基础.基于中心极限定理的概率统计方法在生活中的应用,本文利用中心极限定理,分析了保险业和近似计算中的应用.第 1 页共27页第 2 页 共 27 页第2章 大数定律及其证明2.1 几个相关定义定义1[1] 设n (1,2,)n ξ= 为概率空间(,,)F P Ω上定义的随机变量序列(简称随机序列),若存在随机变数ξ,使对任意0ε>,恒有:l i m {}0nn p ξξε→∞-≥=或lim {}1n n p ξξε→∞-≤=, 则称随机序列{}n ξ概率收敛于随机变量ξ(ξ也可以是一个常数),并用下面的符号表示:lim ()n n p ξξ→∞=或pn ξξ−−→.定义 2[2][6][8] 设{}n ξ为随机变量序列, 数学期望n E ξ存在()1n ≥,如果对任意的0ε>.恒有:1111lim (())1nniin i i p E nnξξε→∞==-<=∑∑, 则称随机变量序列{}n ξ服从大数定律.定义 3 设{}n ξ为随机变量序列, 如果存在常数序列{}n a .对任意的0ε>.恒有:11lim ()1nin n i p a nξε→∞=-<=∑, 则称随机变量序列{}n ξ服从大数定律.注:定义2和定义3两种大数定律定义的讨论所谓大数定律, 它是揭示大量随机现象的平均结果稳定于平均值的极限理论.而大量随机现象即{}n ξ的平均结果是11nii n ξ=∑(n 充分大),其平均值是11()nii E nξ=∑.因此, 从这一角度来考虑,定义2是恰当的.定义3与定义2的不同点在于它并不要求随机变量n ξ的期望n E ξ存在(1n ≥),只要存在常数序列{}n a ,使对任意的0ε>.恒有11l i m ()1ni n n i pa nξε→∞=-<=∑即可.为了弄清这两种定义的异同,我们必须讨论数列{}n a 与数列{11()nii E nξ=∑}之间的关系.首先,当n E ξ(1n ≥)存在时,我们不难证明:0δ∀>,11lim (())0nn in i p a E nξδ→∞=-≥=∑这个结果表明在n E ξ(1n ≥)异存在时,只需取11()nn ii a E nξ==∑,(1n ≥).此时, 定义2 与定义第 3 页 共 27页3 是等价的.其次,当n E ξ(1n ≥)不存在时, 由定义2知{}n ξ不服从大数定律, 而此时, 存在常数列{}n a 使定义3仍然成立.综合上述定义2与定义3不是等价的.定义3不仅在形式上而且在内涵上比定义2更广泛.定义 4[3] 设{()}n F x 是分布函数序列,若存在一个非将函数()F x ,对于它的每一连续点x ,都有li m ()()n n F x F x →∞=,()()w n F x F x −−→,则称分布函数序列{()}n F x 弱收敛于()F x .定义5 设n ()(1,2,)F x n = , ()F x 分别是随机变量(1,2,)n n ξ= 及ξ的分布函数,若()()wn F x F x −−→,则称{}n ξ依分布收敛于ξ,亦记为Ln ξξ−−→,且有: (1)若p n ξξ−−→,则Ln ξξ−−→; (2)设c 为常数,则p n c ξ−−→的充要条件是Ln c ξ−−→. 逆极限定理:设特征函数列{()}n f x 收敛于某一函数()f t ,且()f t 在0t =时连续,则相应的分布函数列{()}n F x 弱收敛于某一分布函数()F x ,而且()f t 是()F x 的特征函数.车比雪夫不等式[4]:设ξ是一个随机变量,它的数学期望为a ,方差为2σ,则对任意的正常数ε恒有:22{},p a σξεε-≥≤(2-1)或有22{}1p a σξεε-<≥- (2-2)称(2-1)式或(2-2)式为车比雪夫不等式.以下就连续型随机变量来证明这个不等式.证 设的密度函数为()f x ,则有222()()()()()x EX x EX DX x EX f x dx x EX f x dx f x dx εεε+∞-∞-≥-≥=-≥-≥⎰⎰⎰{}22()x EX f x dx P x E X εεεε-≥==-≥⎰,第 4 页 共 27 页于是 {}2D XP x E X εε-≥≤这个不等式可解释为:对任意给定的正常数ε,可以作为两个区间(,)a ε-∞-和(,)a ε++∞.(1)式表示,在一次试验中,随机变量ξ的取值落在(,)(,)a a εε-∞-⋃++∞的概率小于等于22σε.不等式说明D X 越小,则X 的取值越集中在E X 附近.这进一步说明了方差是反映随机变量取值的离散程度的.2.2 大数定律及其证明大数定律形式有很多,我们仅介绍几种最常用的大数定律. 定理1[5][6] (车比雪夫大数定律)设随机变量12n ,,,,ξξξ 相互独立,它们的数学期望依次为12n ,,,,a a a ,方差依次为22212,,,,n σσσ 而且存在正常数k ,使得对一切1,2,i = 有2i k σ<,则对任意给定的正常数ε,恒有1111lim {}1nniin i i p annξε→∞==-<=∑∑证 设11nii nξξ==∑,则ξ的数学期望和方差分别为: 111111nnni ii i i i E E E a nn nξξξ===⎛⎫===⎪⎝⎭∑∑∑,222111111n nni iii i i D D D n n nξξξσ===⎛⎫===⎪⎝⎭∑∑∑由车比雪夫不等式,对任意给定的正数ε,有11111{}nni i i i p a nnξε==≥-<∑∑=22221222{}1111ni i D p E nk n k n n σξξξεεεεε=-<≥-=->-=-∑即 211111{}1nniii i p a k n nnξεε==≥-<=-∑∑.对不等式取极限,则得1111lim {}1nniin i i p a nnξε→∞==-<=∑∑车比雪夫大数定律表明,在一定条件下,当n 充分大时,n 个随机变量的算术平均值11nii nξ=∑偏离其数学期望的可能性很小.这也正是用一系列测量值的平均值来近似代替真值的做法的原则.第 5 页 共 27页推论 1 设随机变量12n ,,,,ξξξ 相互独立,且它们具有相同的分布及有限的数学期望和方差:E a ξ=,2(1,2,)D i ξσ== ,则对任意给定的正数ε,有11lim {}1nin i p a nξε→∞=-<=∑.此推论证明:n 个相互独立的具有相同数学期望和方差的随机变量,当n 很大时,它们的算术平均值几乎是一个常数,这个常数就是它们的数学期望.定理 2[7](辛钦大数定律)设12n ,,,,ξξξ 是相互独立的随机变量,而且有相同是的分布,具有有限的数学期望k ,(1,2,)E a k ξ== ,则对任意给定的0ε>,有11lim {}1nkn k p a nξε→∞=-<=∑.注:定理2中条件比定理1中的条件要宽,在定理1中要求方差有限,而定理2不需要这个条件.辛钦大数定律说明独立同分布的随机变量的算术平均值依概率收敛于它的数学期望值,它为在实际应用中用算术平均值估计数学期望提供了理论依据.证 因为12n ,,,,ξξξ 是具有相同分布的随机变量序列,故它们有相同的特征函数.设它们的特征函数为()f t ,由于k E ξ存在,故()f t 有展开式:'()(0)(0)()1()f t f f t ti a t οο=++=++,其中()t ο表示关于t 的高阶无穷小量. 再由独立性知,11nk k n ξ=∑的特征函数为:1nnt t t f ia n n n ο⎡⎤⎡⎤⎛⎫⎛⎫=++ ⎪ ⎪⎢⎥⎢⎥⎝⎭⎝⎭⎣⎦⎣⎦.对任意取定的数t ,有lim lim 1n niat n n t t t f ia e n n n ο→∞→∞⎡⎤⎡⎤⎛⎫⎛⎫=++= ⎪ ⎪⎢⎥⎢⎥⎝⎭⎝⎭⎣⎦⎣⎦.而iat e 是连续函数,且是单点分布的特征函数,由逆极限定理知:11nk k nξ=∑的分布函数弱收敛于()F x .其中,1,(),0,x a F x x a>⎧=⎨=⎩因此,11,nLkk a nξ=−−→∑由(2)式知:11nPkk anξ=−−→∑.定理 3[8](贝努利大数定律)设n μ是n 次独立试验中事件A 发生的次数, p 是事件A 在每次试验中发生的概率,则对任意给定的正数ε,有lim {}1nn p p nμε→∞-<= 或 lim {}0nn p p nμε→∞-≥=第 6 页 共 27 页证 令 0,1,2,1n k A Y k k A ⎧==⎨⎩ 第试验不发生,,第试验发生.显然12n n Y Y Y μ=+++ ,由于各次试验是独立的,从而12,,,,n Y Y Y 相互独立,又k Y 服从参数为P 的两点分布,所以(),()(1),(1,2,k k E Y P D Y P Pk ==-= . 由定理1有 lim {}1nn p p nμε→∞-<=.此定理表明:当n 很大时, n 重贝努利试验中事件A 发生的频率几乎等于事件A 在每次试验中发生的概率,这个定理以严格的数学形式刻画了频率的稳定性,因此,在实际应用中,当试验次数很大时,便可以用事件发生的频率来代替事件的概率.证 作一次观察时n μ是定值, 作多次观察时n μ是随机变量,而且(,),n B n p μ 因此:n E np μ=,n D npq μ=,()n E n pμ=,()n D n pq n μ=.在车比雪夫不等式中,取 n n ξμ=,则a p =,2pq n σ=,于是对任意给定的正数ε,有21{}11()npq p p n nn μεε≥-<≥-→→∞,因而lim {}1nn p p nμε→∞-<=.定理 4 (泊松大数定律)设12n ,,,,ξξξ 是相互独立的随机变量, P{1}n n P ξ==, P{0}n n q ξ== (其中n P 1n q =-) ,则{}n ξ服从大数定律.证 由定理所设可得:11E()nn ini P P nξ===∑,2221111111()()24nnnn n n iiii i i P q D D P qnnnn ξξ===+⎛⎫==≤= ⎪⎝⎭∑∑∑. 由车比雪夫不等式得,对任意0ε>,有22()10{}4n n n D P P n ξξεεε≤-≥≤≤.两边取极限,得lim {}0n n n P P ξε→∞-≥=.泊松大数定律是贝努利大数定律的推广, 贝努利大数定律证明了事件在完全相同条件下重复进行的随机试验中频率的稳定性;而泊松定理表明,当独立进行的随机试验的条件变化时, 频率仍然具有稳定性:随着n 的无限增大,在n 次独立试验中,事件 A 的频率趋于稳定在各次试验中事件A 出现概率的算术平均值附近.定理5[9][10] 马尔可夫(Marrkov) 大数定律)设{}k ξ是随机变量序列,若211lim()0nk n k D nξ→∞==∑,则对任意>0ε,均有1111lim {}1nnkkn k k p E nnξξε→∞==-<=∑∑,即{}k ξ服从大数定律.证 车比雪夫不等式得212111()111{}1nk nnk kkk k D np E nnξξξεε===≥-<≥-∑∑∑,取极限得:1111lim {}1nnkkn k k p E nnξξε→∞==-<=∑∑注:车比雪夫大数定律可又马尔可夫大数定律推出,更重要的是马尔可夫大数定律已经没有任何关于独立性的规定.第3章 中心极限定理直观上,如果一随机变量决定于大量(乃至无穷多个)随机.因素的总合,其中每个随机因素的单独作用微不足道,而且各因素的作用相对均匀,那么它就服从(或近似地服从)正态分布,下面我们将按严格的数学形式来表述这一直观.3.1 中心极限定理的提法定理 6[3][11](林德贝格——列维定理(Lindeberg-Levy)中心极限定理)设随机变量12,,ξξ 是一列独立同分布的随机变量,并且具有数学期望k E a ξ=和方差22(0),1,2,k D k ξσσ=>= ,则对任意实数x ,有22lim ()t nkx n na P x edt x ξ--∞→∞⎛⎫-⎪⎪<==Φ ⎪ ⎪⎝⎭∑ (3-1)证 设k a ξ-的特征函数为()t ϕ,1nknk na ξ=-=∑∑的特征函数为nϕ⎡⎤⎢⎥⎣⎦又因为()()20,k k E a D a ξξσ-=-=,所以'''2(0)0,(0)ϕϕσ==- 于是特征函数()t ϕ有展开式:2'''22221()()(0)(0)()1()22tt t t t t t ϕϕϕϕοσο=+++=-+,从而对任意固定的t ,有22221(),2nntt t t e n n n ϕο-⎡⎤⎡⎤=-+→→∞⎢⎥⎢⎥⎣⎦⎣⎦ 而22te-是()0,1N 分布的特征函数,因此由特征函数的连续性定理即知(3-1)成立,定理得证.定理6又称独立同分布的中心极限定理,它表达了正态分布在概率论中的特殊地位,尽管k ξ的分布是任意的,但只要n 充分大,nkna ξ-∑近似服从标准正态分布(0,1)N .或者说,当n 很大时,独立同分布的随机变量kξ的和1nk k ξ=∑ 近似地服从正态分布2(,)N n n μσ.这就是那些(可以看作有许多微小的、独立的随机因素作用的总结果,而每一个因素的影响却都很小)随机变量,一般都可以近似地服从正态分布的理论依据,因而正态分布在理论上和应用上都具有极大的重要性.若(,)B n p ξ ,则当n 很大时,有()P a b ξ⎛⎫⎛⎫≤≤≈Φ-Φ⎝定理 7 (棣莫弗—拉普拉斯(De Moivre-Laplace)中心极限定理) 设随机变量n η服从二项分布(,)B n p ,则对于任意区间[,]a b ,恒有22lim t nkb an na P a b dt ξ-→∞⎛⎫- ⎪ ⎪≤<=⎪ ⎪⎝⎭∑⎰二项分布的极限分布是正态分布 即如果(,)X B n p ,则221()()t nk b anaP a b dt b a ξ-⎛⎫- ⎪ ⎪≤<≈=Φ-Φ ⎪ ⎪⎝⎭∑⎰一般地,如果(,)X B n p ,则()P a X b P ⎛⎫≤<=≤<⎝b np a np --≈Φ-Φ说明:这个公式给出了n 较大时二项分布的概率计算方法.引理 设12,,ξξ 是独立随机变量序列,又k k E a ξ=,2(1,2,)k k D k ξσ== ,221nnkk B σ==∑,这时:(1) 若{}k ξ是连续型随机变量,密度函数为{}()n P x ,如果对任意0τ>,有2211lim()()0k nnk k x a B n k n x a P x dx Bτ->→∞=-=∑⎰(2) 若{}k ξ是离散型随机变量,k ξ的分布列为(),1,2,n nj nj P x P j ξ=== ,如果对任意0τ>,有()2211lim0nj k nnnjk kj n k x a B nxa P B τ→∞=->-=∑∑则称{}k ξ满足林德贝尔格条件.定理 8 (林德贝格定理) 设独立随机变量序列12,,ξξ 满足林德贝尔格条件,则当时,对任意的,有()2211lim y nx k k n k nP a x edy B ξ--∞→∞=⎛⎫-<=⎪⎝⎭∑这个定理证明了由大量微小而且独立的随机因素引起并积累而成的变量,必将是一个正态随机变量,由林德贝尔格条件可看到定理并不要求各个加项“同分布”,因而它比前述的林德贝尔格——勒维定理更强,事实上林德贝尔格——勒维定理可以由它推出.定理 9 (李雅普诺夫定理) 设12,,ξξ 是独立随机变量序列,又k kE a ξ=,2(1,2,)k k D k ξσ== ,记221nnkk B σ==∑,若存在0δ>,使有22110,nk kk nE a n B δδξ++=-→→∞∑,则对任意的实数x ,有()2211lim y nx k k n k n P a x edy B ξ--∞→∞=⎛⎫-<= ⎪⎝⎭∑定理9又称独立非同分布的中心极限定理,李雅普诺夫定理可以解释如下:假定被研究的随机变量可以表示为大量独立随机变量的总和,且总和中的每个单独的随机变量对于总和又不起主要作用,那么可以认为这个随机变量近似地服从正态分布.讨论了独立随机变量和的分布的极限问题,在一定条件下,这些分布弱收敛于退化分布,这就是大数定律.凡是在一定条件下断定随机变量之和的极限分布是正态分布的定理,在概率论中统称为中心极限定理.具体一点说,中心极限定理回答的是(独立或弱相依)随机变量之和的极限分布在什么条件下是正态的.中心极限定理是揭示产生正态分布的源泉,是应用正态分布来解决各种实际问题的理论基础.第4章 大数定律与中心极限定理的关系概率论中关于独立随机变量序列的极限理论, 已相当完整, 各种问题已有了令人满意的回答,但由于一般教材中, 特别是工科教材, 只介绍一、二个最简单的基本定理,若弱大数定律只介绍切比契夫定理的特殊情况, 中心极限定理只介绍同分布的林德贝格——列维定理(Lindeberg-Levy)的特殊情况——德莫弗—拉普拉斯(De Moivre-Laplace)定理.仅少数教材提及林德贝格条件. 这几个定理的条件又都是充分条件, 我们容易产生这样的问题: 大数定律与中心极限定理之间究竟有什么关系? 服从大数定律的是否服从中心极限定理? 反之又如何? 是否有两者都服从或都不服从的随机序列?因教材知识所限, 这些问题不太好回答, 现拟补充几个定理, 以简单的例子加以说明.定理10[12](格涅坚克定理) 设有相互独立的随机变量序列{}k ξ, 则对0ε∀>,11lim {()}1nkk n k p E nξξε→∞=-<=∑的充要条件是2221()lim[]0()nk k n k k k E E nE ξξξξ→∞=-=+-∑.定理11 (马尔科夫定理) 随机变量序列{}k ξ, 若211()0nk k D nξ=→∑,则对0ε∀>, 有11lim {()}1nkk n k p E nξξε→∞=-<=∑.定理12 (费勒定理) 对相互独立随机变量序列{}k ξ, 若∃常数n M ,使1max k n k nM ξ≤≤≤,且limn n nM B →∞=, 则{}k ξ服从中心极限定理.设{}k ξ为相互独立的随机变量序列, 以下在,,()k k j k j P P ξα==中, 令,,,k j k j P α取不同的值, 以说明不同的情形.4.1[12][13] 服从大数定律, 但不服从中心极限定理令(),1,1210,121k k P k α==-+,(),2,221,21k k k P k α==+,(),3,321,21k k k P k α==+,1,2,3,k = ,即()21(0)11k P k ξ==-+,()21()()21k k P k P k k ξξ===-=+可知0,k E ξ=()2221k k kD E k ξξ==+,()222111nnnk k k kB D k ξ====+∑∑因222110,n B n n nn<⋅→→∞, 由马尔科夫定理知, 大数定律成立, 但中心极限定理不成立. 这是因为12111(0)(0,0,,0)(0)(0)nnk n kkk k k P P P P ξξξξξξ∞==========≥=∑∏∏()2111(1)021nk k ==-=>+∏若服从中心极限定理,则取120,0x x <>,有22211211()t nx kx k nP x x edt B ξ-=<<=∑, 当12,x x 充分靠近 0 时,222112t x x e dt -<. 这就出现了矛盾. 所以中心极限定理不成立.4.2 服从中心极限定理, 但不服从大数定律取,,()k k j k j P P ξα==,为1()2k P k ξ==,1()2k P k ξ=-=,1,2,,k = 可知0,k E ξ=2k D kξ=,221nn k B k ==∑, 又 3333322221(1)(1)lim limlim3(1)n n n nn nnn n n n BB B n →∞→∞→∞++-+-===-+,即 313223limlim13n n nnnn B B -→∞→∞==,()12133lim1n nnB -→∞=又 1ax k k nM n ξ≤≤≤,()1213limlim03n n nn nB n→∞→∞-==则由费勒定理知中心极限定理成立, 但不服从大数定律, 这是因为2()x x R n x∈+, 为凸函数, 由琴生不等式222222222()kkkkE kE n n E n kξξξξ≥=+++,而 222222111111,244nnn k k k kkn k n n knnnn===+≥==→→∞++∑∑∑由格涅坚克定理知, {}k ξ不服从大数定律.4.3 大数定律与中心极限定理都不服从取,,()k k j k j P P ξα==,为1(2)2k k P ξ==,1(2)2k k P ξ=-=,可知0,k E ξ=4k k D ξ=,21144(41)3nnknnk k k B D ξ=====-∑∑, 当 n充分大时24n n B >,即2n n B >21112222(21)2n nn n n kk k k ξξ+==≤≤+++=-<∑∑,112nkk nB ξ=<∑故11lim (2)1(2)(2)1nkn k nP B ξ→∞=<=≠Φ-Φ-<∑可知不服从中心极限定理, 又22222222111144()44kknnnnkkknk k k k kkE E nn E n n ξξξξ====≥=>++++∑∑∑∑22111444(41),4433nknnnk n n n ===⋅-→→∞++∑,由格涅坚克定理知不服从大数定律.4.4 大数定律、中心极限定理都服从若{}k ξ为同分布且有有限期望及大于零的方差, 则由教材中定理易知两者都服从. 这时有11lim (())1nkk n k P E nξξε→∞=-<=∑.但括号中的事件概率, 究竞有多大? 大数定律未能回答. 而根据中心极限定理有22111(())()x nnkk kk k k P E P E edx nεξξεξξσ-==≤-<=-<≈∑其中2k D σξ=, 这样看来在所假定的条件下, 中心极限定理比大数定律更精确.第5章 应用大数定律以严格的数学形式表达了随机现象最根本的性质——平均结果的稳定性,它是随机现象统计规律性的具体表现. 因此,大数定律在理论和实际中都有广泛的应用.5.1[3] “概率”及“数学期望”的确切定义在给出二者定义时,都采用“稳定”一词,这是一种不确切的描述.依据大数定律可给出更确切的表达,即:概率——独立重复实验中,事件A 出现的频率11nPii Pnξ=−−→∑,则该常数P 即为概率.数学期望——对于任一0ε>,有11lim ()1nin i p nξμε→∞=-<=∑,则()k E μξ=称为数学期望.5.2 解释测量(随机) 误差根据大数定律,对于随机误差12,,,n δδδ ,应有11nPii nδ=−−→∑.这说明当测量次数较多时, 实测数据的平均值11nii a nδ=+∑和预测真值a 的差值能以很大概率趋于0,因此,用求样本数据平均值的方法来进行测量是可行的.例1[14] 某种仪器测量已知量A 时,设n 次独立得到的测量数据为12,,,n x x x ,如果仪器无系统误差,问:当n 充分大时, 是否可取作为仪器测量误差的方差的近似值?解 把(1,2,,)i x i n = 视作n 个独立同分布的随机变量的观察值,则()i E x μ=,2(),(1,2,,)i D x i n σ== .仪器第i 次测量的误差i x A -的数学期望()i E x A A μ-=-,方差2()i D x A σ-=.设2(),1,2,,i i Y x A i n =-= ,则i Y 也相互独立服从同一分布.在仪器无系统误差时()0i E x A -=,即有A μ=,222()()()()(1,2,,)i i i i i E Y E x A E x Ex D x i n σ⎡⎤⎡⎤=-=-===⎣⎦⎣⎦由车比雪夫定律,可得: 211lim {}1nin i p Ynσε→∞=-<=∑即 ()2211lim {}1nin i p x A nσε→∞=--<=∑从而确定,当n →∞时,随机变量()211ni i x A n=-∑依概率收敛于2σ,即当n 充分大时可以取()211nii x A n=-∑作为仪器测量误差的方差.5.3 在数学分析中的应用例2[1] 假设()22212121,,,:,0,,12n n n n nG x x x x x x x x ⎧⎫=+++≤≤≤⎨⎬⎩⎭,求其极限. 解 假设随机变量(1,2,)n n ξ= 在[]0,1上有均匀分布,而且相互独立,有112D ξ=,2112E ξ=,易见(){}22111,,2nn n n n Gn dx dx P G P ξξξξ⎧⎫=∈=++≤⎨⎬⎩⎭⎰⎰ ()()222222211111111111266nn n ii P P E P E n n nξξξξξξξ=⎧⎫⎧⎫⎧⎫=++≤=++-≤≥-≤⎨⎬⎨⎬⎨⎬⎩⎭⎩⎭⎩⎭∑ 由1,,n ξξ 独立同分布,可见221,,,n ξξ 独立同分布.根据辛钦大数定律知:2111lim ()16ni i n i p E nξξ→∞=-≤=∑从而1lim1nn G n dx dx →∞=⎰⎰ .例3 用概率方法证明维尔斯特拉斯[w eierstrass ]定理.假定()f x 在闭区间[],a b 上是连续的,那么,存在一列多项式12(),(),B x B x ,一致收敛于函数()f x ,[],x a b ∈.证 不妨设0,1a b ==.假设()f x ,[]0,1x ∈是连续函数,那么()f x 在[]0,1上一致连续并且有界.对于任意[]120,0,0,1x x ε>≤∈存在0δ>,使12()()2f x f x ε-<,只要12x x ε-<.此外,对于一切01x ≤≤,有()f x k ≤(常数).现在,建立一多项式:()(1)nm m n m n n n m m B x Ef f C x x n n ξ-=⎛⎫⎛⎫==- ⎪ ⎪⎝⎭⎝⎭∑,其中n ξ服从二项分布, 参数为1n ≥, 而[]0,1x ∈, 显然(0)(0)n B f =,(1)(1)n B f =.由贝努利大数定律知()limnn x P nξ→∞=,[]0,1x ∈现在证明()n n B x f n ξ⎛⎫= ⎪⎝⎭一致收敛于()f x ,[]0,1x ∈.由于0(1)1nm m n m n m C x x -=-=∑,可见()()0()(1)nmmn mn n m m B x f x f f x C x x n -=⎡⎤⎛⎫-=-- ⎪⎢⎥⎝⎭⎣⎦∑,由此可得:()()0()(1)nm m n m n n m m B x f x f f x C x x n -=⎛⎫-≤-- ⎪⎝⎭∑()()(1)(1)m m n m m m n mn n mm x x nnm m f f x C x x f f x C x x n n δδ---<-≥⎛⎫⎛⎫=--+-- ⎪ ⎪⎝⎭⎝⎭∑∑2(1)222m m n mn n mx nkC x x kP x n δεεξδ--<⎧⎫<+-=+-≥⎨⎬⎩⎭∑. 由于对任意[]0,1x ∈,Pnxnξ−−→可见存在N ,使当时n N ≥,4nP x n kξεδ⎧⎫-≥≤⎨⎬⎩⎭ 从而,当n N ≥时,对于一切[]0,1x ∈,有:()()22422n B x f x k kεεεεε-<+=+= .即()n B x 关于[]0,1x ∈一致收敛于()f x .5.4 在计算精确的近似概率方面的应用例4[15] 现有一大批种子,其中良种占1/6 ,今在其中任选6000 粒,试分别用切比雪夫不等式估计和用中心极限定理计算在这些种子中良种所占的比例与1/6之差小于1%的概率是多少?解 设取出的种子中的良种粒数为X ,则1(6000,)6X B 于是1600010006E X n p ==⨯= 155(1)60001000666D X np p =-=⨯⨯=⨯(1) 要估计的规律为{}1110006060006100XP P X ⎧⎫-<=-<⎨⎬⎩⎭相当于在切比雪夫不等式中取60ε=,于是{}21110006016000610060X D X P P X ⎧⎫-<=-<≥-⎨⎬⎩⎭ 由题意得 25111100010.23150.76856063600D X-=-⨯⨯=-= 即用切比雪夫不等式估计此概率不小于0.7685.(2) 由拉普拉斯中心极限定理,对于二项分布1(6000,)6B ,可用正态分布5(1000,1000)6N ⨯近似, 于是所求概率为{}11940106060006100X P P X ⎧⎫-<=<<⎨⎬⎩⎭ 2(2.0785)10.9625≈Φ-Φ≈Φ-≈从本例看出:用切比雪夫不等式只能得出来要求的概率不小于0.7685,而用中心极限定理可得出要求的概率近似等于0.9625.从而知道由切比雪夫不等式得到的下界是十分粗糙的.但由于它的要求比较低,只要知道X 的期望和方差,因而在理论上有许多运用.当i X 独立同分布(可以是任何分布),计算1()n P a X X b <++≤ 的概率时,利用中心极限定理往往能得到相当精确的近似概率,在实际问题上广泛运用.5.5[16][17] 在彩票和保险业的应用大数定律和中心极限定理是概率论中两类具有极大意义的重要定理. 大数定律证明了在大样本条件下,样本平均值可以看作是总体平均值(数学期望) ,它是“算术平均值法则”的理论基础;中心极限定理比大数定律更为详细具体,它以严格的数学形式阐明了在大样本条件下,不论总体的分布如何,样本均值总是近似的服从正态分布. 正是这个结论使得正态分布在数理统计和误差分析中占有特殊的地位,是正态分布得以广泛应用的理论基础. 本文通过对彩票学和保险业等几个具体事例的引用展现了大数定律和中心极限定理的实际应用.大数定理在实际生活中应用十分广泛,我们现在以生活中最平常的但都很感兴趣的事情——彩票为例来详细阐述一下大数定理在彩票学中的应用.我们知道概率论是研究现实世界随机现象的科学,是近代数学的重要组成部分. 它在自然科学以及经济工作中都有着广泛的应用,同时也是数理统计的基础. 彩票投注的中奖概率分布完全符合它的原理. 彩票的投注方法是一个玩数字游戏. 彩票号码的摇出是随机事件,也可以说是一随机现象,属概率论的一个基本概念. 首先我们应该先清楚什么是随机现象? 我们说随机现象的特点是:事先不能预言其结果,具有偶然性;另一方面,在相同条件进行大量的重复试验,会呈现出某种规律性(特别是随机开奖次数的不断增多).例如:在相同条件下,多次抛掷质量均匀的同一枚硬币,则出现正面向上的次数约占总抛次数的一半,而且随着抛掷次数的增加,正面向上次数是总抛次数的12.这就是概率论的统计结果.(请看下面5次抛币的试验结果)有人曾经做过抛掷硬币的试验,试验结果记录如下:投掷次数N,正面向上次数M.M0.5181=2048N=1061N M==4040M0.5069N=2048N M=M0.5016N=6019=12000N M=M0.5005=24000N=12012N M==30000M0.4996N=14984N M=M0.5011N=36124=72088N M=由上述情况可以看出投掷次数很大时,其频率稳定于0.5彩票每期摇出的中奖号码(基本号码和特别号码)是一个随机事件,既然是随机事件,必有其分布规律.1. 2001010期至2001023期“上海风采”电脑福利彩票开奖计14期共摇出14*8112=个球.2. 每个球平均出现3.6次3. 奇数出现59次;偶数出现53次4. 小于或等于15的数47次;大于或等于16的数出现65次由此,我们引入彩票的一对常用语“冷门号码”及“热门号码”.有了“冷门号码”及“热门号码”,我们只要扑捉到这种机会,将会提高中奖纪律.概率分布的四条法则:1. 奇数.偶数出现的次数应占总数的12(由于不确定因素除外).2. 大数.小数出现的次数应占总数的12(由于不确定因素除外).3. 1-10区段,11-20区段,21-31区段,三区段出现的数个占总数的13(由于不确定因素除外).4. 各数出现的次数,随着实验(开奖)次数的增加不断靠近平均值(由于不确定因素除外).综上所述,随机的摇球事件随着实验(开奖)次数的增加都会显示出它的某些规律性,而这种规律性可以借助概率论的知识,利用小概率统计法,分析判断号码.通过数字统计,运用概率论原理来判断冷热号码出现的周期. 分析号码可能出现的区段. 缩小精选号码范围. 为新一期选择号码提供参考依据,从而达到提高中奖得率.实际上,对于彩票而言,也不是完全没有规律可循,只要经过大量的观察,根据大数定律就可以进行统计预测,提高中奖的几率. 概率论是一门系统学科,一般人了解的概率,不是从理论上认识,仅仅限于经验. 时间的表层认识. 与其硬着头皮去盲目猜测,不如运用简单的概率学统计分析方法更简单,更容易掌握. 把每期中奖号码出现的次数累加起来,一一进行统计,累计到一定量后,就能发现奖项及其相关指标的概率波动特性. 彩民再根据这些进行选号投注,就可以大大提高中奖几率.中心极限定理指出:如果一个随机变量有众多的随机因素所引起,每个因素在总的变化里起着不大作用,就可以推断描述这个随机现象的随机变量近似的服从正态分布,所以要求随机变量之和落在某个区间上的概率,只要把它标准化,用正态分布作近似计算即可. 中心极限定理还及时了离散型随机变量与连续型随机变量的内在联系,即离散型随机变量的极限分布是正态分布.中心极限定理对保险业更是具有指导性的意义,一个保险公司的亏盈,是否破产,我们通过学习中心极限定理的知识都可以做到估算和预测. 大数定律是近代保险业赖以建立的基础. 根据大数定律中心极限定理,我们知道承保的危险单位越多,损失概率的偏差越小,反之,承保的危险单位越少,损失概率的偏差越大. 因此,保险人运用大数法则就可以比较精确的预测危险,合理的拟定保险费率. 下面我们以一道具体的有关保险业的实例来阐述一下大数定律和中心极限定理在保险业中的重要作用和具体应用.例 5已知在某人寿保险公司里有10000个同一年龄段的人参加保险,在同一年里这些人死亡率为0.1% ,参加保险的人在一年的头一天交付保险费10元,死亡是家属可以从保险公司领取2000元的抚恤金. 求保险公司一年中获利不少于40000 元的概率;保险公司亏本的概率是多少?解设一年中死亡的人数为x人. 死亡概率为0.001P= ,把考虑10000人在一年里是否死亡看成10000重贝努里试验,保险公司每年收入为10000*10100000=元,付出2000x元.(1) P(保险公司获利不少于40000 元){}=->=(1000002000)40000P x。
概率论论文-浅谈中心极限定理
浅谈中心极限定理摘要:中心极限定理的产生具有一定的客观背景,最常见的是林德伯格-莱维中心极限定理和棣莫弗-拉普拉斯中心极限定理。
它们表明了当n 充分大时,方差存在的n 个独立同分布的随机变量和近似服从正态分布,在实际中的应用相当广泛。
本文讨论了中心极限定理的内涵及其在生活实践中的应用。
关键词:中心极限定理;正态分布;生活中的应用。
引言:在实际问题中,常常需要考虑许多随机因素所产生的总的影响,如测量误差、炮弹射击的落点与目标的偏差等。
同时许多观察表明,若一个随机变量是由大量相关独立的随机因素的综合影响所构成的,而其中每一个随机因素的单独作用是微小的,则这样的随机变量通常是服从或近似服从正态分布。
这种现象就是中心极限定理产生的客观背景。
在概率论与数理统计中,中心极限定理是非常重要的一节内容,而且是概率论与数理统计之间承前启后的一个重要纽带。
王勇老师讲到中心极限定理时,曾非常激动地说这个定理一被提出便震惊了全世界,而且重复了数遍。
由此足以见得中心极限定理的重要性。
目前我们研究的是独立同分布条件下的中心极限定理:林德伯格-莱维中心极限定理:设{}n X 是独立同分布的随机变量序列,且)(,)(2>==σμi i X Var X E 存在,若记nn XY ni in σμ-=∑=1则对任意实数y ,有{}⎰∞--∞→=Φ=≤yt n n t y y Y P .d e π21)(lim 22这个中心极限定理是由林德伯格和莱维分别独立的在1920年获得的,定理告诉我们,对于独立同分布的随机变量序列,其共同分布可以是离散分布,也可以是连续分布,可以是正态分布,也可以是非正态分布,只要其共同分布的方差存在,且不为零,就可以使用该定理的结论。
只有当n 充分大时,nY 才近似服从标准正态分布)1,0(N ,而当n 较小时,此种近似不能保证。
也就是说,在n 充分大时,可用)1,0(N 近似计算与nY 有关事件的概率,而n 较小时,此种计算的近似程度是得不到保障的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
青岛农业大学本科生课程论文题目:中心极限定理及其应用姓名:学院:专业:班级:学号:指导教师:2012 年06 月27 日青岛农业大学课程论文任务书论文题目中心极限定理及其应用要求完成时间 2012年 07 月 02 日论文内容(需明确列出研究的问题):研究中心极限定理的目的就是为了更深入的了解中心极限定理,更好的了解中心极限定理的作用,更好地使用它解决现实生活中的问题。
资料、数据、技术水平等方面的要求论文要符合一般学术论文的写作规范,具备学术性、科学性和一定的创造性。
文字要流畅、语言要准确、论点要清楚、论据要准确、论证要完整、严密,有独立的观点和见解。
内容要理论联系实际,计算数据要求准确,涉及到他人的观点、统计数据或计算公式等要标明出处,结论要写的概括简短。
参考文献的书写按论文中引用的先后顺序连续编码。
指导教师签名:年月日中心极限定理及其应用信息与计算科学专业(学生姓名)指导教师(老师姓名)摘要:中心极限定理在概率论与数理统计中占有重要地位,本文阐述了中心极限定理的内容并简单介绍了它在实际中的应用。
关键词:中心极限定理;正态分布;随机变量Central limit theorem and its applicationStudent majoring in Information and Computing Science Specialty (学生英文名)Tutor (老师英文名)Abstract:The central limit theorem in probability theory and mathematical statistics plays an important role,this paper expounds the content of the central limit theorem and briefly introduces its application in practice.Key words: Central limit theorem Normal distribution Random variable引言:最早的中心极限定理是讨论n重伯努力试验中,事件A出现的次数渐近于正态分布的问题。
1716年前后莫弗对n重伯努力实验中每次事件A出现的概率为0.5的情况进行了讨论,随后拉普拉斯和李雅普诺夫等进行了推广和改进。
自莱维在1919-1925年系统的建立了特征函数理论起,中心极限定理的研究得到了很快的发展,先后产生了普遍极限定理和布局极限定理等。
极限定理是概率论的重要内容,也是数理统计学的基石之一,其理论成果也比较完美。
长期以来,对于极限定理的研究所形成的概率轮分析方法,影响着概率论的发展。
同时新的极限理论问题也在实际中不断产生。
1 中心极限定理的表现形式中心极限定理也有若干个表现形式,这里仅介绍其中四个常用定理:1.1 辛钦中心极限定理设随机变量相互独立,服从同一分布且有有限的数学期望a 和方差σ2,则随机变量,在n无限增大时,服从参数为a和的正态分布即n→∞时,将该定理应用到抽样调查,就有这样一个结论:如果抽样总体的数学期望a 和方差σ2是有限的,无论总体服从什么分布,从中抽取容量为n的样本时,只要n足够大,其样本平均数的分布就趋于数学期望为a,方差为σ2 / n的正态分布。
1.2 德莫佛——拉普拉斯中心极限定理设μn是n次独立试验中事件A发生的次数,事件A在每次试验中发生的概率为P,则当n无限大时,频率设μn / n趋于服从参数为的正态分布。
即:该定理是辛钦中心极限定理的特例。
在抽样调查中,不论总体服从什么分布,只要n充分大,那么频率就近似服从正态分布。
1.3 李亚普洛夫中心极限定理当随机变量Xi独立,但不一定同分布时,中心极限定理也成立。
定理3[2](李雅普诺夫定理):设X1,X2,…,Xn,…为独立随机变量序列,且E(Xn)=an,D(Xn)=σn2存在,Bn2= σn2(n=1,2,…),若存在δ>0,使得:也就是说,无论各个随机变量Xi服从什么分布,只要满足李雅普诺夫条件,当n很大时,它们的和近似服从正态分布。
由于在大学本科阶段接触的不同分布的样本较少,本文对它的应用将不举例说明。
中心极限定理以严格的数学形式阐明了在大样本条件下,不论总体的分布如何,样本均值总是近似地服从正态分布。
正是这个结论使得正态分布在生活中有着广泛的应用。
设是一个相互独立的随机变量序列,它们具有有限的数学期望和方差:。
记,如果能选择这一个正数δ>0,使当n→∞时,,则对任意的x有:该定理的含义是:如果一个量是由大量相互独立的随机因素影响所造成的,而每一个别因素在总影响中所起的作用不很大,则这个量服从或近似服从正态分布。
中心极限定理以严格的数学形式阐明了在大样本条件下,不论总体的分布如何,样本均值总是近似地服从正态分布。
正是这个结论使得正态分布在生活中有着广泛的应用。
1.4 林德贝尔格定理定理[1]:设x1,X2,…,Xn,…是独立同分布随机变量,EXi=μDXi=σ2(i=1,2,…,n)则它表明当n充分大时,n个具有期望和方差的独立同分布的随机变量之和近似服从正态分布。
定理1也称为林德伯格定理或列维——林德伯格定理。
其中上下同除n,分子中有,其在数理统计中可表示样本的均值,可见独立同分布的样本均值近似地服从正态分布。
这使得中心极限定理在数理统计中有着广泛而重要的作用。
而上述定理应用到伯努利实验序列的情形,我们可以得到如下定理。
定理2[1](拉普拉斯定理),在n重伯努利试验中,事件A在每次实验中出现的概率P(0<P<1),μn为n次试验中事件A出现的次数,则2 中心极限定理的应用2.1 同分布下中心极限定理的简单应用独立同分布的中心极限定理可应用于求随机变量之和Sn落在某区间的概率和已知随机变量之和Sn取值的概率,求随机变量的个数。
例1[3]:设各零件的重量都是随机变量,它们相互独立且服从相同的分布,其数学期望为0.5kg,均方差为0.1kg,问5000只零件的总重量超过2510kg的概率是多少?解:设Xi(i=1,2,…,5000)表示第i个零件的重量X1,X2,…,X5000独立同分布且E(Xi)=0.5,D(Xi)=0.12。
由独立同分布的中心极限定理可知=I-φ(1.414)=1-0.9215=0.0785例2[3]:一生产线生产的产品成箱包装,每箱的重量是随机的且同分布,设每箱平均重50kg,标准差为5kg,若用最大载重为50吨的汽车承运,每辆车最多可以装多少箱才能保证不超载的概率大于0.977?解:设Xi(i=1,2,…,n)是装运第i箱的重量,n为所求箱数。
由条件可把X1,X2,…,Xn看作独立同分布的随机变量,而n箱的总重量为Tn=X1+X2+…+Xn,是独立同分布的随机变量之和。
由E(Xi)=50、D(Xi)=52得:E(Tn)=50n,D(Tn)=52n根据独立同分布的中心极限定理:即最多可以装98箱。
例3[2]:报名听心理学课程的学生人数K是服从均值为100的泊松分布的随机变量,负责这门课的教授决定,如果报名人数不少于120,就分成两班,否则就一班讲授。
问该教授讲授两个班的概率是多少?分析:该教授讲授两个班的情况出现当且仅当报名人数x不少于120,精确解为P(x≥120)=e-100 100i/i!很难求解,如果利用泊松分布的可加性,想到均值为100的泊松分布随机变量等于100个均值为1的独立泊松分布随机变量之和,即X= Xi,其中每个Xi具有参数1的泊松分布,则我们可利用中心极限定理求近似解。
解:可知E(X)=100,D(X)=100 即教授讲授两个班的概率是0.023。
例4[1]:火炮向目标不断地射击,若每次射中目标的概率是0、1。
(1)求在400次射击中击中目标的次数在区间[30,50]内的概率。
(2)问最少要射击多少次才能使击中目标的次数超过10次的概率不小于0.9?分析:显然火炮射击可看作是伯努利实验。
我们知道,正态分布可近似于二项分布,而且泊松分布可近似于二项分布,当二项分布b(n,p),n较大、p较小时可用泊松分布估计近似值。
如果p接近1,有q=l-p很小,这时也可用泊松分布计算;但是当n较大,p不接近0或1时,再用泊松分布估计二项分布的概率就不够精确了,这时应采用拉普拉斯定理来计算。
解:(1)设在射击中击中目标的次数为Yn,所求概率(30≤Yn<50)等于:最小正整数n=147就是所要求的最小射击数。
以上例子都是独立同分布的随机变量,可以用中心极限定理近似估算,但是如果不同分布,中心极限定理是否也成立呢?2.2 中心极限定理在商业管理中的应用[4]水房拥挤问题:假设西安邮电学院新校区有学生5000人,只有一个开水房,由于每天傍晚打开水的人较多,经常出现同学排长队的现象,为此校学生会特向后勤集团提议增设水龙头。
假设后勤集团经过调查,发现每个学生在傍晚一般有1%的时间要占用一个水龙头,现有水龙头45个,现在总务处遇到的问题是:1、未新装水龙头前,拥挤的概率是多少?2、至少要装多少个水龙头,才能以95%以上的概率保证不拥挤?3、至少安装多少个水龙头,才能以99%以上的概率保证不拥挤?4、若条件中已有水龙头数量改为55个,其余的条件不变, (1),(2)两问题结果如何?5、若条件中的每个学生占用由1%提高到1.5%,其余的条件不变,则(1),(2)两问题结果如何?解:1、设同一时刻,5000个学生中占用水龙头的人数为X,则X~B(5000,0.01)拥挤的概率是有定理2,n=5000,p=0.01,q=0.985,故即拥挤的概率P(ζ > 45) = 1 − 0.2389 = 0.76112、欲求m,使得,即,由于,即,查表,即,需装62个水龙头。
问题的变形:3、至少安装多少个水龙头,才能以99%以上的概率保证不拥挤?解:欲求m,使得,即,由,即,查表,即m≥66.4,故需要装67个水龙头。
4、若条件中已有水龙头数量改为55个,其余的条件不变, (1),(2)两问题结果如何?解:(1)(2)5、若条件中的每个学生占用由1%提高到1.5%,其余的条件不变,则(1),(2)两问题结果如何?解:(1)设同一时刻,5000个学生中占用水龙头的人数为X,则X-B(5000,0.015)已知n=5000,p=0.015,q=0.985,np=75,。
拥挤的概率达。
(2)欲求m,使得,即,由,即,查表,即m≥89.14 ,故需装90个水龙头。
中心极限定理以严格的数学形式阐明了在大样本条件下,不论总体的分布如何,样本的均值总是近似地服从正态分布。
如果一个随机变量能够分解为独立同分布的随机变量序列之和,则可以直接利用中心极限定理进行解决。