大数定理与中心极限定理的关系及应用
中心极限定理 大数定律
中心极限定理与大数定律介绍中心极限定理(Central Limit Theorem)和大数定律(Law of Large Numbers)是概率论中两个重要而基础的定理。
它们在统计学和各个领域的实际应用中起着至关重要的作用。
本文将深入探讨这两个定理的概念、应用和相关证明。
中心极限定理定义中心极限定理是概率论中的一个重要定理,它说明了在特定条件下,一组随机变量的均值的分布会趋近于正态分布。
具体来说,对于任意独立同分布的随机变量的和,当样本容量足够大时,其均值的分布将会接近于正态分布。
证明中心极限定理的证明可以通过多种方法进行推导,其中最为经典的方法是使用特征函数的技巧。
通过对特征函数的逐步展开和极限取证,可以得出中心极限定理的结论。
应用中心极限定理在实际应用中有着广泛的应用。
以下是中心极限定理的几个重要应用:1.抽样分布的近似计算:通过中心极限定理,可以对抽样分布进行近似计算,从而推断总体参数。
2.假设检验:在统计学中,中心极限定理广泛应用于假设检验问题中。
通过对样本均值进行正态分布近似,可以进行对总体均值的假设检验。
3.建立置信区间:中心极限定理可用于建立置信区间。
通过计算样本均值的区间估计,确定总体均值的信心水平。
大数定律定义大数定律是概率论中的另一个重要定理,它说明了当独立同分布的随机变量重复进行实验时,其平均值会收敛于数学期望。
换句话说,随着实验次数的增加,样本均值会趋近于总体均值。
证明大数定律的证明有多种方法,其中最为著名的是切比雪夫不等式和辛钦大数定律。
不同的证明方法都有其特点和适用范围,但最终都能得出大数定律的结论。
应用大数定律在实际应用中也有着广泛的应用。
以下是大数定律的几个重要应用:1.统计估计:大数定律可用于建立统计估计方法,如最大似然估计和矩估计。
2.贝叶斯推断:大数定律在贝叶斯推断中起着重要的作用。
通过重复实验,可以逐渐更新对参数的先验分布,得到后验分布。
3.经济学和金融学:大数定律在经济学和金融学中有广泛的应用。
中心极限定理和大数定律
中心极限定理和大数定律中心极限定理和大数定律是统计学中非常重要的两个概念。
它们在统计学中被广泛应用,对于理解随机事件的规律性和分析数据具有重要意义。
本文将对中心极限定理和大数定律进行详细的阐述。
一、中心极限定理1. 定义中心极限定理是指当样本量足够大时,样本均值的分布近似于正态分布。
也就是说,如果我们从总体中抽取足够多的样本,并计算每个样本的平均值,那么这些平均值将近似于正态分布。
2. 原理中心极限定理的原理可以用数学公式表示为:当n趋向于无穷大时,样本均值(Xbar)服从正态分布N(μ,σ^2/n)。
其中,μ代表总体均值,σ代表总体标准差。
3. 应用中心极限定理在实际应用中非常广泛。
例如,在质量控制过程中,我们可以通过抽取一小部分产品进行检测,并根据检测结果推断整个批次产品的质量状况。
而根据中心极限定理,我们可以通过抽取足够多的样本并计算样本均值,来推断总体均值和标准差,从而判断整个批次产品的质量是否符合要求。
二、大数定律1. 定义大数定律是指当样本量足够大时,样本平均值趋近于总体平均值。
也就是说,如果我们从总体中抽取足够多的样本,并计算每个样本的平均值,那么这些平均值将趋近于总体的平均值。
2. 原理大数定律的原理可以用数学公式表示为:当n趋向于无穷大时,样本均值(Xbar)趋近于总体均值(μ)。
3. 应用大数定律在实际应用中也非常广泛。
例如,在股票市场中,我们可以通过抽取一小部分股票进行分析,并根据分析结果预测整个市场的走势。
而根据大数定律,我们可以通过抽取足够多的股票并计算它们的收益率,来推断整个市场的平均收益率和风险水平。
三、中心极限定理和大数定律之间的关系1. 相似性中心极限定理和大数定律都是关于样本均值的定理,它们都是基于样本量足够大的前提条件下成立的。
2. 区别中心极限定理和大数定律的主要区别在于它们所描述的内容不同。
中心极限定理描述了样本均值的分布情况,而大数定律描述了样本均值与总体均值之间的关系。
概率论中的大数定律与中心极限定理
概率论中的大数定律与中心极限定理概率论是数学中的重要分支,研究随机现象的规律性。
在概率论中,大数定律和中心极限定理是两个基本定理,它们对于理解和应用概率论具有重要意义。
一、大数定律大数定律是概率论中的一项重要成果,它研究的是随机事件重复进行时,随着试验次数的增加,事件的频率趋于稳定的现象。
大数定律的核心思想是:随机事件的频率会趋于其概率。
大数定律有多种形式,其中最著名的是弱大数定律和强大数定律。
弱大数定律指出,当随机事件重复进行时,事件的频率会接近其概率,但不一定完全相等。
而强大数定律则更加严格,它指出,当随机事件重复进行时,事件的频率几乎必定会趋于其概率。
大数定律的应用非常广泛。
例如,在赌场中,赌徒们常常利用大数定律来制定自己的投注策略。
他们相信,通过多次下注,最终能够获得稳定的胜率。
另外,在统计学中,大数定律也是重要的理论基础。
通过对大量样本的观察,我们可以得出对总体的推断。
二、中心极限定理中心极限定理是概率论中的另一个重要定理,它研究的是随机变量的和的分布趋于正态分布的现象。
中心极限定理的核心思想是:随机变量的和趋于正态分布的程度与随机变量的分布无关,只与样本容量有关。
中心极限定理有多种形式,其中最著名的是中心极限定理的拉普拉斯形式和莫尔根-拉普拉斯形式。
中心极限定理的拉普拉斯形式适用于二项分布和泊松分布,而莫尔根-拉普拉斯形式适用于任意分布。
中心极限定理的应用广泛而深入。
在实际生活中,我们常常遇到一些随机现象,如测量误差、人口统计等。
通过应用中心极限定理,我们可以对这些随机现象进行更准确的分析和预测。
三、大数定律与中心极限定理的关系大数定律和中心极限定理是概率论中两个相互关联的定理。
它们都是研究随机现象的规律性,但侧重点不同。
大数定律研究的是随机事件的频率趋于稳定的现象,它关注的是事件本身的概率。
而中心极限定理研究的是随机变量的和的分布趋于正态分布的现象,它关注的是随机变量的分布。
大数定律和中心极限定理的关系可以从两个方面来理解。
大数定律与中心极限定理
大数定律与中心极限定理大数定律(Law of Large Numbers)和中心极限定理(Central Limit Theorem)是统计学中两个基本的概念和定理,它们在概率论和统计学的研究中起着重要的作用。
本文将介绍大数定律与中心极限定理的概念和原理,并探讨它们在现实生活中的应用。
一、大数定律大数定律是指随着样本容量的增加,样本平均值的稳定性会逐渐增强,逼近总体均值。
以样本平均值为例,大数定律表明当样本容量无限大时,样本平均值将趋近于总体均值。
这一定律在概率论和统计学中有着广泛的应用。
大数定律可以分为弱大数定律和强大数定律两类。
弱大数定律指的是当样本容量足够大时,样本平均值以较高的概率接近总体均值;而强大数定律则是指样本平均值几乎总是接近于总体均值,不管样本容量大小。
大数定律在现实生活中有着广泛的应用。
例如,在投资领域,投资者通过分析历史数据来估计未来的收益率。
大数定律告诉我们,当样本容量足够大时,通过历史数据得出的均值可以较好地代表未来的收益率。
另外,在统计调查中,通过对样本进行抽样调查可以估计总体的参数。
大数定律告诉我们,样本容量越大,样本估计总体参数的准确性就越高。
二、中心极限定理中心极限定理是指在一定条件下,独立同分布的随机变量之和的分布趋近于正态分布。
中心极限定理是统计学中最重要的定理之一,它揭示了总体均值的抽样分布的特性。
中心极限定理有三种常见的形式:李雅普诺夫中心极限定理、棣莫弗-拉普拉斯中心极限定理和林德伯格-列维中心极限定理。
这三种形式的中心极限定理分别对应不同的分布情况。
中心极限定理的应用非常广泛。
在现实生活中,我们经常遇到需要对一组随机变量求和的情况。
例如,抽样调查中,我们需要对多个样本进行求和,来估计总体参数。
中心极限定理告诉我们,当样本容量足够大时,样本求和的分布将逼近于正态分布。
这为我们在实际问题中提供了便利,使得我们能够利用正态分布的性质进行统计推断和分析。
总结:大数定律和中心极限定理是统计学中两个基本的概念和定理。
大数定理与中心极限定理的关系及应用汇总
大数定理与中心极限定理的关系及应用汇总大数定理和中心极限定理都是概率论中非常重要的定理,它们在概率论和统计学中有着广泛的应用。
下面我们来详细介绍它们的关系及应用。
大数定理(Law of Large Numbers)是概率论中的一个重要定理,它描述的是随机变量序列的平均值收敛于期望的情况。
大数定理主要分为弱大数定律和强大数定律。
弱大数定律指的是当样本容量趋于无穷大时,随机变量的平均值收敛于期望的概率为1;强大数定律则指的是在一些条件下,随机变量的平均值几乎处处收敛于期望,即概率为1中心极限定理(Central Limit Theorem)是概率论中另一个重要的定理,它描述的是随机变量序列的和随着样本容量的增大逼近于正态分布的现象。
中心极限定理分为三种形式:林德伯格-列维定理、德莫佛拉-拉普拉斯定理和契比雪夫不等式。
其中,林德伯格-列维定理是最早提出的版本,它陈述了独立随机变量和的分布函数在适当的标准化下会趋近于标准正态分布。
大数定理和中心极限定理的关系:大数定理和中心极限定理在一定程度上是互补的。
大数定理关注的是样本容量趋于无穷大时随机变量的平均值的收敛情况,中心极限定理则关注的是样本容量增加时和的分布趋近于正态分布的情况。
可以说,中心极限定理是大数定理的一种具体形式。
应用汇总:大数定理和中心极限定理在实际应用中有着广泛的应用。
下面我们来汇总一些常见的应用领域:1.投资与金融:大数定理可以应用在股票市场分析中,通过分析历史数据计算出平均回报率,从而预测未来的回报率。
而中心极限定理则可以用于计算股票收益率的置信区间,帮助投资者进行风险管理。
2.生物统计学:大数定理和中心极限定理在生物统计学中有着广泛的应用。
例如,通过大数定理可以估计人口中患其中一种疾病的比例,从而指导公共卫生政策制定。
而中心极限定理则可以用于计算样本均值的置信区间,帮助比较两个群体的差异性。
3.教育评估:在教育评估中,大数定理和中心极限定理可以用于计算学生的平均成绩以及学校的平均分数的置信区间。
大数定律与中心极限定理
大数定律与中心极限定理大数定律和中心极限定理是统计学中两个重要的概念,它们被广泛应用于概率论、数理统计以及各种实际问题的分析与推导中。
本文将详细介绍大数定律与中心极限定理的概念、原理及应用,以期帮助读者更好地理解和应用这两个定律。
一、大数定律大数定律是指在随机试验中,当试验次数趋于无穷时,样本均值趋近于总体均值的概率趋于1的现象。
简言之,大数定律说明了在重复独立试验的过程中,随着试验次数增加,样本均值与总体均值之间的差距将会逐渐减小。
大数定律有多种形式,其中最为著名的是弱大数定律和强大数定律。
弱大数定律也称为大数定律的辛钦特例,它是在满足一定条件下,样本均值趋近于总体均值的概率收敛于1。
而强大数定律则对样本均值的收敛速度和稳定性做出了更严格的要求。
在实际应用中,大数定律可以用来解释和预测各种现象。
例如,当进行大规模的舆情调查时,可以通过随机抽样的方式来获取一部分样本,然后利用大数定律来推断出总体的舆情倾向。
此外,在生产过程中对产品质量的控制和检验中,也可以使用大数定律来判断产品的批量质量是否合格。
二、中心极限定理中心极限定理是概率论中的一个重要定理,它说明了在某些条件下,当样本容量足够大时,样本均值的分布将近似服从于正态分布。
也就是说,无论总体分布是否服从正态分布,在大样本条件下,样本均值的分布都将趋于正态分布。
中心极限定理的重要性在于它提供了许多统计推断和参数估计的基础。
例如,在对总体均值进行估计时,可以利用样本均值的分布接近于正态分布来构建置信区间,从而对总体均值进行区间估计。
此外,中心极限定理还为假设检验提供了支持。
假设检验是统计推断的一种常用方法,通过对样本数据进行假设检验,可以判断总体参数是否与假设相符。
而中心极限定理则为假设检验提供了理论基础,使得假设检验的结果更加可靠和准确。
综上所述,大数定律和中心极限定理是统计学中两个重要的理论基础。
大数定律说明了随机试验中样本均值与总体均值的关系,而中心极限定理则揭示了样本均值的分布特征。
大数定律和中心极限定理的证明及应用
大数定律和中心极限定理的证明及应用大数定律和中心极限定理是概率论中的两个重要定理,它们在实际应用中具有重要的作用。
随着21世纪的到来,计算机科学的发展和人工智能技术的不断突破,这些定理在数据分析、机器学习等领域中的应用也越来越广泛。
大数定律是概率论中的一条非常重要的定理,它描述了重复实验的结果会越来越接近于总体的平均值。
具体而言,如果我们对某个随机事件进行了N次实验,并对N个数据点求平均值,那么这个平均值在N变得越来越大时,会趋近于总体的期望值。
在实际中,大数定律可以用于各种数字数据的分析。
例如,我们可以在股市交易中使用大数定律,以预测股市的长期结果。
我们可以通过对每天的股票价格进行记录并验证大数定律是否成立,从而得到预测指数。
另外,在物理学中,大数定律也有重要的应用。
例如,我们可以使用大数定律来确定大量粒子的平均位置。
这种方法可以在许多物理领域中找到应用,如计算电磁场的平均值。
大数定律的证明比较复杂。
一种常用的证明方法是通过上极限和下极限来证明。
上极限和下极限分别代表了随着实验次数增加,平均值逐渐趋向于总体期望值的上限和下限。
根据大数定律的规定,这两个极限应该相等。
证明的核心是要建立一个独立的同分布序列,通过样本与总体一致性的性质,尽可能接近于总体。
中心极限定理是另一个与大数定律相关联的概率论定理。
它描述了当N次独立实验的结果之和趋近于一个标准正态分布时,经过N次标准化后的分布会趋向于一个正态分布。
中心极限定理在实际中的应用非常广泛。
例如,在医学研究中,我们可以使用中心极限定理来估计医疗样本的均值和标准偏差。
我们还可以使用该定理来评估航空公司的航班订购量。
通过使用中心极限定理来计算航班预订量的分布,我们就可以确定需要多少飞机来完成航班任务。
与大数定律的证明相比,中心极限定理的证明相对简单。
它使用了矩母函数和生成函数等概率论方法,通过对傅里叶变换的应用,将一些信息从时域转移到了频域,实现了由多个随机事件的组合到高斯分布的转化。
大数定律与中心极限定理的关系及其应用
论文题目:大数定律与中心极限定理的关系及其应用摘要:本文通过对概率论的经典定理——大数定律与中心极限定理在独立同分布和不同分布两种情况下的结论作了比较系统的阐述,揭示了随机现象最根本的性质——平均结果的稳定性.经过对中心极限定理的讨论,给出了独立随机变量之和的分布可以用正态分布来表示理论依据.关于大数定律方面,较全面地分析和叙述了几种最常用的大数定律.同样中心极限定理的内容也从独立同分布与独立不同分布两个角度来进行讨论;另外,叙述了各种大数定律以及中心极限定理各自之间,大数定律与中心极限定理之间的关系.同时通过举出很多相关的反例说明二者的关系.最后给出了一些简便的大数定律与中心极限定理在数理统计、误差、彩票学、近似计算、保险业及数学分析等几个方面的应用,来进一步地阐明了大数定律与中心极限定理在各分支学科中的重要作用和应用价值.关键词:随机变量序列;大数定律;中心极限定理;应用Title:Law of large numbers and the relationship between the centrallimit theorem and its applicationAbstract: Based on the probability of a classic theorem : the law of large numbers central limit theorem in the independent distribution ; with the different distribution of both cases, it made more systematic exposition, and revealed the phenomenon of the random nature of the most fundamental an average of the results of the Stability . Trough the central limit theorem discussion it will give out the random variables and the distribution of the normal distribution .About the law of large numbers, there are more comprehensive analysis and described several of the most commonly used on it. The content of the same central limit theorem also discussed the independent distribution and independent distribution of the two different perspectives. Also, it will discussed the relationship between the variety of narrative and the law of large numbers between their respective central limit theorem, and that of the law of large numbers and the central limit theorem. At the same time, it demonstrated the relationship between the two aspects through lots of anti-related examples. Finally ,it gave out several aspects of application of a number of simple law of large numbers and the central limit theorem in mathematical statistics, error, lottery school, the approximate calculation, and the insurance industry and mathematical analysis, to further clarify the law of large numbers and the central limit theorem in all branches of the important role and value.Keywords: Random variables ; Law of large numbers; Central limit theorem; Application目录摘要 (I)Abstract (II)第1章引言 (1)第2章大数定律及其证明 (2)2.1 几个相关定义 (2)2.2 大数定律及其证明 (4)第3章中心极限定理 (8)3.1 中心极限定理的提法 (8)第4章大数定律与中心极限定理的关系 (11)4.1 服从大数定律, 但不服从中心极限定理 (11)4.2 服从中心极限定理, 但不服从大数定律 (12)4.3 大数定律与中心极限定理都不服从 (13)4.4 大数定律、中心极限定理都服从 (13)第5章应用 (14)5.1“概率”及“数学期望”的确切定义 (14)5.2 解释测量(随机) 误差 (14)5.3 在数学分析中的应用 (15)5.4 在计算精确的近似概率方面的应用 (16)5.5 在彩票和保险业的应用 (17)结语 (20)参考文献 (21)致谢 (22)附录 (23)第1章引言概率论与数理统计是研究随机现象的统计规律的科学,而随机现象的统计规律性只有在相同条件下进行大量重复试验或观察才呈现出来. 从概率的统计定义中可以看出:一个事件发生的频率具有稳定性,即随着试验次数的增多,事件的频率逐渐稳定在某个常数附近. 人们在实践中观察其他一些随机现象时,也常常会发现大量随机个体的平均效果的稳定性. 这就是说,无论个别随机个体以及它们在试验进行过程中的个别特征如何,大量随机个体的平均效果与每一个体的特征无关,且不再是随机的. 深入考虑后,人们会提出这样的问题:稳定性的确切含义是什么? 在什么条件下具有稳定性? 这就是大数定律要研究的问题.众所周知,中心极限定理是概率论中最重要、最基本的一个定理.中心极限定理揭示了离散型随机变量与连续型随机变量之间的内在联系, 为用连续型随机变量的分布,特别是标准正态分布对离散型随机变量进行概率计算提供了理论基础.基于中心极限定理的概率统计方法在生活中的应用,本文利用中心极限定理,分析了保险业和近似计算中的应用.第2章 大数定律及其证明2.1 几个相关定义定义1[1] 设n (1,2,)n ξ=为概率空间(,,)F P Ω上定义的随机变量序列(简称随机序列),若存在随机变数ξ,使对任意0ε>,恒有:lim {}0n n p ξξε→∞-≥=或lim {}1n n p ξξε→∞-≤=, 则称随机序列{}n ξ概率收敛于随机变量ξ(ξ也可以是一个常数),并用下面的符号表示:lim ()n n p ξξ→∞=或p n ξξ−−→. 定义 2[2][6][8] 设{}n ξ为随机变量序列, 数学期望n E ξ存在()1n ≥,如果对任意的0ε>.恒有:1111lim (())1n n i i n i i p E n n ξξε→∞==-<=∑∑, 则称随机变量序列{}n ξ服从大数定律. 定义 3 设{}n ξ为随机变量序列, 如果存在常数序列{}n a .对任意的0ε>.恒有:11lim ()1ni n n i p a n ξε→∞=-<=∑, 则称随机变量序列{}n ξ服从大数定律. 注:定义2和定义3两种大数定律定义的讨论所谓大数定律, 它是揭示大量随机现象的平均结果稳定于平均值的极限理论.而大量随机现象即{}n ξ的平均结果是11n i i n ξ=∑(n 充分大),其平均值是11()ni i E n ξ=∑.因此, 从这一角度来考虑,定义2是恰当的.定义3与定义2的不同点在于它并不要求随机变量n ξ的期望n E ξ存在(1n ≥),只要存在常数序列{}n a ,使对任意的0ε>.恒有11lim ()1ni n n i p a n ξε→∞=-<=∑即可.为了弄清这两种定义的异同,我们必须讨论数列{}n a 与数列{11()ni i E n ξ=∑}之间的关系. 首先,当n E ξ(1n ≥)存在时,我们不难证明:0δ∀>,11lim (())0nn i n i p a E n ξδ→∞=-≥=∑这个结果表明在n E ξ(1n ≥)异存在时,只需取11()nn i i a E n ξ==∑,(1n ≥).此时, 定义2 与定义3 是等价的.其次,当n E ξ(1n ≥)不存在时, 由定义2知{}n ξ不服从大数定律, 而此时, 存在常数列{}n a 使定义3仍然成立.综合上述定义2与定义3不是等价的.定义3不仅在形式上而且在内涵上比定义2更广泛.定义 4[3] 设{()}n F x 是分布函数序列,若存在一个非将函数()F x ,对于它的每一连续点x ,都有lim ()()n n F x F x →∞=,()()w n F x F x −−→,则称分布函数序列{()}n F x 弱收敛于()F x .定义5 设n ()(1,2,)F x n =, ()F x 分别是随机变量(1,2,)n n ξ=及ξ的分布函数,若()()w n F x F x −−→,则称{}n ξ依分布收敛于ξ,亦记为L n ξξ−−→,且有:(1)若p n ξξ−−→,则L n ξξ−−→; (2)设c 为常数,则p n c ξ−−→的充要条件是L n c ξ−−→. 逆极限定理:设特征函数列{()}n f x 收敛于某一函数()f t ,且()f t 在0t =时连续,则相应的分布函数列{()}n F x 弱收敛于某一分布函数()F x ,而且()f t 是()F x 的特征函数.车比雪夫不等式[4]:设ξ是一个随机变量,它的数学期望为a ,方差为2σ,则对任意的正常数ε恒有:22{},p a σξεε-≥≤ (2-1) 或有22{}1p a σξεε-<≥- (2-2)称(2-1)式或(2-2)式为车比雪夫不等式.以下就连续型随机变量来证明这个不等式.证 设的密度函数为()f x ,则有222()()()()()x EX x EX DX x EX f x dx x EX f x dx f x dx εεε+∞-∞-≥-≥=-≥-≥⎰⎰⎰{}22()x EX f x dx P x EX εεεε-≥==-≥⎰,于是 {}2DXP x EX εε-≥≤这个不等式可解释为:对任意给定的正常数ε,可以作为两个区间(,)a ε-∞-和(,)a ε++∞.(1)式表示,在一次试验中,随机变量ξ的取值落在(,)(,)a a εε-∞-⋃++∞的概率小于等于22σε.不等式说明DX 越小,则X 的取值越集中在EX 附近.这进一步说明了方差是反映随机变量取值的离散程度的.2.2 大数定律及其证明大数定律形式有很多,我们仅介绍几种最常用的大数定律.定理1[5][6] (车比雪夫大数定律)设随机变量12n ,,,,ξξξ相互独立,它们的数学期望依次为12n ,,,,a a a ,方差依次为22212,,,,n σσσ而且存在正常数k ,使得对一切1,2,i =有2i k σ<,则对任意给定的正常数ε,恒有1111lim {}1n ni i n i i p a n n ξε→∞==-<=∑∑ 证 设11ni i n ξξ==∑,则ξ的数学期望和方差分别为: 111111n n n i i i i i i E E E a n n n ξξξ===⎛⎫=== ⎪⎝⎭∑∑∑,222111111n nn i i i i i i D D D n n n ξξξσ===⎛⎫=== ⎪⎝⎭∑∑∑ 由车比雪夫不等式,对任意给定的正数ε,有11111{}n ni i i i p a n n ξε==≥-<∑∑=22221222{}1111n ii D p E nk n k n n σξξξεεεεε=-<≥-=->-=-∑ 即 211111{}1n ni i i i p a k n n n ξεε==≥-<=-∑∑. 对不等式取极限,则得1111lim {}1n ni i n i i p a n n ξε→∞==-<=∑∑ 车比雪夫大数定律表明,在一定条件下,当n 充分大时,n 个随机变量的算术平均值11n i i n ξ=∑偏离其数学期望的可能性很小.这也正是用一系列测量值的平均值来近似代替真值的做法的原则.推论 1 设随机变量12n ,,,,ξξξ相互独立,且它们具有相同的分布及有限的数学期望和方差:E a ξ=,2(1,2,)D i ξσ==,则对任意给定的正数ε,有11lim {}1ni n i p a n ξε→∞=-<=∑. 此推论证明:n 个相互独立的具有相同数学期望和方差的随机变量,当n 很大时,它们的算术平均值几乎是一个常数,这个常数就是它们的数学期望.定理 2[7] (辛钦大数定律)设12n ,,,,ξξξ是相互独立的随机变量,而且有相同是的分布,具有有限的数学期望k ,(1,2,)E a k ξ==,则对任意给定的0ε>,有11lim {}1nk n k p a n ξε→∞=-<=∑. 注:定理2中条件比定理1中的条件要宽,在定理1中要求方差有限,而定理2不需要这个条件.辛钦大数定律说明独立同分布的随机变量的算术平均值依概率收敛于它的数学期望值,它为在实际应用中用算术平均值估计数学期望提供了理论依据.证 因为12n ,,,,ξξξ是具有相同分布的随机变量序列,故它们有相同的特征函数.设它们的特征函数为()f t ,由于k E ξ存在,故()f t 有展开式:'()(0)(0)()1()f t f f t t iat t οο=++=++,其中()t ο表示关于t 的高阶无穷小量.再由独立性知,11n k k n ξ=∑的特征函数为:1n nt t t f ia n n n ο⎡⎤⎡⎤⎛⎫⎛⎫=++ ⎪ ⎪⎢⎥⎢⎥⎝⎭⎝⎭⎣⎦⎣⎦.对任意取定的数t ,有lim lim 1n niat n n t t t f ia e n n n ο→∞→∞⎡⎤⎡⎤⎛⎫⎛⎫=++= ⎪ ⎪⎢⎥⎢⎥⎝⎭⎝⎭⎣⎦⎣⎦.而iat e 是连续函数,且是单点分布的特征函数,由逆极限定理知:11nk k n ξ=∑的分布函数弱收敛于()F x .其中,1,(),0,x a F x x a >⎧=⎨=⎩因此,11,n L k k a n ξ=−−→∑由(2)式知:11n P k k a n ξ=−−→∑. 定理 3[8] (贝努利大数定律)设n μ是n 次独立试验中事件A 发生的次数, p 是事件A 在每次试验中发生的概率,则对任意给定的正数ε,有lim {}1n n p p n με→∞-<= 或 lim {}0n n p p n με→∞-≥=证 令 0,1,2,1n k A Y k k A ⎧==⎨⎩第试验不发生,,第试验发生.显然12n n Y Y Y μ=+++,由于各次试验是独立的,从而12,,,,n Y Y Y 相互独立,又k Y 服从参数为P 的两点分布,所以(),()(1),(1,2,)k k E Y P D Y P P k ==-=. 由定理1有 lim {}1n n p p n με→∞-<=.此定理表明:当n 很大时, n 重贝努利试验中事件A 发生的频率几乎等于事件A 在每次试验中发生的概率,这个定理以严格的数学形式刻画了频率的稳定性,因此,在实际应用中,当试验次数很大时,便可以用事件发生的频率来代替事件的概率.证 作一次观察时n μ是定值, 作多次观察时n μ是随机变量,而且(,),nB n p μ因此:n E np μ=,n D npq μ=,()n E n p μ=,()n D n pq n μ=. 在车比雪夫不等式中,取 n n ξμ=,则a p =,2pq n σ=,于是对任意给定的正数ε,有21{}11()npq p p n n n μεε≥-<≥-→→∞,因而lim {}1n n p p nμε→∞-<=. 定理 4 (泊松大数定律)设12n ,,,,ξξξ是相互独立的随机变量, P{1}n n P ξ==, P{0}n n q ξ== (其中n P 1n q =-) ,则{}n ξ服从大数定律.证 由定理所设可得:11E()nn i n i P P n ξ===∑, 2221111111()()24n n n n n n i i i i i i P q D D Pq n n n nξξ===+⎛⎫==≤= ⎪⎝⎭∑∑∑. 由车比雪夫不等式得,对任意0ε>,有22()10{} 4n n n D P P n ξξεεε≤-≥≤≤. 两边取极限,得lim {}0n n n P P ξε→∞-≥=. 泊松大数定律是贝努利大数定律的推广, 贝努利大数定律证明了事件在完全相同条件下重复进行的随机试验中频率的稳定性;而泊松定理表明,当独立进行的随机试验的条件变化时, 频率仍然具有稳定性:随着n 的无限增大,在n 次独立试验中,事件 A 的频率趋于稳定在各次试验中事件A 出现概率的算术平均值附近.定理5[9][10] 马尔可夫(Marrkov) 大数定律)设{}k ξ是随机变量序列,若211lim ()0nk n k D n ξ→∞==∑,则对任意>0ε,均有1111lim {}1n nk k n k k p E n n ξξε→∞==-<=∑∑,即{}k ξ服从大数定律. 证 车比雪夫不等式得212111()111{}1nk n nk k k k k D n p E n n ξξξεε===≥-<≥-∑∑∑,取极限得:1111lim {}1n nk k n k k p E n n ξξε→∞==-<=∑∑注:车比雪夫大数定律可又马尔可夫大数定律推出,更重要的是马尔可夫大数定律已经没有任何关于独立性的规定.第3章 中心极限定理直观上,如果一随机变量决定于大量(乃至无穷多个)随机.因素的总合,其中每个随机因素的单独作用微不足道,而且各因素的作用相对均匀,那么它就服从(或近似地服从)正态分布,下面我们将按严格的数学形式来表述这一直观.3.1 中心极限定理的提法定理 6[3][11] (林德贝格——列维定理(Lindeberg-Levy)中心极限定理) 设随机变量12,,ξξ是一列独立同分布的随机变量,并且具有数学期望k E a ξ=和方差22(0),1,2,k D k ξσσ=>=,则对任意实数x ,有22lim ()t n k xn na P x e dt x ξ--∞→∞⎛⎫- ⎪⎪<==Φ⎪⎪⎝⎭∑(3-1) 证 设k a ξ-的特征函数为()t ϕ,1nknk naξ=-=∑的特征函数为nϕ⎡⎤⎢⎥⎣⎦又因为()()20,k k E a D a ξξσ-=-=,所以'''2(0)0,(0)ϕϕσ==-于是特征函数()t ϕ有展开式:2'''22221()()(0)(0)()1()22t t t t t t t ϕϕϕϕοσο=+++=-+,从而对任意固定的t ,有22221(),2nn tt t e n nn ϕο-⎡⎤⎡⎤=-+→→∞⎢⎥⎢⎥⎣⎦⎣⎦ 而22t e -是()0,1N 分布的特征函数,因此由特征函数的连续性定理即知(3-1)成立,定理得证.定理6又称独立同分布的中心极限定理,它表达了正态分布在概率论中的特殊地位,尽管k ξ的分布是任意的,但只要n 充分大,随机变量nknaξ-∑近似服从标准正态分布(0,1)N .或者说,当n 很大时,独立同分布的随机变量k ξ的和1nk k ξ=∑ 近似地服从正态分布2(,)N n n μσ.这就是那些(可以看作有许多微小的、独立的随机因素作用的总结果,而每一个因素的影响却都很小)随机变量,一般都可以近似地服从正态分布的理论依据,因而正态分布在理论上和应用上都具有极大的重要性.若(,)B n p ξ,则当n 很大时,有()P a b ξ⎛⎫⎛⎫≤≤≈Φ-Φ 定理 7 (棣莫弗—拉普拉斯(De Moivre-Laplace)中心极限定理) 设随机变量n η服从二项分布(,)B n p ,则对于任意区间[,]a b ,恒有22lim t nk b a n na P a b dt ξ-→∞⎛⎫- ⎪ ⎪≤<= ⎪⎪⎝⎭∑⎰二项分布的极限分布是正态分布 即如果(,)X B n p ,则22()()t nk b ana P a b dt b a ξ-⎛⎫- ⎪ ⎪≤<≈=Φ-Φ ⎪⎪⎝⎭∑⎰一般地,如果(,)X B n p ,则()P a X b P ⎛⎫≤<=≤<≈Φ-Φ说明:这个公式给出了n 较大时二项分布的概率计算方法. 引理 设12,,ξξ是独立随机变量序列,又k k E a ξ=,2(1,2,)k k D k ξσ==,221nnk k B σ==∑,这时:(1) 若{}k ξ是连续型随机变量,密度函数为{}()n P x ,如果对任意0τ>,有2211lim ()()0k n nk k x a B n k n x a P x dx B τ->→∞=-=∑⎰(2) 若{}k ξ是离散型随机变量,k ξ的分布列为(),1,2,n nj nj P x P j ξ===,如果对任意0τ>,有()2211lim 0nj k nnnj k kj n k x a B n x a P B τ→∞=->-=∑∑则称{}k ξ满足林德贝尔格条件.定理 8 (林德贝格定理) 设独立随机变量序列12,,ξξ满足林德贝尔格条件,则当时,对任意的,有()2211lim y n xk k n k n P a x e dy B ξ--∞→∞=⎛⎫-<=⎪⎝⎭∑这个定理证明了由大量微小而且独立的随机因素引起并积累而成的变量,必将是一个正态随机变量,由林德贝尔格条件可看到定理并不要求各个加项“同分布”,因而它比前述的林德贝尔格——勒维定理更强,事实上林德贝尔格——勒维定理可以由它推出.定理 9 (李雅普诺夫定理) 设12,,ξξ是独立随机变量序列,又k k E a ξ=,2(1,2,)k k D k ξσ==,记221nnk k B σ==∑,若存在0δ>,使有22110,nkkk nE a n B δδξ++=-→→∞∑,则对任意的实数x ,有()2211lim y n xk k n k n P a x e dy B ξ--∞→∞=⎛⎫-<= ⎪⎝⎭∑定理9又称独立非同分布的中心极限定理,李雅普诺夫定理可以解释如下:假定被研究的随机变量可以表示为大量独立随机变量的总和,且总和中的每个单独的随机变量对于总和又不起主要作用,那么可以认为这个随机变量近似地服从正态分布.讨论了独立随机变量和的分布的极限问题,在一定条件下,这些分布弱收敛于退化分布,这就是大数定律.凡是在一定条件下断定随机变量之和的极限分布是正态分布的定理,在概率论中统称为中心极限定理.具体一点说,中心极限定理回答的是(独立或弱相依)随机变量之和的极限分布在什么条件下是正态的.中心极限定理是揭示产生正态分布的源泉,是应用正态分布来解决各种实际问题的理论基础.第4章 大数定律与中心极限定理的关系概率论中关于独立随机变量序列的极限理论, 已相当完整, 各种问题已有了令人满意的回答,但由于一般教材中, 特别是工科教材, 只介绍一、二个最简单的基本定理,若弱大数定律只介绍切比契夫定理的特殊情况, 中心极限定理只介绍同分布的林德贝格——列维定理(Lindeberg-Levy)的特殊情况——德莫弗—拉普拉斯(De Moivre-Laplace)定理.仅少数教材提及林德贝格条件. 这几个定理的条件又都是充分条件, 我们容易产生这样的问题: 大数定律与中心极限定理之间究竟有什么关系? 服从大数定律的是否服从中心极限定理? 反之又如何? 是否有两者都服从或都不服从的随机序列?因教材知识所限, 这些问题不太好回答, 现拟补充几个定理, 以简单的例子加以说明.定理10[12] (格涅坚克定理) 设有相互独立的随机变量序列{}k ξ, 则对0ε∀>,11lim {()}1n k k n k p E n ξξε→∞=-<=∑的充要条件是2221()lim []0()nk k n k k kE E n E ξξξξ→∞=-=+-∑. 定理11 (马尔科夫定理) 随机变量序列{}k ξ, 若211()0nk k D n ξ=→∑,则对0ε∀>, 有11lim {()}1nk k n k p E n ξξε→∞=-<=∑. 定理12 (费勒定理) 对相互独立随机变量序列{}k ξ, 若∃常数n M ,使1max k n k nM ξ≤≤≤,且lim0nn nM B →∞=, 则{}k ξ服从中心极限定理.设{}k ξ为相互独立的随机变量序列, 以下在,,()k k j k j P P ξα==中, 令,,,k j k j P α取不同的值, 以说明不同的情形.4.1[12][13]服从大数定律, 但不服从中心极限定理令(),1,1210,121k k P k α==-+,(),2,221,21k k k P k α==+,(),3,321,21k k k P k α==+,1,2,3,k =,即()21(0)11k P k ξ==-+,()21()()21k k P k P k k ξξ===-=+可知0,k E ξ=()2221k k k D E k ξξ==+,()222111n nnk k k k B D k ξ====+∑∑因222110,n B n n n n<⋅→→∞, 由马尔科夫定理知, 大数定律成立, 但中心极限定理不成立. 这是因为12111(0)(0,0,,0)(0)(0)n nk n k k k k k P P P P ξξξξξξ∞==========≥=∑∏∏()2111(1)021nk k ==-=>+∏ 若服从中心极限定理,则取120,0x x <>,有22211211()t n x k x k n P x x e dt B ξ-=<<=∑, 当12,x x 充分靠近 0 时222112t x x e dt -<⎰. 这就出现了矛盾. 所以中心极限定理不成立. 4.2 服从中心极限定理, 但不服从大数定律取,,()k k j k j P P ξα==,为1()2k P k ξ==,1()2k P k ξ=-=,1,2,,k =可知0,k E ξ=2k D k ξ=,221nnk B k ==∑, 又 3333322221(1)(1)lim lim lim 3(1)n n n n n nn n n n n B B B n →∞→∞→∞++-+-===-+, 即 313223lim lim 13n n n nn nB B -→∞→∞==,()12133lim1n nn B -→∞=又 1ax k k nM n ξ≤≤≤,()1213limlim 03n n n n n B n →∞→∞-== 则由费勒定理知中心极限定理成立, 但不服从大数定律, 这是因为2()xx R n x∈+, 为凸函数, 由琴生不等式222222222()k k k k E k E n n E n kξξξξ≥=+++, 而 222222111111,244nnn k k k k k n k n n k n n n n ===+≥==→→∞++∑∑∑ 由格涅坚克定理知, {}k ξ不服从大数定律.4.3 大数定律与中心极限定理都不服从取,,()k k j k j P P ξα==,为1(2)2k k P ξ==,1(2)2k k P ξ=-=,可知0,k E ξ=4k k D ξ=, 21144(41)3nnk n nk k k B D ξ=====-∑∑, 当 n 充分大时24n nB >,即2n n B > 21112222(21)2nnn n n kk k k ξξ+==≤≤+++=-<∑∑ , 112nk k n B ξ=<∑故11lim (2)1(2)(2)1nk n k n P B ξ→∞=<=≠Φ-Φ-<∑ 可知不服从中心极限定理, 又22222222111144()44k knn n nk k k nk k k k k k E E n n E n n ξξξξ====≥=>++++∑∑∑∑ 22111444(41),4433nk n nn k n n n ===⋅-→→∞++∑, 由格涅坚克定理知不服从大数定律.4.4 大数定律、中心极限定理都服从若{}k ξ为同分布且有有限期望及大于零的方差, 则由教材中定理易知两者都服从.这时有11lim (())1nk k n k P E n ξξε→∞=-<=∑.但括号中的事件概率, 究竞有多大? 大数定律未能回答. 而根据中心极限定理有22111(())()x n nk k k kk x P E P E e dx n ξξεξξσ-==≤-<=-<≈∑其中2k D σξ=, 这样看来在所假定的条件下, 中心极限定理比大数定律更精确.第5章 应用大数定律以严格的数学形式表达了随机现象最根本的性质——平均结果的稳定性,它是随机现象统计规律性的具体表现. 因此,大数定律在理论和实际中都有广泛的应用.5.1[3] “概率”及“数学期望”的确切定义在给出二者定义时,都采用“稳定”一词,这是一种不确切的描述.依据大数定律可给出更确切的表达,即:概率——独立重复实验中,事件A 出现的频率11n Pi i P n ξ=−−→∑,则该常数P 即为概率.数学期望——对于任一0ε>,有11lim ()1ni n i p n ξμε→∞=-<=∑,则()k E μξ=称为数学期望.5.2 解释测量(随机) 误差根据大数定律,对于随机误差12,,,n δδδ,应有110n Pi i n δ=−−→∑.这说明当测量次数较多时, 实测数据的平均值11ni i a n δ=+∑和预测真值a 的差值能以很大概率趋于0,因此,用求样本数据平均值的方法来进行测量是可行的.例1[14] 某种仪器测量已知量A 时,设n 次独立得到的测量数据为12,,,n x x x ,如果仪器无系统误差,问:当n 充分大时, 是否可取作为仪器测量误差的方差的近似值?解 把(1,2,,)i x i n = 视作n 个独立同分布的随机变量的观察值,则()i E x μ=,2(),(1,2,,)i D x i n σ==.仪器第i 次测量的误差i x A -的数学期望()i E x A A μ-=-,方差2()i D x A σ-=.设2(),1,2,,i i Y x A i n =-=,则i Y 也相互独立服从同一分布.在仪器无系统误差时()0i E x A -=,即有A μ=,222()()()()(1,2,,)i i i i i E Y E x A E x Ex D x i n σ⎡⎤⎡⎤=-=-===⎣⎦⎣⎦由车比雪夫定律,可得: 211lim {}1ni n i p Y n σε→∞=-<=∑即 ()2211lim {}1n i n i p x A n σε→∞=--<=∑从而确定,当n →∞时,随机变量()211n i i x A n =-∑依概率收敛于2σ,即当n 充分大时可以取()211n i i x A n =-∑作为仪器测量误差的方差. 5.3 在数学分析中的应用例2[1] 假设()22212121,,,:,0,,12n n n n n G x x x x x x x x ⎧⎫=+++≤≤≤⎨⎬⎩⎭,求其极限.解 假设随机变量(1,2,)n n ξ=在[]0,1上有均匀分布,而且相互独立,有112D ξ=,2112E ξ=,易见(){}22111,,2n n n n n G n dx dx P G P ξξξξ⎧⎫=∈=++≤⎨⎬⎩⎭⎰⎰()()222222211111111111266n nni i P P E P E n n n ξξξξξξξ=⎧⎫⎧⎫⎧⎫=++≤=++-≤≥-≤⎨⎬⎨⎬⎨⎬⎩⎭⎩⎭⎩⎭∑由1,,n ξξ独立同分布,可见221,,,n ξξ独立同分布.根据辛钦大数定律知:2111lim ()16n i i n i p E n ξξ→∞=-≤=∑从而1lim 1n n G n dxdx →∞=⎰⎰.例3 用概率方法证明维尔斯特拉斯[weierstrass ]定理.假定()f x 在闭区间[],a b 上是连续的,那么,存在一列多项式12(),(),B x B x ,一致收敛于函数()f x ,[],x a b ∈.证 不妨设0,1a b ==.假设()f x ,[]0,1x ∈是连续函数,那么()f x 在[]0,1上一致连续并且有界.对于任意[]120,0,0,1x x ε>≤∈存在0δ>,使12()()2f x f x ε-<,只要12x x ε-<.此外,对于一切01x ≤≤,有()f x k ≤(常数).现在,建立一多项式:0()(1)nm m n m n n n m m B x Ef f C x x n n ξ-=⎛⎫⎛⎫==- ⎪ ⎪⎝⎭⎝⎭∑,其中n ξ服从二项分布, 参数为1n ≥, 而[]0,1x ∈, 显然(0)(0)n B f =,(1)(1)n B f =.由贝努利大数定律知()limnn x P nξ→∞=,[]0,1x ∈现在证明()n n B x f n ξ⎛⎫= ⎪⎝⎭一致收敛于()f x ,[]0,1x ∈.由于0(1)1nm mn m nm C x x -=-=∑,可见()()0()(1)nm mn m n n m m B x f x f f x C x x n -=⎡⎤⎛⎫-=-- ⎪⎢⎥⎝⎭⎣⎦∑,由此可得:()()0()(1)nm mn mn n m m B x f x f f x C x x n -=⎛⎫-≤-- ⎪⎝⎭∑()()(1)(1)m m n m m m n m n n mmx x nnm m f f x C x x f f x C x x n n δδ---<-≥⎛⎫⎛⎫=--+-- ⎪ ⎪⎝⎭⎝⎭∑∑2(1)222m m n m n n mx nkC x x kP x n δεεξδ--<⎧⎫<+-=+-≥⎨⎬⎩⎭∑. 由于对任意[]0,1x ∈,Pnx n ξ−−→可见存在N ,使当时n N ≥,4n P x n kξεδ⎧⎫-≥≤⎨⎬⎩⎭ 从而,当n N ≥时,对于一切[]0,1x ∈,有:()()22422n B x f x k kεεεεε-<+=+=.即()n B x 关于[]0,1x ∈一致收敛于()f x .5.4 在计算精确的近似概率方面的应用例4[15] 现有一大批种子,其中良种占1/6 ,今在其中任选6000 粒,试分别用切比雪夫不等式估计和用中心极限定理计算在这些种子中良种所占的比例与1/6之差小于1%的概率是多少?解 设取出的种子中的良种粒数为X ,则1(6000,)6XB 于是1600010006EX np ==⨯= 155(1)60001000666DX np p =-=⨯⨯=⨯(1) 要估计的规律为{}1110006060006100X P P X ⎧⎫-<=-<⎨⎬⎩⎭相当于在切比雪夫不等式中取60ε=,于是{}21110006016000610060X DX P P X ⎧⎫-<=-<≥-⎨⎬⎩⎭由题意得 25111100010.23150.76856063600DX -=-⨯⨯=-= 即用切比雪夫不等式估计此概率不小于0.7685.(2) 由拉普拉斯中心极限定理,对于二项分布1(6000,)6B ,可用正态分布5(1000,1000)6N ⨯近似, 于是所求概率为{}11940106060006100X P P X ⎧⎫-<=<<⎨⎬⎩⎭ 2(2.0785)10.9625≈Φ-Φ≈Φ-≈ 从本例看出:用切比雪夫不等式只能得出来要求的概率不小于0.7685,而用中心极限定理可得出要求的概率近似等于0.9625.从而知道由切比雪夫不等式得到的下界是十分粗糙的.但由于它的要求比较低,只要知道X 的期望和方差,因而在理论上有许多运用.当i X 独立同分布(可以是任何分布),计算1()n P a X X b <++≤的概率时,利用中心极限定理往往能得到相当精确的近似概率,在实际问题上广泛运用.5.5[16][17] 在彩票和保险业的应用大数定律和中心极限定理是概率论中两类具有极大意义的重要定理. 大数定律证明了在大样本条件下,样本平均值可以看作是总体平均值(数学期望) ,它是“算术平均值法则”的理论基础;中心极限定理比大数定律更为详细具体,它以严格的数学形式阐明了在大样本条件下,不论总体的分布如何,样本均值总是近似的服从正态分布. 正是这个结论使得正态分布在数理统计和误差分析中占有特殊的地位,是正态分布得以广泛应用的理论基础. 本文通过对彩票学和保险业等几个具体事例的引用展现了大数定律和中心极限定理的实际应用.大数定理在实际生活中应用十分广泛,我们现在以生活中最平常的但都很感兴趣的事情——彩票为例来详细阐述一下大数定理在彩票学中的应用.我们知道概率论是研究现实世界随机现象的科学,是近代数学的重要组成部分. 它在自然科学以及经济工作中都有着广泛的应用,同时也是数理统计的基础. 彩票投注的中奖概率分布完全符合它的原理. 彩票的投注方法是一个玩数字游戏. 彩票号码的摇出是随机事件,也可以说是一随机现象,属概率论的一个基本概念. 首先我们应该先清楚什么是随机现象? 我们说随机现象的特点是:事先不能预言其结果,具有偶然性;另一方面,在相同条件进行大量的重复试验,会呈现出某种规律性(特别是随机开奖次数的不断增多).例如:在相同条件下,多次抛掷质量均匀的同一枚硬币,则出现正面向上的次数约占总抛次数的一半,而且随着抛掷次数的增加,正面向上次数是总抛次数的12.这就是概率论的统计结果.(请看下面5次抛币的试验结果)有人曾经做过抛掷硬币的试验,试验结果记录如下:投掷次数N,正面向上次数M.N M=M0.5181N=1061=2048N M=N=2048=4040M0.5069N M=M0.5016=12000N=6019N M==24000M0.5005N=12012N M=M0.4996N=14984=30000N M=M0.5011N=36124=72088由上述情况可以看出投掷次数很大时,其频率稳定于0.5彩票每期摇出的中奖号码(基本号码和特别号码)是一个随机事件,既然是随机事件,必有其分布规律.1. 2001010期至2001023期“上海风采”电脑福利彩票开奖计14期共摇出14*8112=个球.2. 每个球平均出现3.6次3. 奇数出现59次;偶数出现53次4. 小于或等于15的数47次;大于或等于16的数出现65次由此,我们引入彩票的一对常用语“冷门号码”及“热门号码”.有了“冷门号码”及“热门号码”,我们只要扑捉到这种机会,将会提高中奖纪律.概率分布的四条法则:1. 奇数.偶数出现的次数应占总数的12(由于不确定因素除外).2. 大数.小数出现的次数应占总数的12(由于不确定因素除外).3. 1-10区段,11-20区段,21-31区段,三区段出现的数个占总数的13(由于不确定因素除外).4. 各数出现的次数,随着实验(开奖)次数的增加不断靠近平均值(由于不确定因素除外).综上所述,随机的摇球事件随着实验(开奖)次数的增加都会显示出它的某些规律性,而这种规律性可以借助概率论的知识,利用小概率统计法,分析判断号码.通过数字统计,运用概率论原理来判断冷热号码出现的周期. 分析号码可能出现的区段. 缩小精选号码范围. 为新一期选择号码提供参考依据,从而达到提高中奖得率.实际上,对于彩票而言,也不是完全没有规律可循,只要经过大量的观察,根据大数定律就可以进行统计预测,提高中奖的几率. 概率论是一门系统学科,一般人了解的概率,不是从理论上认识,仅仅限于经验. 时间的表层认识. 与其硬着头皮去盲目猜测,不如运用简单的概率学统计分析方法更简单,更容易掌握. 把每期中奖号码出现的次数累加起来,一一进行统计,累计到一定量后,就能发现奖项及其相关指标的概率波动特性. 彩民再根据这些进行选号投注,就可以大大提高中奖几率.中心极限定理指出:如果一个随机变量有众多的随机因素所引起,每个因素在总的变化里起着不大作用,就可以推断描述这个随机现象的随机变量近似的服从正态分布,所以要求随机变量之和落在某个区间上的概率,只要把它标准化,用正态分布作近似计算即可. 中心极限定理还及时了离散型随机变量与连续型随机变量的内在联系,即离散型随机变量的极限分布是正态分布.中心极限定理对保险业更是具有指导性的意义,一个保险公司的亏盈,是否破产,我们通过学习中心极限定理的知识都可以做到估算和预测. 大数定律是近代保险业赖以建立的基础. 根据大数定律中心极限定理,我们知道承保的危险单位越多,损失概率的偏差越小,反之,承保的危险单位越少,损失概率的偏差越大. 因此,保险人运用大数法则就可以比较精确的预测危险,合理的拟定保险费率. 下面我们以一道具体的有关保险业的实例来阐述一下大数定律和中心极限定理在保险业中的重要作用和具体应用.例 5 已知在某人寿保险公司里有10000个同一年龄段的人参加保险,在同一年里这些人死亡率为0.1% ,参加保险的人在一年的头一天交付保险费10元,死亡是家属可以从保险公司领取2000元的抚恤金. 求保险公司一年中获利不少于40000 元的概率;保险公司亏本的概率是多少?解 设一年中死亡的人数为x 人. 死亡概率为0.001P = ,把考虑10000人在一年里是否死亡看成10000重贝努里试验,保险公司每年收入为10000*10100000= 元,付出2000x 元.(1) P (保险公司获利不少于40000 元){}(1000002000)40000P x =->=。
大数定理和中心极限定理的区别和联系
大数定理和中心极限定理的区别和联系大数定理和中心极限定理的区别和联系大数定理:不论n趋向于多少,不论n的什么分布趋向于x,总存在一个与n成正比例的常数C,使得A(x)=sup{frac{x}{n}|xin[0,1]:A(x)leq C}。
中心极限定理:设A是一个无穷数列,如果存在一个a>0,并且满足: 1forall xin A, Ax=c|xleq A|,则称x是A的中心极限点。
定义:如果A是一个实数集合,其上大于等于n的所有中心极限定理都成立,这时候称为大数定理。
大数定理中“不论n趋向于多少,不论n的什么分布趋向于x”这句话的证明1、()对任意n, A(一个集合), n的什么分布(极限点)存在,且为A的中心极限点。
2、()在大数定理中,关键是证明a>0, a为一个常数。
3、()解决大数定理和中心极限定理的相互转化,证明方法如下:用中心极限定理证大数定理,反过来用大数定理证中心极限定理。
大数定理的关键:寻找极限点,这里的极限点就是中心极限点。
中心极限定理的关键:证明大数定理,即找到大数定理的极限点。
注意事项: 1、要特别注意有两个关键点:一是当n趋向于某一值时,要找出这个点是否是A的中心极限点;二是当n越趋向于无穷时,要想办法证明极限点是否存在。
2、在大数定理的证明过程中,应用到了函数的单调性、极限、中心极限定理,因此在整个证明过程中,一定要掌握好这三者之间的相互关系。
3、掌握好单调性,要注意记住定义域、单调性判别法和大数定理这三者之间的关系,以及定义域和单调性之间的相互转化。
4、掌握好极限,在证明大数定理时,最好结合几何图形来做,这样可以加深理解。
例题:设有集合B满足X_n=lim_{ktoinfty} (X_k)_n=0,则n>0是的充分条件是。
证明:在定义域内找极限点,那么大于0的定义域内的极限点只有一个,所以x=0,所以x是B的极限点,因为: B-A=0,则: A-B=0,则:A-C=0,因为: A+C=0, A+C+D=0,所以: A-C+D=0,则: A-C=0。
大数定律和中心极限定理的区别与联系
大数定律和中心极限定理的区别与联系大数定律与中心极限定理有什么区别和联系?对比这两个概念,我们会发现它们之间存在着密切的关系。
其实,大数定律是在前人研究的基础上得出的,从更深层次的角度来讲,中心极限定理也有自己的内涵。
大数定律与中心极限定理的联系与区别中心极限定理:1、大数定律是关于偶数个变量, n个变量连续变化,且n≥2的变量函数f(x)的极限存在的定理,它主要讨论函数f(x)的定义域及对x的依赖性,其主要推论如下:①大数定律不仅适用于任意正实数R,也适用于任意负实数R; ②大数定律在大于等于0的开区间内成立; ③大数定律在等于0的闭区间上的任何一点都成立;④一般地,大数定律只是关于偶数个变量, n个变量连续变化,且n≥2的变量函数f(x)的极限存在的定理。
2、中心极限定理是一种极限计算方法,它可以把一个复杂问题的局部计算过程,表示为分布在全局的、处处有界的近似计算过程的集合。
它所描述的是局部微小变化对整体的影响,而不涉及全局的、根本的变化情况。
中心极限定理建立在“大数定律”的基础之上,但二者并非简单的相互照应,不能混淆。
中心极限定理需要在“大数定律”的基础之上才能成立,如果没有“大数定律”,中心极限定理将不能存在。
在此,“大数定律”是关键,如果“大数定律”不存在,则中心极限定理就无法成立,因为“大数定律”使“中心极限定理”的适用范围更加广泛。
同时,中心极限定理又是“大数定律”的补充,使“大数定律”更加严格和具有实用性,只有这样,才能保证“大数定律”得到有效的推广。
大数定律是中心极限定理的基础,没有大数定律,中心极限定理也就失去了存在的意义,因为其实现需要“大数定律”的支撑,若没有“大数定律”,那么中心极限定理就不能成立。
同时,大数定律和中心极限定理又是相辅相成的,中心极限定理中包含着大数定律的重要思想,没有大数定律,中心极限定理就不完善,也就无法推广。
由此看来,大数定律和中心极限定理既有相同之处,也有区别,我们必须明确这些区别,才能对大数定律和中心极限定理进行更好地理解。
大数定律与中心极限定理的介绍与应用
大数定律与中心极限定理的介绍与应用大数定律和中心极限定理是概率论与数理统计中两个重要的理论。
它们被广泛地应用于各个领域,如自然科学、社会科学、工程技术等。
本文将介绍这两个定理的基本概念、原理以及应用。
一、大数定律的介绍与应用大数定律,又称为大数法则,指的是在独立重复的随机试验中,随着试验次数的增加,样本均值将趋近于总体均值的概率性结果。
大数定律分为弱大数定律和强大数定律两种。
1. 弱大数定律弱大数定律是指在一定条件下,随机变量的平均值会接近于其数学期望。
这一定律为我们提供了在实际问题中进行概率估计的理论依据。
例如,在投资领域中,通过对股票市场的历史数据进行分析,可以利用弱大数定律估计未来的收益率。
2. 强大数定律强大数定律是指随机变量的平均值几乎肯定收敛于其数学期望。
这个定律在实际问题中具有更强的适用性。
在制造业中,通过对生产过程中的采样数据进行分析,可以利用强大数定律对产品的质量进行评估和控制。
二、中心极限定理的介绍与应用中心极限定理是指在一定条件下,大量独立随机变量的和的分布趋近于正态分布。
中心极限定理具有广泛的适用性和重要的理论意义。
1. 林德贝格-莱维中心极限定理林德贝格-莱维中心极限定理是最早被发现的中心极限定理之一。
它表明,当样本容量很大时,随机变量的和的分布近似于正态分布。
这一定理在统计学中被广泛应用,能够帮助我们进行统计推断和参数估计。
2. 中心极限定理在抽样调查中的应用在市场调研和民意调查中,通常会通过抽样调查的方式来获取数据。
根据中心极限定理,当样本容量足够大时,样本均值的分布将近似于正态分布。
因此,我们可以通过样本均值的分布来进行推断总体均值的区间估计和假设检验。
三、大数定律与中心极限定理的联系与差异大数定律和中心极限定理都涉及随机变量的分布性质,但它们的应用场景和概念有所不同。
1. 联系大数定律和中心极限定理都属于概率论与数理统计的基本理论,都是描述随机变量的分布性质的定理。
大数定律和中心极限定理的区别与联系
大数定律和中心极限定理的区别与联系大数定律是最著名的定理,而中心极限定理只是它的一个特例。
不过人们更喜欢把大数定律和中心极限定理统称为中心极限定理。
那么,中心极限定理与大数定律有什么关系?它们之间到底有没有必然的联系呢?我们今天就来谈一谈。
中心极限定理也叫罗尔定理。
定理内容:如果P、 Q、 R满足其中P是连续的, Q是离散的, R在0到1之间连续,且R也连续,则P在Q中至多出现一次。
举例说明:设F:=f(x), x>0。
其中f(x)=ax^3+bx+c,则x=1, 2, 3,…。
,由大数定律知道,若f( x),则P在f(x)中至多出现一次,或者说,对任意给定的a>0,均有P在f(a),则一定有Q在Q( a)中至多出现一次。
如果使F在Q( a)中至多出现一次的a取最小值,就能保证此结论成立。
5。
实例1:设A为离散型随机变量, B为连续型随机变量,设C=aB-a,当c=0时,即( b-a) =0时,得到下面的三角函数关系式: f( x)=x+a。
又因为f是连续型随机变量,故有f在0处有最大值。
实例2:设A为连续型随机变量, B为离散型随机变量,设C=aB-a,当c=0时,即( b-a) =0时,得到下面的三角函数关系式: f( x)=x-b。
又因为f是离散型随机变量,故有f在1处有最小值。
从上述两个实例中可以看出,根据大数定律,知道P (或Q)在F(或Q)中至少出现一次,即可推出Q(或F)在Q(或F)中至多出现一次。
中心极限定理和大数定律的关系很简单,即通过大数定律推出中心极限定理。
中心极限定理告诉我们如何根据大数定律来求解中心极限定理,所以说,中心极限定理是大数定律的特殊情况。
一般地,把某些连续型随机变量的实际分布用一个有限区间( 0, 1)来表示,称为这类随机变量的“中心区间”。
连续型随机变量都具有“中心区间”,但离散型随机变量则不一定。
离散型随机变量一定有中心极限定理,但它不一定有大数定律。
大数定理与中心极限定理的应用
大数定理与中心极限定理的应用大数定理和中心极限定理是概率论中最基本也是最重要的两个定理。
它们是求解随机事件的概率分布和预测随机现象的变化趋势的基础。
本文将介绍大数定理和中心极限定理的定义、证明以及应用。
一、大数定理大数定理是概率论中的一个重要原理,描述了随机变量序列平均数的性质。
大数定理表明,随着样本数量逐渐增加,随机变量序列平均数越来越接近随机变量的期望值。
具体来说,如果 $X1,X2, ..., Xn$ 是独立同分布的随机变量,其期望为 $E(X)$,则样本平均数的极限为 $E(X)$,即:$$\lim_{n\to\infty} \frac{X_1+X_2+...+X_n}{n} = E(X)$$大数定理的证明比较复杂,这里不再深入探讨。
但需要注意的是,大数定理只是对随机变量序列平均数的渐近表现进行的描述。
在实际应用中,仍然需要考虑样本数量、样本大小、采样方法等因素带来的误差。
大数定理的应用十分广泛,常见的例子包括赌场游戏、信用评级等。
以赌场游戏为例,假设一家赌场每次赌客可以下注 $1$ 美元,赢得的概率为 $p$。
根据赌场规则,获胜的赌客可以得到$2$ 美元的回报,输掉的赌客则失去所下的 $1$ 美元。
赌场的利润取决于获胜和失败的比例。
利润越高,赌场的经营者就越富有。
而大数定理在此处的应用则在于,当赌客的数量越来越多时,赌场的经营者能够准确预测赌客赢得和输掉的比例,从而达到通过调整赔率保证赌场利润最大的目的。
二、中心极限定理中心极限定理是概率论中的另一个重要概念。
它表明当样本数量增加时样本平均数的分布越来越接近正态分布。
正态分布是概率分布中最常见也最重要的一种分布。
由于中心极限定理具有一定的普适性,因此它在实际应用中十分重要。
中心极限定理的数学表达式为:$$\lim_{n\to\infty} P(\frac{X_1+X_2+...+X_n}{n} \leq x) =\frac{1}{\sqrt{2\pi}} \int_{-\infty}^x e^{-t^2/2}dt$$其中 $X_1,X_2,...,X_n$ 是独立同分布的随机变量,并且有$E(X_1^2)<\infty$,$\mu=E(X_1),\sigma^2=Var(X_1)$,则样本平均数满足:$$\frac{\frac{X_1+X_2+...+X_n}{n} - \mu}{\sigma/\sqrt{n}} \sim N(0,1)$$其中 $N(0,1)$ 表示标准正态分布。
探讨大数定理和中心极限定理
探讨大数定理和中心极限定理在统计学中,大数定理和中心极限定理是两个非常基础也非常重要的概念。
它们被广泛地应用于各个领域,从自然科学到社会科学,均有广泛的应用。
本文将探讨大数定理和中心极限定理的原理和应用。
一、大数定理大数定理是指在一系列独立重复随机试验中,随着试验次数的增加,样本平均值的稳定值越来越接近于总体期望。
即在试验次数无限大的情况下,样本平均值趋近于总体期望。
大数定理是描述众多随机变量平均值随机波动在样本容量不断增大的情况下,其平均值逐渐趋于一个确定的常数的数学原理。
大数定理的重要性在于它解释了样本平均值与总体平均值之间的关系。
随机试验中的抽样调查往往就是指对一个总体进行一定规模的随机抽样,从而得到一个代表样本,这时样本平均值通过大数定理,可算得总体平均数的近似值。
大数定理是数学上成立的,但是证明这个定理需要数学推导和分析。
不同的大数定理有不同复杂程度的证明过程,从简单的Bernoulli大数定理(伯努利大数定律)到更为复杂的Khintchine 大数定理。
这些定理在不同情况下有着不同的适用范围。
二、中心极限定理中心极限定理(Central Limit Theorem)是概率论中的一个重要定理,指的是若随机变量的和服从一定的分布,则当变量的个数趋近于无限大时,其标准化后的和的分布趋向于正态分布。
也就是说,样本容量越大,样本均值的分布就会越接近正态分布。
中心极限定理的作用是刻画了随机变量和与正态分布之间的关系,即多个独立随机变量密度函数之和趋近于正态分布。
中心极限定理的证明可使用数学推导和图示法来完成。
图示法通常展示为随机变量和的密度函数曲线,以及随着样本容量的增大,近似正态分布曲线的逐渐出现。
这种图示法将把一个随机变量的分布逐渐转变为一种另外的分布,称为极限分布。
在中心极限定理的情况下,这个极限分布是正态分布。
三、应用和意义大数定理和中心极限定理对于现代科学和理论探索意义重大。
它们能够帮助我们预测未来的结果、分析已知结果、探索性质变化和最小量规模,以及帮助我们理解统计分布和抽样分布分析等。
大数定律和中心极限定理的思考与应用
〇教育教学研究大数定律和中心极限定理的思考与应用陈常埼(曲阜师范大学数学科学学院,山东济宁273100)摘要:概率论与数理统计是研究随机现象统计规律性的学科,而统计规律性是通过重复观测来体现,研究极限是对大量的重复观测作数学处理的常用方法%本文将对大数定律与中心极限定理在独立同分布和不同分布两种情况下的结论作了比较系统的阐述,揭示了随机现象最根本的性质—平均结果的稳定性。
概率论与数理统计是研究随机现象的统计规律的一门学科,只有在相同条件下进行大量重复试验或观察才能呈现出随机现象的统计规律性。
关键词:大数定律;中心极限定理;概率论概率论中一个非常重要的课题就是大数定律,这还是概 率论与数理统计之间一个承前启后的纽带。
大数定律阐明了随机现象平均结果具有稳定性,证明了在大样本条件下,样本平均值可以看作总体平均值,它是“算数平均值法则”的基本理论。
比如说,我们向上拋一枚硬币,硬币落下后哪一面朝上本来是偶然的,但当我们向上拋硬币的次数足够多时,达到上万次甚至几十万次之后,我们会发现,硬币向上的 次数约占总次数的二分之一,偶然中包含着必然。
一、大数定律和中心极限定理的概念与关系(一) 大数定律大数定律就是在大量的随机试验中,由于各次的随机性 (偶然性)相互抵消又相互补偿,因而其平均结果趋于稳定,而阐明大量随机现象平均结果稳定性的定理。
利用大数定律使用极限方法研究大量随机现象的统计规律性。
人们在长期的实践中发现,频率以及大量测量值的算术平均值具有稳定性,而大数定律要解决的问题也就是这种稳定性问题如何从理论上给出解释?不难看出大数定律在理论和实际中都有广泛的应用。
(二) 中心极限定理自从高斯指出测量误差服从正态分布后,人们发现,正 态分布在自然界中极为常见。
例如:炮弹的弹落点、人的身 高、体重等都服从正态分布。
中心极限定理的客观背景:如 果一个量是由大量相互独立的随机因素的影响所造成的,而其中每一个因素在总的影响中所起的作用微小,这种随机变 量往往近似地服从正态分布。
大数定律和中心极限定理的区别和联系
大数定律和中心极限定理的区别和联系示例文章篇一:哎呀呀,说起大数定律和中心极限定理,这可真是让我这个小学生头疼了好一阵子呢!不过现在,我好像有点明白啦,来给大家讲讲。
你们知道吗?大数定律就好像是一群小伙伴一起比赛跑步。
比如说,我们比谁跳绳跳得多。
一开始,每个人跳的数量都不太一样,有的多有的少。
但是呢,如果我们一直比下去,比的次数越来越多,最后每个人跳绳的平均数量就会慢慢稳定下来,差不多都在一个固定的数值附近。
这就像是大数定律说的,当试验次数足够多的时候,随机事件的频率就会趋近于它的概率。
再来说说中心极限定理。
这就好比我们班同学的考试成绩。
每个同学的成绩都不一样,有高有低。
但是如果把我们全班同学的成绩加起来,然后算一个平均值,再看看这个平均值的分布情况。
你会发现,它会越来越接近一个像钟一样的形状,就是中间高,两边低。
这就是中心极限定理啦,当样本量足够大的时候,不管原来的总体是什么分布,样本均值的分布都会近似服从正态分布。
那它们有啥联系呢?其实啊,它们就像是一对好兄弟。
大数定律告诉我们,随着试验次数增多,平均值会稳定;而中心极限定理呢,是在说当样本量大的时候,平均值的分布情况。
可以说,中心极限定理是大数定律的一种延伸和发展。
那它们的区别又在哪里呢?比如说,大数定律更关注单个随机变量的平均值,而中心极限定理则侧重于多个随机变量的平均值的分布。
就好像一个是关注单个同学的表现,另一个是关注整个班级同学的总体表现。
我觉得啊,这两个定理虽然有点难理解,但真的很神奇!它们能帮助我们更好地理解生活中的很多现象。
比如说,为什么保险公司能算出保险的价格,为什么工厂能估计产品的质量,这里面可都有它们的功劳呢!你们觉得是不是很有趣呀?我的观点就是,虽然现在我还只是个小学生,对这两个定理的理解还不是特别深入,但我相信,随着我学习的知识越来越多,我会更加明白它们的奥秘和用处!示例文章篇二:哎呀呀,什么是大数定律?什么又是中心极限定理?这可把我这个小学生难住啦!老师在课堂上讲这些的时候,我一开始真的是一头雾水。
大数定律与中心极限定理的关系及其应用
论文题目:大数定律与中心极限定理的关系及其应用摘要:本文通过对概率论的经典定理——大数定律与中心极限定理在独立同分布和不同分布两种情况下的结论作了比较系统的阐述,揭示了随机现象最根本的性质——平均结果的稳定性.经过对中心极限定理的讨论,给出了独立随机变量之和的分布可以用正态分布来表示理论依据.关于大数定律方面,较全面地分析和叙述了几种最常用的大数定律.同样中心极限定理的内容也从独立同分布与独立不同分布两个角度来进行讨论;另外,叙述了各种大数定律以及中心极限定理各自之间,大数定律与中心极限定理之间的关系.同时通过举出很多相关的反例说明二者的关系.最后给出了一些简便的大数定律与中心极限定理在数理统计、误差、彩票学、近似计算、保险业及数学分析等几个方面的应用,来进一步地阐明了大数定律与中心极限定理在各分支学科中的重要作用和应用价值.关键词:随机变量序列;大数定律;中心极限定理;应用ITitle:Law of large numbers and the relationship between the centrallimit theorem and its applicationAbstract: Based on the probability of a classic theorem : the law of large numbers central limit theorem in the independent distribution ; with the different distribution of both cases, it made more systematic exposition, and revealed the phenomenon of the random nature of the most fundamental an average of the results of the Stability . Trough the central limit theorem discussion it will give out the random variables and the distribution of the normal distribution .About the law of large numbers, there are more comprehensive analysis and described several of the most commonly used on it. The content of the same central limit theorem also discussed the independent distribution and independent distribution of the two different perspectives. Also, it will discussed the relationship between the variety of narrative and the law of large numbers between their respective central limit theorem, and that of the law of large numbers and the central limit theorem. At the same time, it demonstrated the relationship between the two aspects through lots of anti-related examples. Finally ,it gave out several aspects of application of a number of simple law of large numbers and the central limit theorem in mathematical statistics, error, lottery school, the approximate calculation, and the insurance industry and mathematical analysis, to further clarify the law of large numbers and the central limit theorem in all branches of the important role and value.Keywords: Random variables ; Law of large numbers; Central limit theorem; ApplicationII目录摘要 (I)Abstract (II)第1章引言 (1)第2章大数定律及其证明 (2)2.1 几个相关定义 (2)2.2 大数定律及其证明 (4)第3章中心极限定理 (8)3.1 中心极限定理的提法 (8)第4章大数定律与中心极限定理的关系 (11)4.1 服从大数定律, 但不服从中心极限定理 (11)4.2 服从中心极限定理, 但不服从大数定律 (12)4.3 大数定律与中心极限定理都不服从 (13)4.4 大数定律、中心极限定理都服从 (13)第5章应用 (14)5.1“概率”及“数学期望”的确切定义 (14)5.2 解释测量(随机) 误差 (14)5.3 在数学分析中的应用 (15)5.4 在计算精确的近似概率方面的应用 (16)5.5 在彩票和保险业的应用 (17)结语 (20)参考文献 (21)致谢 (22)附录 (23)IIIIV第1章引言概率论与数理统计是研究随机现象的统计规律的科学,而随机现象的统计规律性只有在相同条件下进行大量重复试验或观察才呈现出来. 从概率的统计定义中可以看出:一个事件发生的频率具有稳定性,即随着试验次数的增多,事件的频率逐渐稳定在某个常数附近. 人们在实践中观察其他一些随机现象时,也常常会发现大量随机个体的平均效果的稳定性. 这就是说,无论个别随机个体以及它们在试验进行过程中的个别特征如何,大量随机个体的平均效果与每一个体的特征无关,且不再是随机的. 深入考虑后,人们会提出这样的问题:稳定性的确切含义是什么? 在什么条件下具有稳定性? 这就是大数定律要研究的问题.众所周知,中心极限定理是概率论中最重要、最基本的一个定理.中心极限定理揭示了离散型随机变量与连续型随机变量之间的内在联系, 为用连续型随机变量的分布,特别是标准正态分布对离散型随机变量进行概率计算提供了理论基础.基于中心极限定理的概率统计方法在生活中的应用,本文利用中心极限定理,分析了保险业和近似计算中的应用.第 1 页共27页第 2 页 共 27 页第2章 大数定律及其证明2.1 几个相关定义定义1[1] 设n (1,2,)n ξ= 为概率空间(,,)F P Ω上定义的随机变量序列(简称随机序列),若存在随机变数ξ,使对任意0ε>,恒有:l i m {}0nn p ξξε→∞-≥=或lim {}1n n p ξξε→∞-≤=, 则称随机序列{}n ξ概率收敛于随机变量ξ(ξ也可以是一个常数),并用下面的符号表示:lim ()n n p ξξ→∞=或pn ξξ−−→.定义 2[2][6][8] 设{}n ξ为随机变量序列, 数学期望n E ξ存在()1n ≥,如果对任意的0ε>.恒有:1111lim (())1nniin i i p E nnξξε→∞==-<=∑∑, 则称随机变量序列{}n ξ服从大数定律.定义 3 设{}n ξ为随机变量序列, 如果存在常数序列{}n a .对任意的0ε>.恒有:11lim ()1nin n i p a nξε→∞=-<=∑, 则称随机变量序列{}n ξ服从大数定律.注:定义2和定义3两种大数定律定义的讨论所谓大数定律, 它是揭示大量随机现象的平均结果稳定于平均值的极限理论.而大量随机现象即{}n ξ的平均结果是11nii n ξ=∑(n 充分大),其平均值是11()nii E nξ=∑.因此, 从这一角度来考虑,定义2是恰当的.定义3与定义2的不同点在于它并不要求随机变量n ξ的期望n E ξ存在(1n ≥),只要存在常数序列{}n a ,使对任意的0ε>.恒有11l i m ()1ni n n i pa nξε→∞=-<=∑即可.为了弄清这两种定义的异同,我们必须讨论数列{}n a 与数列{11()nii E nξ=∑}之间的关系.首先,当n E ξ(1n ≥)存在时,我们不难证明:0δ∀>,11lim (())0nn in i p a E nξδ→∞=-≥=∑这个结果表明在n E ξ(1n ≥)异存在时,只需取11()nn ii a E nξ==∑,(1n ≥).此时, 定义2 与定义第 3 页 共 27页3 是等价的.其次,当n E ξ(1n ≥)不存在时, 由定义2知{}n ξ不服从大数定律, 而此时, 存在常数列{}n a 使定义3仍然成立.综合上述定义2与定义3不是等价的.定义3不仅在形式上而且在内涵上比定义2更广泛.定义 4[3] 设{()}n F x 是分布函数序列,若存在一个非将函数()F x ,对于它的每一连续点x ,都有li m ()()n n F x F x →∞=,()()w n F x F x −−→,则称分布函数序列{()}n F x 弱收敛于()F x .定义5 设n ()(1,2,)F x n = , ()F x 分别是随机变量(1,2,)n n ξ= 及ξ的分布函数,若()()wn F x F x −−→,则称{}n ξ依分布收敛于ξ,亦记为Ln ξξ−−→,且有: (1)若p n ξξ−−→,则Ln ξξ−−→; (2)设c 为常数,则p n c ξ−−→的充要条件是Ln c ξ−−→. 逆极限定理:设特征函数列{()}n f x 收敛于某一函数()f t ,且()f t 在0t =时连续,则相应的分布函数列{()}n F x 弱收敛于某一分布函数()F x ,而且()f t 是()F x 的特征函数.车比雪夫不等式[4]:设ξ是一个随机变量,它的数学期望为a ,方差为2σ,则对任意的正常数ε恒有:22{},p a σξεε-≥≤(2-1)或有22{}1p a σξεε-<≥- (2-2)称(2-1)式或(2-2)式为车比雪夫不等式.以下就连续型随机变量来证明这个不等式.证 设的密度函数为()f x ,则有222()()()()()x EX x EX DX x EX f x dx x EX f x dx f x dx εεε+∞-∞-≥-≥=-≥-≥⎰⎰⎰{}22()x EX f x dx P x E X εεεε-≥==-≥⎰,第 4 页 共 27 页于是 {}2D XP x E X εε-≥≤这个不等式可解释为:对任意给定的正常数ε,可以作为两个区间(,)a ε-∞-和(,)a ε++∞.(1)式表示,在一次试验中,随机变量ξ的取值落在(,)(,)a a εε-∞-⋃++∞的概率小于等于22σε.不等式说明D X 越小,则X 的取值越集中在E X 附近.这进一步说明了方差是反映随机变量取值的离散程度的.2.2 大数定律及其证明大数定律形式有很多,我们仅介绍几种最常用的大数定律. 定理1[5][6] (车比雪夫大数定律)设随机变量12n ,,,,ξξξ 相互独立,它们的数学期望依次为12n ,,,,a a a ,方差依次为22212,,,,n σσσ 而且存在正常数k ,使得对一切1,2,i = 有2i k σ<,则对任意给定的正常数ε,恒有1111lim {}1nniin i i p annξε→∞==-<=∑∑证 设11nii nξξ==∑,则ξ的数学期望和方差分别为: 111111nnni ii i i i E E E a nn nξξξ===⎛⎫===⎪⎝⎭∑∑∑,222111111n nni iii i i D D D n n nξξξσ===⎛⎫===⎪⎝⎭∑∑∑由车比雪夫不等式,对任意给定的正数ε,有11111{}nni i i i p a nnξε==≥-<∑∑=22221222{}1111ni i D p E nk n k n n σξξξεεεεε=-<≥-=->-=-∑即 211111{}1nniii i p a k n nnξεε==≥-<=-∑∑.对不等式取极限,则得1111lim {}1nniin i i p a nnξε→∞==-<=∑∑车比雪夫大数定律表明,在一定条件下,当n 充分大时,n 个随机变量的算术平均值11nii nξ=∑偏离其数学期望的可能性很小.这也正是用一系列测量值的平均值来近似代替真值的做法的原则.第 5 页 共 27页推论 1 设随机变量12n ,,,,ξξξ 相互独立,且它们具有相同的分布及有限的数学期望和方差:E a ξ=,2(1,2,)D i ξσ== ,则对任意给定的正数ε,有11lim {}1nin i p a nξε→∞=-<=∑.此推论证明:n 个相互独立的具有相同数学期望和方差的随机变量,当n 很大时,它们的算术平均值几乎是一个常数,这个常数就是它们的数学期望.定理 2[7](辛钦大数定律)设12n ,,,,ξξξ 是相互独立的随机变量,而且有相同是的分布,具有有限的数学期望k ,(1,2,)E a k ξ== ,则对任意给定的0ε>,有11lim {}1nkn k p a nξε→∞=-<=∑.注:定理2中条件比定理1中的条件要宽,在定理1中要求方差有限,而定理2不需要这个条件.辛钦大数定律说明独立同分布的随机变量的算术平均值依概率收敛于它的数学期望值,它为在实际应用中用算术平均值估计数学期望提供了理论依据.证 因为12n ,,,,ξξξ 是具有相同分布的随机变量序列,故它们有相同的特征函数.设它们的特征函数为()f t ,由于k E ξ存在,故()f t 有展开式:'()(0)(0)()1()f t f f t ti a t οο=++=++,其中()t ο表示关于t 的高阶无穷小量. 再由独立性知,11nk k n ξ=∑的特征函数为:1nnt t t f ia n n n ο⎡⎤⎡⎤⎛⎫⎛⎫=++ ⎪ ⎪⎢⎥⎢⎥⎝⎭⎝⎭⎣⎦⎣⎦.对任意取定的数t ,有lim lim 1n niat n n t t t f ia e n n n ο→∞→∞⎡⎤⎡⎤⎛⎫⎛⎫=++= ⎪ ⎪⎢⎥⎢⎥⎝⎭⎝⎭⎣⎦⎣⎦.而iat e 是连续函数,且是单点分布的特征函数,由逆极限定理知:11nk k nξ=∑的分布函数弱收敛于()F x .其中,1,(),0,x a F x x a>⎧=⎨=⎩因此,11,nLkk a nξ=−−→∑由(2)式知:11nPkk anξ=−−→∑.定理 3[8](贝努利大数定律)设n μ是n 次独立试验中事件A 发生的次数, p 是事件A 在每次试验中发生的概率,则对任意给定的正数ε,有lim {}1nn p p nμε→∞-<= 或 lim {}0nn p p nμε→∞-≥=第 6 页 共 27 页证 令 0,1,2,1n k A Y k k A ⎧==⎨⎩ 第试验不发生,,第试验发生.显然12n n Y Y Y μ=+++ ,由于各次试验是独立的,从而12,,,,n Y Y Y 相互独立,又k Y 服从参数为P 的两点分布,所以(),()(1),(1,2,k k E Y P D Y P Pk ==-= . 由定理1有 lim {}1nn p p nμε→∞-<=.此定理表明:当n 很大时, n 重贝努利试验中事件A 发生的频率几乎等于事件A 在每次试验中发生的概率,这个定理以严格的数学形式刻画了频率的稳定性,因此,在实际应用中,当试验次数很大时,便可以用事件发生的频率来代替事件的概率.证 作一次观察时n μ是定值, 作多次观察时n μ是随机变量,而且(,),n B n p μ 因此:n E np μ=,n D npq μ=,()n E n pμ=,()n D n pq n μ=.在车比雪夫不等式中,取 n n ξμ=,则a p =,2pq n σ=,于是对任意给定的正数ε,有21{}11()npq p p n nn μεε≥-<≥-→→∞,因而lim {}1nn p p nμε→∞-<=.定理 4 (泊松大数定律)设12n ,,,,ξξξ 是相互独立的随机变量, P{1}n n P ξ==, P{0}n n q ξ== (其中n P 1n q =-) ,则{}n ξ服从大数定律.证 由定理所设可得:11E()nn ini P P nξ===∑,2221111111()()24nnnn n n iiii i i P q D D P qnnnn ξξ===+⎛⎫==≤= ⎪⎝⎭∑∑∑. 由车比雪夫不等式得,对任意0ε>,有22()10{}4n n n D P P n ξξεεε≤-≥≤≤.两边取极限,得lim {}0n n n P P ξε→∞-≥=.泊松大数定律是贝努利大数定律的推广, 贝努利大数定律证明了事件在完全相同条件下重复进行的随机试验中频率的稳定性;而泊松定理表明,当独立进行的随机试验的条件变化时, 频率仍然具有稳定性:随着n 的无限增大,在n 次独立试验中,事件 A 的频率趋于稳定在各次试验中事件A 出现概率的算术平均值附近.定理5[9][10] 马尔可夫(Marrkov) 大数定律)设{}k ξ是随机变量序列,若211lim()0nk n k D nξ→∞==∑,则对任意>0ε,均有1111lim {}1nnkkn k k p E nnξξε→∞==-<=∑∑,即{}k ξ服从大数定律.证 车比雪夫不等式得212111()111{}1nk nnk kkk k D np E nnξξξεε===≥-<≥-∑∑∑,取极限得:1111lim {}1nnkkn k k p E nnξξε→∞==-<=∑∑注:车比雪夫大数定律可又马尔可夫大数定律推出,更重要的是马尔可夫大数定律已经没有任何关于独立性的规定.第3章 中心极限定理直观上,如果一随机变量决定于大量(乃至无穷多个)随机.因素的总合,其中每个随机因素的单独作用微不足道,而且各因素的作用相对均匀,那么它就服从(或近似地服从)正态分布,下面我们将按严格的数学形式来表述这一直观.3.1 中心极限定理的提法定理 6[3][11](林德贝格——列维定理(Lindeberg-Levy)中心极限定理)设随机变量12,,ξξ 是一列独立同分布的随机变量,并且具有数学期望k E a ξ=和方差22(0),1,2,k D k ξσσ=>= ,则对任意实数x ,有22lim ()t nkx n na P x edt x ξ--∞→∞⎛⎫-⎪⎪<==Φ ⎪ ⎪⎝⎭∑ (3-1)证 设k a ξ-的特征函数为()t ϕ,1nknk na ξ=-=∑∑的特征函数为nϕ⎡⎤⎢⎥⎣⎦又因为()()20,k k E a D a ξξσ-=-=,所以'''2(0)0,(0)ϕϕσ==- 于是特征函数()t ϕ有展开式:2'''22221()()(0)(0)()1()22tt t t t t t ϕϕϕϕοσο=+++=-+,从而对任意固定的t ,有22221(),2nntt t t e n n n ϕο-⎡⎤⎡⎤=-+→→∞⎢⎥⎢⎥⎣⎦⎣⎦ 而22te-是()0,1N 分布的特征函数,因此由特征函数的连续性定理即知(3-1)成立,定理得证.定理6又称独立同分布的中心极限定理,它表达了正态分布在概率论中的特殊地位,尽管k ξ的分布是任意的,但只要n 充分大,nkna ξ-∑近似服从标准正态分布(0,1)N .或者说,当n 很大时,独立同分布的随机变量kξ的和1nk k ξ=∑ 近似地服从正态分布2(,)N n n μσ.这就是那些(可以看作有许多微小的、独立的随机因素作用的总结果,而每一个因素的影响却都很小)随机变量,一般都可以近似地服从正态分布的理论依据,因而正态分布在理论上和应用上都具有极大的重要性.若(,)B n p ξ ,则当n 很大时,有()P a b ξ⎛⎫⎛⎫≤≤≈Φ-Φ⎝定理 7 (棣莫弗—拉普拉斯(De Moivre-Laplace)中心极限定理) 设随机变量n η服从二项分布(,)B n p ,则对于任意区间[,]a b ,恒有22lim t nkb an na P a b dt ξ-→∞⎛⎫- ⎪ ⎪≤<=⎪ ⎪⎝⎭∑⎰二项分布的极限分布是正态分布 即如果(,)X B n p ,则221()()t nk b anaP a b dt b a ξ-⎛⎫- ⎪ ⎪≤<≈=Φ-Φ ⎪ ⎪⎝⎭∑⎰一般地,如果(,)X B n p ,则()P a X b P ⎛⎫≤<=≤<⎝b np a np --≈Φ-Φ说明:这个公式给出了n 较大时二项分布的概率计算方法.引理 设12,,ξξ 是独立随机变量序列,又k k E a ξ=,2(1,2,)k k D k ξσ== ,221nnkk B σ==∑,这时:(1) 若{}k ξ是连续型随机变量,密度函数为{}()n P x ,如果对任意0τ>,有2211lim()()0k nnk k x a B n k n x a P x dx Bτ->→∞=-=∑⎰(2) 若{}k ξ是离散型随机变量,k ξ的分布列为(),1,2,n nj nj P x P j ξ=== ,如果对任意0τ>,有()2211lim0nj k nnnjk kj n k x a B nxa P B τ→∞=->-=∑∑则称{}k ξ满足林德贝尔格条件.定理 8 (林德贝格定理) 设独立随机变量序列12,,ξξ 满足林德贝尔格条件,则当时,对任意的,有()2211lim y nx k k n k nP a x edy B ξ--∞→∞=⎛⎫-<=⎪⎝⎭∑这个定理证明了由大量微小而且独立的随机因素引起并积累而成的变量,必将是一个正态随机变量,由林德贝尔格条件可看到定理并不要求各个加项“同分布”,因而它比前述的林德贝尔格——勒维定理更强,事实上林德贝尔格——勒维定理可以由它推出.定理 9 (李雅普诺夫定理) 设12,,ξξ 是独立随机变量序列,又k kE a ξ=,2(1,2,)k k D k ξσ== ,记221nnkk B σ==∑,若存在0δ>,使有22110,nk kk nE a n B δδξ++=-→→∞∑,则对任意的实数x ,有()2211lim y nx k k n k n P a x edy B ξ--∞→∞=⎛⎫-<= ⎪⎝⎭∑定理9又称独立非同分布的中心极限定理,李雅普诺夫定理可以解释如下:假定被研究的随机变量可以表示为大量独立随机变量的总和,且总和中的每个单独的随机变量对于总和又不起主要作用,那么可以认为这个随机变量近似地服从正态分布.讨论了独立随机变量和的分布的极限问题,在一定条件下,这些分布弱收敛于退化分布,这就是大数定律.凡是在一定条件下断定随机变量之和的极限分布是正态分布的定理,在概率论中统称为中心极限定理.具体一点说,中心极限定理回答的是(独立或弱相依)随机变量之和的极限分布在什么条件下是正态的.中心极限定理是揭示产生正态分布的源泉,是应用正态分布来解决各种实际问题的理论基础.第4章 大数定律与中心极限定理的关系概率论中关于独立随机变量序列的极限理论, 已相当完整, 各种问题已有了令人满意的回答,但由于一般教材中, 特别是工科教材, 只介绍一、二个最简单的基本定理,若弱大数定律只介绍切比契夫定理的特殊情况, 中心极限定理只介绍同分布的林德贝格——列维定理(Lindeberg-Levy)的特殊情况——德莫弗—拉普拉斯(De Moivre-Laplace)定理.仅少数教材提及林德贝格条件. 这几个定理的条件又都是充分条件, 我们容易产生这样的问题: 大数定律与中心极限定理之间究竟有什么关系? 服从大数定律的是否服从中心极限定理? 反之又如何? 是否有两者都服从或都不服从的随机序列?因教材知识所限, 这些问题不太好回答, 现拟补充几个定理, 以简单的例子加以说明.定理10[12](格涅坚克定理) 设有相互独立的随机变量序列{}k ξ, 则对0ε∀>,11lim {()}1nkk n k p E nξξε→∞=-<=∑的充要条件是2221()lim[]0()nk k n k k k E E nE ξξξξ→∞=-=+-∑.定理11 (马尔科夫定理) 随机变量序列{}k ξ, 若211()0nk k D nξ=→∑,则对0ε∀>, 有11lim {()}1nkk n k p E nξξε→∞=-<=∑.定理12 (费勒定理) 对相互独立随机变量序列{}k ξ, 若∃常数n M ,使1max k n k nM ξ≤≤≤,且limn n nM B →∞=, 则{}k ξ服从中心极限定理.设{}k ξ为相互独立的随机变量序列, 以下在,,()k k j k j P P ξα==中, 令,,,k j k j P α取不同的值, 以说明不同的情形.4.1[12][13] 服从大数定律, 但不服从中心极限定理令(),1,1210,121k k P k α==-+,(),2,221,21k k k P k α==+,(),3,321,21k k k P k α==+,1,2,3,k = ,即()21(0)11k P k ξ==-+,()21()()21k k P k P k k ξξ===-=+可知0,k E ξ=()2221k k kD E k ξξ==+,()222111nnnk k k kB D k ξ====+∑∑因222110,n B n n nn<⋅→→∞, 由马尔科夫定理知, 大数定律成立, 但中心极限定理不成立. 这是因为12111(0)(0,0,,0)(0)(0)nnk n kkk k k P P P P ξξξξξξ∞==========≥=∑∏∏()2111(1)021nk k ==-=>+∏若服从中心极限定理,则取120,0x x <>,有22211211()t nx kx k nP x x edt B ξ-=<<=∑, 当12,x x 充分靠近 0 时,222112t x x e dt -<. 这就出现了矛盾. 所以中心极限定理不成立.4.2 服从中心极限定理, 但不服从大数定律取,,()k k j k j P P ξα==,为1()2k P k ξ==,1()2k P k ξ=-=,1,2,,k = 可知0,k E ξ=2k D kξ=,221nn k B k ==∑, 又 3333322221(1)(1)lim limlim3(1)n n n nn nnn n n n BB B n →∞→∞→∞++-+-===-+,即 313223limlim13n n nnnn B B -→∞→∞==,()12133lim1n nnB -→∞=又 1ax k k nM n ξ≤≤≤,()1213limlim03n n nn nB n→∞→∞-==则由费勒定理知中心极限定理成立, 但不服从大数定律, 这是因为2()x x R n x∈+, 为凸函数, 由琴生不等式222222222()kkkkE kE n n E n kξξξξ≥=+++,而 222222111111,244nnn k k k kkn k n n knnnn===+≥==→→∞++∑∑∑由格涅坚克定理知, {}k ξ不服从大数定律.4.3 大数定律与中心极限定理都不服从取,,()k k j k j P P ξα==,为1(2)2k k P ξ==,1(2)2k k P ξ=-=,可知0,k E ξ=4k k D ξ=,21144(41)3nnknnk k k B D ξ=====-∑∑, 当 n充分大时24n n B >,即2n n B >21112222(21)2n nn n n kk k k ξξ+==≤≤+++=-<∑∑,112nkk nB ξ=<∑故11lim (2)1(2)(2)1nkn k nP B ξ→∞=<=≠Φ-Φ-<∑可知不服从中心极限定理, 又22222222111144()44kknnnnkkknk k k k kkE E nn E n n ξξξξ====≥=>++++∑∑∑∑22111444(41),4433nknnnk n n n ===⋅-→→∞++∑,由格涅坚克定理知不服从大数定律.4.4 大数定律、中心极限定理都服从若{}k ξ为同分布且有有限期望及大于零的方差, 则由教材中定理易知两者都服从. 这时有11lim (())1nkk n k P E nξξε→∞=-<=∑.但括号中的事件概率, 究竞有多大? 大数定律未能回答. 而根据中心极限定理有22111(())()x nnkk kk k k P E P E edx nεξξεξξσ-==≤-<=-<≈∑其中2k D σξ=, 这样看来在所假定的条件下, 中心极限定理比大数定律更精确.第5章 应用大数定律以严格的数学形式表达了随机现象最根本的性质——平均结果的稳定性,它是随机现象统计规律性的具体表现. 因此,大数定律在理论和实际中都有广泛的应用.5.1[3] “概率”及“数学期望”的确切定义在给出二者定义时,都采用“稳定”一词,这是一种不确切的描述.依据大数定律可给出更确切的表达,即:概率——独立重复实验中,事件A 出现的频率11nPii Pnξ=−−→∑,则该常数P 即为概率.数学期望——对于任一0ε>,有11lim ()1nin i p nξμε→∞=-<=∑,则()k E μξ=称为数学期望.5.2 解释测量(随机) 误差根据大数定律,对于随机误差12,,,n δδδ ,应有11nPii nδ=−−→∑.这说明当测量次数较多时, 实测数据的平均值11nii a nδ=+∑和预测真值a 的差值能以很大概率趋于0,因此,用求样本数据平均值的方法来进行测量是可行的.例1[14] 某种仪器测量已知量A 时,设n 次独立得到的测量数据为12,,,n x x x ,如果仪器无系统误差,问:当n 充分大时, 是否可取作为仪器测量误差的方差的近似值?解 把(1,2,,)i x i n = 视作n 个独立同分布的随机变量的观察值,则()i E x μ=,2(),(1,2,,)i D x i n σ== .仪器第i 次测量的误差i x A -的数学期望()i E x A A μ-=-,方差2()i D x A σ-=.设2(),1,2,,i i Y x A i n =-= ,则i Y 也相互独立服从同一分布.在仪器无系统误差时()0i E x A -=,即有A μ=,222()()()()(1,2,,)i i i i i E Y E x A E x Ex D x i n σ⎡⎤⎡⎤=-=-===⎣⎦⎣⎦由车比雪夫定律,可得: 211lim {}1nin i p Ynσε→∞=-<=∑即 ()2211lim {}1nin i p x A nσε→∞=--<=∑从而确定,当n →∞时,随机变量()211ni i x A n=-∑依概率收敛于2σ,即当n 充分大时可以取()211nii x A n=-∑作为仪器测量误差的方差.5.3 在数学分析中的应用例2[1] 假设()22212121,,,:,0,,12n n n n nG x x x x x x x x ⎧⎫=+++≤≤≤⎨⎬⎩⎭,求其极限. 解 假设随机变量(1,2,)n n ξ= 在[]0,1上有均匀分布,而且相互独立,有112D ξ=,2112E ξ=,易见(){}22111,,2nn n n n Gn dx dx P G P ξξξξ⎧⎫=∈=++≤⎨⎬⎩⎭⎰⎰ ()()222222211111111111266nn n ii P P E P E n n nξξξξξξξ=⎧⎫⎧⎫⎧⎫=++≤=++-≤≥-≤⎨⎬⎨⎬⎨⎬⎩⎭⎩⎭⎩⎭∑ 由1,,n ξξ 独立同分布,可见221,,,n ξξ 独立同分布.根据辛钦大数定律知:2111lim ()16ni i n i p E nξξ→∞=-≤=∑从而1lim1nn G n dx dx →∞=⎰⎰ .例3 用概率方法证明维尔斯特拉斯[w eierstrass ]定理.假定()f x 在闭区间[],a b 上是连续的,那么,存在一列多项式12(),(),B x B x ,一致收敛于函数()f x ,[],x a b ∈.证 不妨设0,1a b ==.假设()f x ,[]0,1x ∈是连续函数,那么()f x 在[]0,1上一致连续并且有界.对于任意[]120,0,0,1x x ε>≤∈存在0δ>,使12()()2f x f x ε-<,只要12x x ε-<.此外,对于一切01x ≤≤,有()f x k ≤(常数).现在,建立一多项式:()(1)nm m n m n n n m m B x Ef f C x x n n ξ-=⎛⎫⎛⎫==- ⎪ ⎪⎝⎭⎝⎭∑,其中n ξ服从二项分布, 参数为1n ≥, 而[]0,1x ∈, 显然(0)(0)n B f =,(1)(1)n B f =.由贝努利大数定律知()limnn x P nξ→∞=,[]0,1x ∈现在证明()n n B x f n ξ⎛⎫= ⎪⎝⎭一致收敛于()f x ,[]0,1x ∈.由于0(1)1nm m n m n m C x x -=-=∑,可见()()0()(1)nmmn mn n m m B x f x f f x C x x n -=⎡⎤⎛⎫-=-- ⎪⎢⎥⎝⎭⎣⎦∑,由此可得:()()0()(1)nm m n m n n m m B x f x f f x C x x n -=⎛⎫-≤-- ⎪⎝⎭∑()()(1)(1)m m n m m m n mn n mm x x nnm m f f x C x x f f x C x x n n δδ---<-≥⎛⎫⎛⎫=--+-- ⎪ ⎪⎝⎭⎝⎭∑∑2(1)222m m n mn n mx nkC x x kP x n δεεξδ--<⎧⎫<+-=+-≥⎨⎬⎩⎭∑. 由于对任意[]0,1x ∈,Pnxnξ−−→可见存在N ,使当时n N ≥,4nP x n kξεδ⎧⎫-≥≤⎨⎬⎩⎭ 从而,当n N ≥时,对于一切[]0,1x ∈,有:()()22422n B x f x k kεεεεε-<+=+= .即()n B x 关于[]0,1x ∈一致收敛于()f x .5.4 在计算精确的近似概率方面的应用例4[15] 现有一大批种子,其中良种占1/6 ,今在其中任选6000 粒,试分别用切比雪夫不等式估计和用中心极限定理计算在这些种子中良种所占的比例与1/6之差小于1%的概率是多少?解 设取出的种子中的良种粒数为X ,则1(6000,)6X B 于是1600010006E X n p ==⨯= 155(1)60001000666D X np p =-=⨯⨯=⨯(1) 要估计的规律为{}1110006060006100XP P X ⎧⎫-<=-<⎨⎬⎩⎭相当于在切比雪夫不等式中取60ε=,于是{}21110006016000610060X D X P P X ⎧⎫-<=-<≥-⎨⎬⎩⎭ 由题意得 25111100010.23150.76856063600D X-=-⨯⨯=-= 即用切比雪夫不等式估计此概率不小于0.7685.(2) 由拉普拉斯中心极限定理,对于二项分布1(6000,)6B ,可用正态分布5(1000,1000)6N ⨯近似, 于是所求概率为{}11940106060006100X P P X ⎧⎫-<=<<⎨⎬⎩⎭ 2(2.0785)10.9625≈Φ-Φ≈Φ-≈从本例看出:用切比雪夫不等式只能得出来要求的概率不小于0.7685,而用中心极限定理可得出要求的概率近似等于0.9625.从而知道由切比雪夫不等式得到的下界是十分粗糙的.但由于它的要求比较低,只要知道X 的期望和方差,因而在理论上有许多运用.当i X 独立同分布(可以是任何分布),计算1()n P a X X b <++≤ 的概率时,利用中心极限定理往往能得到相当精确的近似概率,在实际问题上广泛运用.5.5[16][17] 在彩票和保险业的应用大数定律和中心极限定理是概率论中两类具有极大意义的重要定理. 大数定律证明了在大样本条件下,样本平均值可以看作是总体平均值(数学期望) ,它是“算术平均值法则”的理论基础;中心极限定理比大数定律更为详细具体,它以严格的数学形式阐明了在大样本条件下,不论总体的分布如何,样本均值总是近似的服从正态分布. 正是这个结论使得正态分布在数理统计和误差分析中占有特殊的地位,是正态分布得以广泛应用的理论基础. 本文通过对彩票学和保险业等几个具体事例的引用展现了大数定律和中心极限定理的实际应用.大数定理在实际生活中应用十分广泛,我们现在以生活中最平常的但都很感兴趣的事情——彩票为例来详细阐述一下大数定理在彩票学中的应用.我们知道概率论是研究现实世界随机现象的科学,是近代数学的重要组成部分. 它在自然科学以及经济工作中都有着广泛的应用,同时也是数理统计的基础. 彩票投注的中奖概率分布完全符合它的原理. 彩票的投注方法是一个玩数字游戏. 彩票号码的摇出是随机事件,也可以说是一随机现象,属概率论的一个基本概念. 首先我们应该先清楚什么是随机现象? 我们说随机现象的特点是:事先不能预言其结果,具有偶然性;另一方面,在相同条件进行大量的重复试验,会呈现出某种规律性(特别是随机开奖次数的不断增多).例如:在相同条件下,多次抛掷质量均匀的同一枚硬币,则出现正面向上的次数约占总抛次数的一半,而且随着抛掷次数的增加,正面向上次数是总抛次数的12.这就是概率论的统计结果.(请看下面5次抛币的试验结果)有人曾经做过抛掷硬币的试验,试验结果记录如下:投掷次数N,正面向上次数M.M0.5181=2048N=1061N M==4040M0.5069N=2048N M=M0.5016N=6019=12000N M=M0.5005=24000N=12012N M==30000M0.4996N=14984N M=M0.5011N=36124=72088N M=由上述情况可以看出投掷次数很大时,其频率稳定于0.5彩票每期摇出的中奖号码(基本号码和特别号码)是一个随机事件,既然是随机事件,必有其分布规律.1. 2001010期至2001023期“上海风采”电脑福利彩票开奖计14期共摇出14*8112=个球.2. 每个球平均出现3.6次3. 奇数出现59次;偶数出现53次4. 小于或等于15的数47次;大于或等于16的数出现65次由此,我们引入彩票的一对常用语“冷门号码”及“热门号码”.有了“冷门号码”及“热门号码”,我们只要扑捉到这种机会,将会提高中奖纪律.概率分布的四条法则:1. 奇数.偶数出现的次数应占总数的12(由于不确定因素除外).2. 大数.小数出现的次数应占总数的12(由于不确定因素除外).3. 1-10区段,11-20区段,21-31区段,三区段出现的数个占总数的13(由于不确定因素除外).4. 各数出现的次数,随着实验(开奖)次数的增加不断靠近平均值(由于不确定因素除外).综上所述,随机的摇球事件随着实验(开奖)次数的增加都会显示出它的某些规律性,而这种规律性可以借助概率论的知识,利用小概率统计法,分析判断号码.通过数字统计,运用概率论原理来判断冷热号码出现的周期. 分析号码可能出现的区段. 缩小精选号码范围. 为新一期选择号码提供参考依据,从而达到提高中奖得率.实际上,对于彩票而言,也不是完全没有规律可循,只要经过大量的观察,根据大数定律就可以进行统计预测,提高中奖的几率. 概率论是一门系统学科,一般人了解的概率,不是从理论上认识,仅仅限于经验. 时间的表层认识. 与其硬着头皮去盲目猜测,不如运用简单的概率学统计分析方法更简单,更容易掌握. 把每期中奖号码出现的次数累加起来,一一进行统计,累计到一定量后,就能发现奖项及其相关指标的概率波动特性. 彩民再根据这些进行选号投注,就可以大大提高中奖几率.中心极限定理指出:如果一个随机变量有众多的随机因素所引起,每个因素在总的变化里起着不大作用,就可以推断描述这个随机现象的随机变量近似的服从正态分布,所以要求随机变量之和落在某个区间上的概率,只要把它标准化,用正态分布作近似计算即可. 中心极限定理还及时了离散型随机变量与连续型随机变量的内在联系,即离散型随机变量的极限分布是正态分布.中心极限定理对保险业更是具有指导性的意义,一个保险公司的亏盈,是否破产,我们通过学习中心极限定理的知识都可以做到估算和预测. 大数定律是近代保险业赖以建立的基础. 根据大数定律中心极限定理,我们知道承保的危险单位越多,损失概率的偏差越小,反之,承保的危险单位越少,损失概率的偏差越大. 因此,保险人运用大数法则就可以比较精确的预测危险,合理的拟定保险费率. 下面我们以一道具体的有关保险业的实例来阐述一下大数定律和中心极限定理在保险业中的重要作用和具体应用.例 5已知在某人寿保险公司里有10000个同一年龄段的人参加保险,在同一年里这些人死亡率为0.1% ,参加保险的人在一年的头一天交付保险费10元,死亡是家属可以从保险公司领取2000元的抚恤金. 求保险公司一年中获利不少于40000 元的概率;保险公司亏本的概率是多少?解设一年中死亡的人数为x人. 死亡概率为0.001P= ,把考虑10000人在一年里是否死亡看成10000重贝努里试验,保险公司每年收入为10000*10100000=元,付出2000x元.(1) P(保险公司获利不少于40000 元){}=->=(1000002000)40000P x。
概率论中的大数定律与中心极限定理的应用
概率论中的大数定律与中心极限定理的应用概率论是一门研究随机事件发生规律的学问,其定理与应用广泛应用于统计学、金融学、生产管理、人工智能等领域。
在概率论中,大数定律和中心极限定理是最为基础和重要的定理之一,它们有着广泛的应用和深远的影响。
一、大数定律大数定律是指在某一条件下,重复试验的结果越多,这些结果统计平均后越趋近于一个确定的值。
大数定律可以帮助我们理解并预测某些随机事件的出现概率,从而制定更好的决策。
例如,翻硬币的结果是正面朝上还是反面朝上,这是一个具有随机性的试验。
用大数定律来解释,如果连续翻硬币1000次,正面朝上的次数大约为500次。
但是,如果连续翻硬币10000次,正面朝上的次数就会非常接近5000次。
这是因为随着试验次数的增加,正反两面朝上的出现概率逐渐趋近于50%,从而平均值逐渐稳定。
大数定律还可以应用于金融和经济领域。
在股票市场中,如果一个股票在长期内表现良好,那么其价值也会随着时间的增加而逐步稳定。
这就可以用大数定律来解释:由于牛市和熊市等因素的干扰,每日的股票价格可能会有波动,但随着时间的增加,这些波动相互抵消,从而使得该股票的总体价格与预期价值趋向于一致。
二、中心极限定理中心极限定理是指,如果连续进行多次随机试验,独立的结果会呈现出一种特殊的分布规律——正态分布。
正态分布有着明确的数学规律,可以通过概率计算和模型预测来描述和解释随机事件的统计特征。
例如,某一工厂每天生产的零件数量是不确定的,但是我们可以假设每种零件的生产概率分布相同,并应用中心极限定理来描述其总体分布规律。
在经过大量试验之后,我们可以发现,当零件数量充分大时,每天的生产总量的分布大致呈现出正态分布的特征,其中大部分零件的生产数量集中在平均值周围。
我们可以用这种分布规律来制定生产管理策略,从而提高生产效率和质量。
中心极限定理还可以应用于汇率和金融市场的预测。
在汇率市场中,每日的汇率涨跌幅度往往是不确定的,但是我们可以通过历史交易数据来计算总体波动率,并利用中心极限定理来预测未来一段时间内的汇率波动规律。
大数定律与中心极限定理
大数定律与中心极限定理大数定律和中心极限定理是数理统计中的两个重要概念,它们描述了随机现象的统计规律。
本文将介绍大数定律和中心极限定理的定义、作用和应用,并分析它们在实际问题中的重要性。
一、大数定律大数定律是指在独立重复试验中,随着试验次数的增加,随机变量的平均值会趋向于其数学期望。
大数定律分为两种形式:辛钦大数定律和伯努利大数定律。
辛钦大数定律是指对于独立同分布的随机变量序列,其算术平均值会以概率1收敛于其数学期望。
也就是说,随着试验次数的增加,随机变量的平均值将无限接近于其数学期望,而且以极高的概率收敛。
伯努利大数定律是指对于一系列相互独立的伯努利试验,当试验次数趋向于无穷大时,随机变量的频率会趋向于其概率。
也就是说,当我们对一个随机事件进行大量重复试验时,事件发生的频率将逐渐接近事件发生的概率。
大数定律的作用在于揭示了随机现象的规律性。
通过大数定律,我们可以准确估计随机变量的期望值或概率,并且通过增加样本量可以提高估计的准确性。
在实际应用中,大数定律常被用于统计推断、抽样调查、质量控制等领域。
二、中心极限定理中心极限定理是指在一定条件下,大量独立随机变量的和的分布近似于正态分布。
中心极限定理包括李雅普诺夫中心极限定理、林德伯格-列维中心极限定理和伯努利-拉普拉斯中心极限定理。
李雅普诺夫中心极限定理适用于具有有限方差的独立同分布随机变量序列。
当样本量足够大时,这些随机变量的和的分布将接近于正态分布。
林德伯格-列维中心极限定理适用于具有相同数学期望和方差的独立随机变量序列。
同样地,随着样本量的增加,这些随机变量的和的分布将趋于正态分布。
伯努利-拉普拉斯中心极限定理适用于大量相互独立的伯努利试验。
当重复伯努利试验的次数很大时,事件发生的次数将近似于正态分布。
中心极限定理的作用在于在不知道总体分布的情况下,通过大样本推断总体的统计规律。
它对于统计推断、假设检验、置信区间估计等方面具有重要意义。
总结起来,大数定律和中心极限定理是数理统计中两个基本的定理,它们揭示了随机现象的统计规律,为我们处理随机数据提供了重要依据。
大数定律和中心极限定理的证明及应用
大数定律和中心极限定理的证明及应用大数定律和中心极限定理是概率论的两个基础定理,它们是理解概率论的重要桥梁,也是进行统计分析的基础。
本文将针对这两个定理进行证明和应用的探讨。
一、大数定律大数定律是概率论的重要定理,它指出在独立、同分布的随机变量序列t1、t2、…、tn中,随着n的增大,它们的算术平均值趋近于它们的数学期望。
设t1、t2、…、tn是n个独立同分布的随机变量,它们的数学期望为μ,方差为σ^2,则对于任意ε>0,有:P(|(t1+t2+…+tn)/n - μ| ≥ ε) → 0(n → ∞)即随着n的无限增大,随机变量序列的样本平均值与总体平均值之间的差值会趋近于0。
大数定律的证明有多种方法,这里介绍一种重要的方式——切比雪夫不等式证明法:对于随机变量序列t1、t2、…、tn,根据切比雪夫不等式有:P(|(t1+t2+…+tn)/n - μ| ≥ ε) ≤ σ^2/nε^2由于随机变量t1、t2、…、tn是独立同分布的,因此其样本方差为:sn^2 = (t1-μ)^2 + (t2-μ)^2 + … + (tn-μ)^2按此可得到:σ^2 = sn^2/n因此有:P(|(t1+t2+…+tn)/n - μ| ≥ ε) ≤ sn^2/nε^2从而有:P(|(t1+t2+…+tn)/n - μ| ≥ ε) ≤ σ^2/nε^2由此,对于任意ε>0,当n很大时,都有:P(|(t1+t2+…+tn)/n - μ| ≥ ε) → 0 (n → ∞)即可证明大数定律成立。
大数定理有广泛的应用。
以森林面积估计为例,若要估算某森林面积,可以随机抽取森林中若干个点,计算这些点所在的小区域内的树木密度,通过求平均值来估算森林的总面积。
根据大数定律,随着抽样点数增加,估算结果会趋近于真实面积。
二、中心极限定理中心极限定理(Central Limit Theorem)是概率论的又一个基础定理,它指出在独立、同分布的随机变量序列t1、t2、…、tn中,随着n的增大,这些随机变量的和的分布趋近于正态分布。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本科生毕业论文(设计)题目大数定律与中心极限定理的关系及应用姓名学号院系数学科学学院专业数学与应用数学指导教师职称2013年4 月16 日曲阜师范大学教务处制目录摘要 (3)关键词 (3)Abstract (3)Key words (3)引言 (3)1 大数定律与中心极限定理的关系 (4)1.1预备知识 (4)1.1.1大数定律 (4)1.1.2中心极限定理 (5)1.2大数定律与中心极限定理的关系 (6)1.2.1服从大数定律不服从中心极限定理的例子 (7)1.2.2服从中心极限定理不服从大数定律的例子 (8)1.2.3大数定律与中心极限定理均不服从的例子 (9)2 大数定律与中心极限定理在实际生活中的应用 (10)2.1 在误差分析中的应用 (10)2.2 在数学分析中的应用 (11)2.3 在近似计算中的应用 (13)2.4 在保险业中的应用 (14)2.5 在企业管理方面的应用 (15)结论 (16)致谢 (16)参考文献 (17)大数定律与中心极限定理的关系及应用摘要:本文通过对大数定律与中心极限定理在独立同分布和不同分布两种情况下的结论作了比较系统的阐述,揭示了随机现象最根本的性质——平均结果的稳定性。
经过对中心极限定理的讨论,给出了独立随机变量之和的分布可以用正态分布来表示理论依据。
另外,叙述了大数定律与中心极限定理之间的关系,同时通过举出很多相关的反例说明二者的关系。
最后给出了一些简便的大数定律与中心极限定理在误差分析、数学分析、近似计算、保险业及企业管理等几个方面的应用,来进一步地阐明了大数定律与中心极限定理在各分支学科中的重要作用和应用价值。
关键词:大数定律中心极限定理随机变量应用Relationship and Applications betweenthe Law of Large Number and Central Limit TheoremStudent majoring in mathematics and applied mathematics Bai YanfeiTutor Liu LiAbstract: Based on the law of large numbers and central limit theorem in the independent distribution with the different distribution of both cases, it makes more systematic exposition, and reveals the phenomenon of the random nature of the most fundamental an average of the results of the Stability. Through the central limit theorem discussion, it gives out the random variables and the distribution of the normal distribution. At the same time, it demonstrates the relationship between the two aspects through lots of anti-related examples. Finally, it gives out several aspects of applications of a number of simple law of large numbers and the central limit theorem in error analysis, mathematical analysis, the approximate calculation, the insurance industry and business management to further clarify the law of large numbers and the central limit theorem in all branches of the important role and value.Key words: Laws of large number; Central-limit theorem; Random variables; Applications 引言概率论与数理统计是研究随机现象的统计规律的一门学科,而随机现象的统计规律性只有在相同条件下进行大量重复试验或观察才呈现出来。
在随机事件的大量重复出现中,往往呈现几乎必然的规律,这个规律就是大数定律。
大数定律是概率论中一个非常重要的课题,而且是概率论与数理统计之间一个承前启后的重要纽带。
大数定律阐明了大量随机现象平均结果具有稳定性,证明了在大样本条件下,样本平均值可以看作总体平均值,它是“算数平均值法则”的基本理论,通俗地说,这个定理就是在试验不变的条件下,重复试验多次,随机事件的频率以概率为稳定值。
在现实生活中经常可以见到这一类型的数学模型,比如,我们向上抛一枚硬币,硬币落下后哪一面朝上本来是偶然的,但当我们向上抛硬币的次数足够多时,达到上万次甚至几十万几百万次之后,我们会发现,硬币向上的次数约占总次数的二分之一,偶然中包含着必然。
而中心极限定理是概率论中讨论随机变量序列部分和的分布渐近于正态分大数定律和中心极限定理作为概率论的重要内容,其理论成果相对比较完善,这方面的文章较多,结果也比较完美,但对两者之间的关系和应用问题的推广也是一项非常有价值的研究方向,通过对这些问题的应用推广,不仅能加深对这两类定理的理解,而且能使之更为有效的服务于各项知识领域中。
下面文中就通过对大数定律和中心极限定理的讨论,给出了两者之间的关系,归结出一般性结论。
最后列举了一些能用大数定律和中心极限定理来解决的实例,希望能通过这些实例,来进一步阐明两者在各个分支学科中的重要作用,以及在实际生活中的应用价值,加深大家对这两类定理的理解。
1 大数定律与中心极限定理的关系1.1 预备知识1.1.1 大数定律大数定律使用极限方法研究大量随机现象的统计规律性。
人们在长期的实践中发现,频率以及大量测量值的算术平均值具有稳定性,也就是说,无论个别测量值如何,其平均结果实际上与个别测量值的特征无关,几乎不再是随机的了。
这种稳定性问题如何从理论上给出解释?这正是大数定律要解决的问题。
阐明大量重复试验的平均结果具有稳定性的一系列定理都称为大数定律。
一般的大数定律都涉及一个随机变量序列),2,1}({ =n n ξ为此我们给出如下定义:定义1:设),2,1}({ =n n ξ为概率空间},,{P F Ω(其中:Ω样本空间,:F 事件域,P :概率)上定义的随机变量序列(简称随机序列),若存在随机变量ξ,使对任意的ε>0恒有0}{lim =≥-∞→εξξn n P ,或等价地有1}{lim =<-∞→εξξn n P ,则称随机序列}{n ξ依概率收敛于随机变量ξ(ξ也可以使一个常数),并用下面的符号表示: ξξ=∞→n n lim )(P 或ξξ−→−P n . 定义2:设}{n ξ为一随机序列,数学期望)(n E ξ存在,令∑==ni i n n 11ξξ,若0][lim =∞→)(-n n n E ξξ )(P ,则称随机序列}{n ξ服从大数定律,或说大数法则成立。
切比雪夫大数定律:设随机序列}{n ξ为相互独立的随机序列,若n n a E =)(ξ,∞<≤=c D n n 2)(σξ,则}{n ξ服从大数定律。
马尔可夫定理:设随机序列}{n ξ满足∞<≥∀)(,1k E k ξ,∞<∑=)(1n k k D ξ且0)(1lim 1=∑=∞→n k k n D n ξ ,那么}{n ξ服从大数定律。
格涅文科定理:设随机序列}{n ξ相互独立,则对0>∀ε,1})(1{lim 1=<-∑=∞→εξξnk k k n E n P 的充要条件是∑=∞→=-+-n k kk k k n E n E E 12220})()({lim ξξξξ. 1.1.2 中心极限定理自从高斯指出测量误差服从正态分布后,人们发现,正态分布在自然界中极为常见,例如炮弹的弹落点,人的身高、体重等都服从正态分布。
观察表明,如果一个量是由大量相互独立的随机因素的影响所造成的,而其中每一个因素在总的影响中所起的作用微小的,这种随机变量往往近似地服从正态分布。
这种现象就是中心极限定理的客观背景。
中心极限定理回答了大量独立随机变量和的近似分布问题,其结论表明: 当一个量受许多随机因素(主导因素除外) 的共同影响而随机取值,则它的分布就近似服从正态分布。
为了方便后文的叙述,我们给出如下定义:定义1:依分布收敛:设),2,1)(( =n x F n ,)(x F 分别为随机变量}{n ξ),2,1( =n 以及ξ的分布函数,若对于)(x F 的任一连续点x 有)()(lim x F x F n n =∞→,则称随机序列}{n ξ依分布收敛于ξ,并称)(x F 为{)(x F n }的极限分布函数。
如果对于分布函数列)}({x F n 存在一单调不降函数)(x F ,使在)(x F 的每一连续点上)()(lim x F x F n n =∞→,则称)}({x F n 弱收敛于)(x F ,并记为 )()(lim x F x F n n =∞→ )(W 或)()(x F x F W n −→−.定义2:随即序列}{n ξ服从中心极限定理:设}{n ξ),2,1( =n 为相互独立随机变量序列,有有限的数学期望和方差:k k a E =)(ξ ,2)(k k D σξ= ),2,1( =k 令∑==n k k n D B 12)(ξ,∑=-=n k n k k n B a 1ξη ),2,1( =n 若对于R z ∈一致地有 dy e z P z y n n ⎰∞--∞→=<22121}{lim πη ,则称}{n ξ服从中心极限定理。
列维-林德伯格定理:设}{n ξ),2,1( =n 为相互独立同分布的随机序列,且a E k =)ξ(,∞<=2)(σξk D )0(2>σ),2,1( =k ,则{ξn }服从中心极限定理。
费勒定理:设}{n ξ),2,1( =n 为相互独立的随机序列,若∃常数n M ,使 n k n k M ≤≤≤ξ1max ,且0lim =∞→nn n B M ,则}{n ξ服从中心极限定理。