大数定律与中心极限定理的关系及其应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
论文题目:大数定律与中心极限定理的关系及其应用
摘要:本文通过对概率论的经典定理——大数定律与中心极限定理在独立同分布和不同分布两种情况下的结论作了比较系统的阐述,揭示了随机现象最根本的性质——平均结果的稳定性.经过对中心极限定理的讨论,给出了独立随机变量之和的分布可以用正态分布来表示理论依据.关于大数定律方面,较全面地分析和叙述了几种最常用的大数定律.同样中心极限定理的内容也从独立同分布与独立不同分布两个角度来进行讨论;另外,叙述了各种大数定律以及中心极限定理各自之间,大数定律与中心极限定理之间的关系.同时通过举出很多相关的反例说明二者的关系.最后给出了一些简便的大数定律与中心极限定理在数理统计、误差、彩票学、近似计算、保险业及数学分析等几个方面的应用,来进一步地阐明了大数定律与中心极限定理在各分支学科中的重要作用和应用价值.
关键词:随机变量序列;大数定律;中心极限定理;应用
Title:Law of large numbers and the relationship between the central
limit theorem and its application
Abstract: Based on the probability of a classic theorem : the law of large numbers central limit theorem in the independent distribution ; with the different distribution of both cases, it made more systematic exposition, and revealed the phenomenon of the random nature of the most fundamental an average of the results of the Stability . Trough the central limit theorem discussion it will give out the random variables and the distribution of the normal distribution .About the law of large numbers, there are more comprehensive analysis and described several of the most commonly used on it. The content of the same central limit theorem also discussed the independent distribution and independent distribution of the two different perspectives. Also, it will discussed the relationship between the variety of narrative and the law of large numbers between their respective central limit theorem, and that of the law of large numbers and the central limit theorem. At the same time, it demonstrated the relationship between the two aspects through lots of anti-related examples. Finally ,it gave out several aspects of application of a number of simple law of large numbers and the central limit theorem in mathematical statistics, error, lottery school, the approximate calculation, and the insurance industry and mathematical analysis, to further clarify the law of large numbers and the central limit theorem in all branches of the important role and value.
Keywords: Random variables ; Law of large numbers; Central limit theorem; Application
目录
摘要 (I)
Abstract (II)
第1章引言 (1)
第2章大数定律及其证明 (2)
2.1 几个相关定义 (2)
2.2 大数定律及其证明 (4)
第3章中心极限定理 (8)
3.1 中心极限定理的提法 (8)
第4章大数定律与中心极限定理的关系 (11)
4.1 服从大数定律, 但不服从中心极限定理 (11)
4.2 服从中心极限定理, 但不服从大数定律 (12)
4.3 大数定律与中心极限定理都不服从 (13)
4.4 大数定律、中心极限定理都服从 (13)
第5章应用 (14)
5.1“概率”及“数学期望”的确切定义 (14)
5.2 解释测量(随机) 误差 (14)
5.3 在数学分析中的应用 (15)
5.4 在计算精确的近似概率方面的应用 (16)
5.5 在彩票和保险业的应用 (17)
结语 (20)
参考文献 (21)
致谢 (22)
附录 (23)
第1章引言
概率论与数理统计是研究随机现象的统计规律的科学,而随机现象的统计规律性只有在相同条件下进行大量重复试验或观察才呈现出来. 从概率的统计定义中可以看出:一个事件发生的频率具有稳定性,即随着试验次数的增多,事件的频率逐渐稳定在某个常数附近. 人们在实践中观察其他一些随机现象时,也常常会发现大量随机个体的平均效果的稳定性. 这就是说,无论个别随机个体以及它们在试验进行过程中的个别特征如何,大量随机个体的平均效果与每一个体的特征无关,且不再是随机的. 深入考虑后,人们会提出这样的问题:稳定性的确切含义是什么? 在什么条件下具有稳定性? 这就是大数定律要研究的问题.
众所周知,中心极限定理是概率论中最重要、最基本的一个定理.中心极限定理揭示了离散型随机变量与连续型随机变量之间的内在联系, 为用连续型随机变量的分布,特别是标准正态分布对离散型随机变量进行概率计算提供了理论基础.基于中心极限定理的概率统计方法在生活中的应用,本文利用中心极限定理,分析了保险业和近似计算中的应用.
第2章 大数定律及其证明
2.1 几个相关定义
定义1[1] 设n (1,2,)n ξ=为概率空间(,,)F P Ω上定义的随机变量序列(简称随机序列),若存在随机变数ξ,使对任意0ε>,恒有:lim {}0n n p ξξε→∞
-≥=或lim {}1n n p ξξε→∞
-≤=, 则称随机序列{}n ξ概率收敛于随机变量ξ(ξ也可以是一个常数),并用下面的符号表示:lim ()n n p ξξ→∞
=或p n ξξ−−→. 定义 2[2][6][8] 设{}n ξ为随机变量序列, 数学期望n E ξ存在()1n ≥,如果对任意的
0ε>.恒有:11
11lim (())1n n i i n i i p E n n ξξε→∞==-<=∑∑, 则称随机变量序列{}n ξ服从大数定律. 定义 3 设{}n ξ为随机变量序列, 如果存在常数序列{}n a .对任意的0ε>.恒
有:1
1lim ()1n
i n n i p a n ξε→∞=-<=∑, 则称随机变量序列{}n ξ服从大数定律. 注:定义2和定义3两种大数定律定义的讨论
所谓大数定律, 它是揭示大量随机现象的平均结果稳定于平均值的极限理论.而大
量随机现象即{}n ξ的平均结果是11n i i n ξ=∑(n 充分大),其平均值是1
1()n
i i E n ξ=∑.因此, 从这一角度来考虑,定义2是恰当的.定义3与定义2的不同点在于它并不要求随机变量n ξ的期望n E ξ存在(1n ≥),只要存在常数序列{}n a ,使对任意的0ε>.恒有
1
1lim ()1n
i n n i p a n ξε→∞=-<=∑即可.为了弄清这两种定义的异同,我们必须讨论数列{}n a 与数列{1
1()n
i i E n ξ=∑}之间的关系. 首先,当n E ξ(1n ≥)存在时,我们不难证明:0δ∀>,1
1lim (())0n
n i n i p a E n ξδ→∞=-≥=∑这个结果表明在n E ξ(1n ≥)异存在时,只需取1
1()n
n i i a E n ξ==∑,(1n ≥).此时, 定义2 与定义
3 是等价的.
其次,当n E ξ(1n ≥)不存在时, 由定义2知{}n ξ不服从大数定律, 而此时, 存在常数列{}n a 使定义3仍然成立.
综合上述定义2与定义3不是等价的.定义3不仅在形式上而且在内涵上比定义2更广泛.
定义 4[3] 设{()}n F x 是分布函数序列,若存在一个非将函数()F x ,对于它的每一连
续点x ,都有lim ()()n n F x F x →∞
=,()()w n F x F x −−→,则称分布函数序列{()}n F x 弱收敛于()F x .
定义5 设n ()(1,2,)F x n =, ()F x 分别是随机变量(1,2,)n n ξ=及ξ的分布函数,若
()()w n F x F x −−→,则称{}n ξ依分布收敛于ξ,亦记为L n ξξ−−→,且有:
(1)若p n ξξ−−
→,则L n ξξ−−→; (2)设c 为常数,则p n c ξ−−
→的充要条件是L n c ξ−−→. 逆极限定理:设特征函数列{()}n f x 收敛于某一函数()f t ,且()f t 在0t =时连续,则相应的分布函数列{()}n F x 弱收敛于某一分布函数()F x ,而且()f t 是()F x 的特征函数.
车比雪夫不等式[4]:设ξ是一个随机变量,它的数学期望为a ,方差为2σ,则对任意的正常数ε恒有:
2
2{},p a σξεε
-≥≤ (2-1) 或有2
2{}1p a σξεε-<≥- (2-2)
称(2-1)式或(2-2)式为车比雪夫不等式.以下就连续型随机变量来证明这个不等式.
证 设的密度函数为()f x ,则有
222()()()()()x EX x EX DX x EX f x dx x EX f x dx f x dx εεε+∞-∞-≥-≥=-≥-≥⎰⎰⎰
{}22()x EX f x dx P x EX εεεε-≥==-≥⎰,
于是 {}2DX
P x EX εε-≥≤
这个不等式可解释为:对任意给定的正常数ε,可以作为两个区间(,)a ε-∞-和
(,)a ε++∞.
(1)式表示,在一次试验中,随机变量ξ的取值落在(,)(,)a a εε-∞-⋃++∞的概率小于等于22σε.不等式说明DX 越小,则X 的取值越集中在EX 附近.这进一步说明了方差是反映随机变量取值的离散程度的.
2.2 大数定律及其证明
大数定律形式有很多,我们仅介绍几种最常用的大数定律.
定理1[5][6] (车比雪夫大数定律)
设随机变量12n ,,
,,ξξξ相互独立,它们的数学期望依次为12n ,,,,a a a ,方差依次为22212,,,,n σσσ而且存在正常数k ,使得对一切1,2,i =有2i k σ<,则对任意给定的
正常数ε,恒有11
11lim {}1n n
i i n i i p a n n ξε→∞==-<=∑∑ 证 设1
1n
i i n ξξ==∑,则ξ的数学期望和方差分别为: 111111n n n i i i i i i E E E a n n n ξξξ===⎛⎫=== ⎪⎝⎭∑∑∑,22211
1111n n
n i i i i i i D D D n n n ξξξσ===⎛⎫=== ⎪⎝⎭∑∑∑ 由车比雪夫不等式,对任意给定的正数ε,有
11111{}n n
i i i i p a n n ξε==≥-<∑∑=22221222{}1111n i
i D p E nk n k n n σξξξεεεεε=-<≥-=->-=-∑ 即 211
111{}1n n
i i i i p a k n n n ξεε==≥-<=-∑∑. 对不等式取极限,则得11
11lim {}1n n
i i n i i p a n n ξε→∞==-<=∑∑ 车比雪夫大数定律表明,在一定条件下,当n 充分大时,n 个随机变量的算术平均值1
1n i i n ξ=∑偏离其数学期望的可能性很小.这也正是用一系列测量值的平均值来近似代替真值的做法的原则.
推论 1 设随机变量12n ,,,,ξξξ相互独立,且它们具有相同的分布及有限的数学期望和方差:E a ξ=,2(1,2,)D i ξσ==,则对任意给定的正数ε,有
1
1lim {}1n
i n i p a n ξε→∞=-<=∑. 此推论证明:n 个相互独立的具有相同数学期望和方差的随机变量,当n 很大时,它们的算术平均值几乎是一个常数,这个常数就是它们的数学期望.
定理 2[7] (辛钦大数定律)
设12n ,,,,ξξξ是相互独立的随机变量,而且有相同是的分布,具有有限的数学期
望k ,(1,2,)E a k ξ==,则对任意给定的0ε>,有1
1lim {}1n
k n k p a n ξε→∞=-<=∑. 注:定理2中条件比定理1中的条件要宽,在定理1中要求方差有限,而定理2不需要这个条件.辛钦大数定律说明独立同分布的随机变量的算术平均值依概率收敛于它的数学期望值,它为在实际应用中用算术平均值估计数学期望提供了理论依据.
证 因为12n ,,,,ξξξ是具有相同分布的随机变量序列,故它们有相同的特征函数.设它们的特征函数为()f t ,由于k E ξ存在,故()f t 有展开式:'()(0)(0)()1()f t f f t t iat t οο=++=++,其中()t ο表示关于t 的高阶无穷小量.
再由独立性知,11n k k n ξ=∑的特征函数为:1n n
t t t f ia n n n ο⎡⎤⎡⎤⎛⎫⎛⎫=++ ⎪ ⎪⎢⎥⎢⎥⎝⎭⎝⎭⎣⎦⎣⎦.对任意取定的数t ,有lim lim 1n n
iat n n t t t f ia e n n n ο→∞→∞⎡⎤⎡⎤⎛⎫⎛⎫=++= ⎪ ⎪⎢⎥⎢⎥⎝⎭⎝⎭⎣⎦⎣⎦.而iat e 是连续函数,且是单点分布的特征函数,由逆极限定理知:11n
k k n ξ=∑的分布函数弱收敛于()F x .其中,1,(),0,x a F x x a >⎧=⎨=⎩
因此,11,n L k k a n ξ=−−→∑由(2)式知:1
1n P k k a n ξ=−−→∑. 定理 3[8] (贝努利大数定律)
设n μ是n 次独立试验中事件A 发生的次数, p 是事件A 在每次试验中发生的概率,则对任意给定的正数ε,有lim {}1n n p p n με→∞-<= 或 lim {}0n n p p n με→∞-≥=
证 令 0,1,2,1n k A Y k k A ⎧==⎨⎩第试验不发生,,第试验发生
.显然12n n Y Y Y μ=+++,由于各次试验是独立的,从而12,,,,n Y Y Y 相互独立,又k Y 服从参数为P 的两点分布,所以(),()(1),(1,2,)k k E Y P D Y P P k ==-=. 由定理1有 lim {}1n n p p n με→∞-<=.
此定理表明:当n 很大时, n 重贝努利试验中事件A 发生的频率几乎等于事件A 在每次试验中发生的概率,这个定理以严格的数学形式刻画了频率的稳定性,因此,在实际应用中,当试验次数很大时,便可以用事件发生的频率来代替事件的概率.
证 作一次观察时n μ是定值, 作多次观察时n μ是随机变量,而且(,),n
B n p μ因此:
n E np μ=,n D npq μ=,()n E n p μ=,()n D n pq n μ=. 在车比雪夫不等式中,取 n n ξμ=,则a p =,2pq n σ=,于是对任意给定的正数ε,有21{}11()n
pq p p n n n μεε≥-<≥-→→∞,因而lim {}1n n p p n
με→∞-<=. 定理 4 (泊松大数定律)
设12n ,,,,ξξξ是相互独立的随机变量, P{1}n n P ξ==, P{0}n n q ξ== (其中n P 1n q =-) ,则{}n ξ服从大数定律.
证 由定理所设可得:1
1E()n
n i n i P P n ξ===∑, 2221111111()()24n n n n n n i i i i i i P q D D Pq n n n n
ξξ===+⎛⎫==≤= ⎪⎝⎭∑∑∑. 由车比雪夫不等式得,对任意0ε>,有22
()10{} 4n n n D P P n ξξεεε≤-≥≤
≤. 两边取极限,得lim {}0n n n P P ξε→∞-≥=. 泊松大数定律是贝努利大数定律的推广, 贝努利大数定律证明了事件在完全相同条件下重复进行的随机试验中频率的稳定性;而泊松定理表明,当独立进行的随机试验的条件变化时, 频率仍然具有稳定性:随着n 的无限增大,在n 次独立试验中,事件 A 的频率趋于稳定在各次试验中事件A 出现概率的算术平均值附近.
定理5[9][10] 马尔可夫(Marrkov) 大数定律)
设{}k ξ是随机变量序列,若21
1
lim ()0n
k n k D n ξ→∞==∑,则对任意>0ε,均有
11
11lim {}1n n
k k n k k p E n n ξξε→∞==-<=∑∑,即{}k ξ服从大数定律. 证 车比雪夫不等式得21
2
11
1
()111{}1n
k n n
k k k k k D n p E n n ξξξεε
===≥-<≥-
∑∑∑,取极限
得:11
11lim {}1n n
k k n k k p E n n ξξε→∞==-<=∑∑
注:车比雪夫大数定律可又马尔可夫大数定律推出,更重要的是马尔可夫大数定律已经没有任何关于独立性的规定.
第3章 中心极限定理
直观上,如果一随机变量决定于大量(乃至无穷多个)随机.因素的总合,其中每个随机因素的单独作用微不足道,而且各因素的作用相对均匀,那么它就服从(或近似地服从)正态分布,下面我们将按严格的数学形式来表述这一直观.
3.1 中心极限定理的提法
定理 6[3][11] (林德贝格——列维定理(Lindeberg-Levy)中心极限定理) 设随机变量12,,
ξξ是一列独立同分布的随机变量,并且具有数学期望k E a ξ=和方
差22(0),1,2,
k D k ξσσ=>=,则对任意实数x ,有
2
2
lim ()t n k x
n na P x e dt x ξ--∞
→∞⎛⎫
- ⎪⎪<=
=Φ⎪
⎪⎝⎭
∑
(3-1) 证 设k a ξ-的特征函数为()t ϕ,
1n
k
n
k na
ξ
=-=∑
的特征函数为n
ϕ⎡
⎤⎢⎥⎣⎦
又因为()()20,k k E a D a ξξσ-=-=,所以'''2(0)0,(0)ϕϕσ==-
于是特征函数()t ϕ有展开式:2'
''
22221
()()(0)(0)()1()22
t t t t t t t ϕϕϕϕοσο=+++=-+,从而
对任意固定的t ,
有2222
1(),2n
n t
t t e n n
n ϕο-⎡⎤⎡⎤=-+→→∞⎢⎥⎢⎥⎣⎦⎣⎦ 而2
2t e -是()0,1N 分布的特征函数,因此由特征函数的连续性定理即知(3-1)成立,定理得证.
定理6又称独立同分布的中心极限定理,它表达了正态分布在概率论中的特殊地位,
尽管k ξ的分布是任意的,但只要n 充分大,
随机变量
n
k
na
ξ
-∑近似服从标准正态分布
(0,1)N .或者说,当n 很大时,独立同分布的随机变量k ξ的和1
n
k k ξ=∑ 近似地服从正态分布
2(,)N n n μσ.这就是那些(可以看作有许多微小的、独立的随机因素作用的总结果,而每
一个因素的影响却都很小)随机变量,一般都可以近似地服从正态分布的理论依据,因而
正态分布在理论上和应用上都具有极大的重要性.
若(,)B n p ξ
,则当n 很大时,有
()P a b ξ⎛⎫⎛⎫
≤≤≈Φ-Φ 定理 7 (棣莫弗—拉普拉斯(De Moivre-Laplace)中心极限定理) 设随机变量n η服从二项分布(,)B n p ,则对于任意区间[,]a b ,恒有
2
2lim t n
k b a n na P a b dt ξ-→∞⎛⎫- ⎪ ⎪≤<= ⎪
⎪⎝⎭
∑⎰
二项分布的极限分布是正态分布 即如果(,)X B n p ,则
2
2()()t n
k b a
na P a b dt b a ξ-⎛⎫- ⎪ ⎪≤<≈=Φ-Φ ⎪
⎪⎝⎭
∑⎰
一般地,如果(,)X B n p ,则
(
)P a X b P ⎛⎫≤<=≤<
≈Φ-Φ
说明:这个公式给出了n 较大时二项分布的概率计算方法. 引理 设12,,
ξξ是独立随机变量序列,又k k E a ξ=,2(1,2,)k k D k ξσ==,
2
21n
n
k k B σ==∑,这时:
(1) 若{}k ξ是连续型随机变量,密度函数为{}()n P x ,如果对任意0τ>,有
221
1lim ()()0k n n
k k x a B n k n x a P x dx B τ->→∞=-=∑⎰
(2) 若{}k ξ是离散型随机变量,k ξ的分布列为(),1,2,
n nj nj P x P j ξ===,如果对任
意0τ>,有()2211lim 0nj k n
n
nj k kj n k x a B n x a P B τ→∞=->-=∑∑
则称{}k ξ满足林德贝尔格条件.
定理 8 (林德贝格定理) 设独立随机变量序列12,,
ξξ满足林德贝尔格条件,则
当时,对任意的,有(
)2
2
11lim y n x
k k n k n P a x e dy B ξ--∞
→∞=⎛⎫-<=
⎪⎝⎭
∑
这个定理证明了由大量微小而且独立的随机因素引起并积累而成的变量,必将是一个正态随机变量,由林德贝尔格条件可看到定理并不要求各个加项“同分布”,因而它比前述的林德贝尔格——勒维定理更强,事实上林德贝尔格——勒维定理可以由它推出.
定理 9 (李雅普诺夫定理) 设12,,
ξξ是独立随机变量序列,又
k k E a ξ=,2
(1,2,)k k D k ξσ==,记2
21
n
n
k k B σ==∑,若存在0δ>,使有
221
10,n
k
k
k n
E a n B δ
δξ
++=-→→∞∑,则对任意的实数x ,有
(
)2
2
11lim y n x
k k n k n P a x e dy B ξ--∞
→∞=⎛⎫-<= ⎪⎝⎭
∑
定理9又称独立非同分布的中心极限定理,李雅普诺夫定理可以解释如下:假定被研究的随机变量可以表示为大量独立随机变量的总和,且总和中的每个单独的随机变量对于总和又不起主要作用,那么可以认为这个随机变量近似地服从正态分布.
讨论了独立随机变量和的分布的极限问题,在一定条件下,这些分布弱收敛于退化分布,这就是大数定律.凡是在一定条件下断定随机变量之和的极限分布是正态分布的定理,在概率论中统称为中心极限定理.具体一点说,中心极限定理回答的是(独立或弱相依)随机变量之和的极限分布在什么条件下是正态的.中心极限定理是揭示产生正态分布的源泉,是应用正态分布来解决各种实际问题的理论基础.
第4章 大数定律与中心极限定理的关系
概率论中关于独立随机变量序列的极限理论, 已相当完整, 各种问题已有了令人满意的回答,但由于一般教材中, 特别是工科教材, 只介绍一、二个最简单的基本定理,若弱大数定律只介绍切比契夫定理的特殊情况, 中心极限定理只介绍同分布的林德贝格——列维定理(Lindeberg-Levy)的特殊情况——德莫弗—拉普拉斯(De Moivre-Laplace)定理.仅少数教材提及林德贝格条件. 这几个定理的条件又都是充分条件, 我们容易产生这样的问题: 大数定律与中心极限定理之间究竟有什么关系? 服从大数定律的是否服从中心极限定理? 反之又如何? 是否有两者都服从或都不服从的随机序列?因教材知识所限, 这些问题不太好回答, 现拟补充几个定理, 以简单的例子加以说明.
定理10[12] (格涅坚克定理) 设有相互独立的随机变量序列{}k ξ, 则对0ε∀>,
11lim {()}1n k k n k p E n ξξε→∞=-<=∑的充要条件是2
221()lim []0()n
k k n k k k
E E n E ξξξξ→∞=-=+-∑. 定理11 (马尔科夫定理) 随机变量序列{}k ξ, 若21
1
()0n
k k D n ξ=→∑,则对0ε∀>, 有
1
1lim {()}1n
k k n k p E n ξξε→∞=-<=∑. 定理12 (费勒定理) 对相互独立随机变量序列{}k ξ, 若∃常数n M ,使1max k n k n
M ξ≤≤≤,
且lim
0n
n n
M B →∞=, 则{}k ξ服从中心极限定理.
设{}k ξ为相互独立的随机变量序列, 以下在,,()k k j k j P P ξα==中, 令,,,k j k j P α取不同的值, 以说明不同的情形.
4.1
[12][13]
服从大数定律, 但不服从中心极限定理
令()
,1,12
10,121k k P k α==-+,()
,2,22
1,21k k k P k α==
+,()
,3,32
1,21k k k P k α==+,
1,2,3,
k =,即()
2
1
(0)11k P k ξ==-
+,()
2
1()()21k k P k P k k ξξ===-=
+
可知0,k E ξ=()
2
2
2
1k k k D E k ξξ==+,()
2
22
1
1
1n n
n
k k k k B D k ξ====+∑∑
因
22211
0,n B n n n n
<⋅→→∞, 由马尔科夫定理知, 大数定律成立, 但中心极限定理不成立. 这是因为
1211
1
(0)(0,0,
,0)(0)(0)
n n
k n k k k k k P P P P ξξξξξξ∞
==========≥=∑∏∏
()2
1
1
1
(1)02
1n
k k ==-
=>+∏ 若服从中心极限定理,则取120,0x x <>,
有2
2
2
1
1211()t n x k x k n P x x e dt B ξ-=<<=
∑, 当
12,x x 充分靠近 0 时
2
2
2
1
1
2
t x x e dt -<
⎰
. 这就出现了矛盾. 所以中心极限定理不成立. 4.2 服从中心极限定理, 但不服从大数定律
取,,()k k j k j P P ξα==,为1()2k P k ξ==
,1
()2
k P k ξ=-=,1,2,,k =可知0,k E ξ=
2
k D k ξ=,2
2
1n
n
k B k ==∑, 又 33333
22221(1)(1)lim lim lim 3(1)n n n n n n
n n n n n B B B n →∞→∞→∞++-+-===-+, 即 3
13
223lim lim 13n n n n
n n
B B -→∞→∞==,()
1
2
1
3
3lim
1n n
n B -→∞=
又 1ax k k n
M n ξ≤≤≤,()
1213lim
lim 03n n n n n B n →∞→∞-== 则由费勒定理知中心极限定理成立, 但不服从大数定律, 这是因为
2()x
x R n x
∈+, 为凸函数, 由琴生不等式222
22222
2
()k k k k E k E n n E n k
ξξξξ≥=+++, 而 222222111
111
,244n
n
n k k k k k n k n n k n n n n ===+≥==→→∞++∑∑∑ 由格涅坚克定理知, {}k ξ不服从大数定律.
4.3 大数定律与中心极限定理都不服从
取,,()k k j k j P P ξα==,为1(2)2k k P ξ==
,1
(2)2
k k P ξ=-=,可知0,k E ξ=4k k D ξ=, 211
44(41)3n
n
k n n
k k k B D ξ=====-∑∑, 当 n 充分大时2
4n n
B >,即2n n B > 2
1
1
1
2222(21)2
n
n
n n n k
k k k ξ
ξ+==≤≤++
+=-<∑∑ , 1
12n
k k n B ξ=<∑
故11lim (2)1(2)(2)1n
k n k n P B ξ→∞=<=≠Φ-Φ-<∑ 可知不服从中心极限定理, 又
22222222111144()44k k
n
n n n
k k k n
k k k k k k E E n n E n n ξξξξ====≥=>++++∑∑∑∑ 2
21
1144
4(41),4433
n
k n n
n k n n n ===
⋅-→→∞++∑, 由格涅坚克定理知不服从大数定律.
4.4 大数定律、中心极限定理都服从
若{}k ξ为同分布且有有限期望及大于零的方差, 则由教材中定理易知两者都服从.
这时有11lim (())1n
k k n k P E n ξξε→∞=-<=∑.但括号中的事件概率, 究竞有多大? 大数定律未能
回答. 而根据中心极限定理有
2
2
11
1(())()x n n
k k k k
k x P E P E e dx n ξξεξξσ-==≤
-<=-<≈∑
其中2k D σξ=, 这样看来在所假定的条件下, 中心极限定理比大数定律更精确.
第5章 应用
大数定律以严格的数学形式表达了随机现象最根本的性质——平均结果的稳定性,它是随机现象统计规律性的具体表现. 因此,大数定律在理论和实际中都有广泛的应用.
5.1[3] “概率”及“数学期望”的确切定义
在给出二者定义时,都采用“稳定”一词,这是一种不确切的描述.依据大数定律可给出更确切的表达,即:
概率——独立重复实验中,事件A 出现的频率1
1n P
i i P n ξ=−−
→∑,则该常数P 即为概率.
数学期望——对于任一0ε>,有1
1lim ()1n
i n i p n ξμε→∞=-<=∑,则()k E μξ=称为数学期
望.
5.2 解释测量(随机) 误差
根据大数定律,对于随机误差12,,
,n δδδ,应有1
10n P
i i n δ=−−→∑.
这说明当测量次数较多时, 实测数据的平均值1
1n
i i a n δ=+∑和预测真值a 的差值能以
很大概率趋于0,因此,用求样本数据平均值的方法来进行测量是可行的.
例1[14] 某种仪器测量已知量A 时,设n 次独立得到的测量数据为12,,
,n x x x ,如果
仪器无系统误差,问:当n 充分大时, 是否可取作为仪器测量误差的方差的近似值?
解 把(1,2,
,)i x i n = 视作n 个独立同分布的随机变量的观察值,则
()i E x μ=,2(),(1,2,
,)i D x i n σ==.仪器第i 次测量的误差i x A -的数学期望
()i E x A A μ-=-,方差2()i D x A σ-=.设2(),1,2,
,i i Y x A i n =-=,则i Y 也相互独立服从
同一分布.
在仪器无系统误差时()0i E x A -=,即有A μ=,
222()()()()(1,2,,)i i i i i E Y E x A E x Ex D x i n σ⎡⎤⎡⎤=-=-===⎣⎦⎣⎦
由车比雪夫定律,可得: 211lim {}1n
i n i p Y n σε→∞=-<=∑
即 ()2
21
1lim {}1n i n i p x A n σε→∞=--<=∑
从而确定,当n →∞时,随机变量()2
11n i i x A n =-∑依概率收敛于2σ,即当n 充分大时可以
取()2
1
1n i i x A n =-∑作为仪器测量误差的方差. 5.3 在数学分析中的应用
例2[1] 假设()22
2
12121,,
,:,0,
,12
n n n n n G x x x x x x x x ⎧
⎫
=++
+≤≤≤⎨⎬⎩
⎭
,求其极限.
解 假设随机变量(1,2,)n n ξ=在[]0,1上有均匀分布,而且相互独立,有
112D ξ=
,211
2
E ξ=,易见(){}221
11,
,2n n n n n G n dx dx P G P ξξξξ⎧
⎫=∈=+
+≤⎨⎬⎩
⎭
⎰⎰
()()22
22
22
2111
11
1
11
111266n n
n
i i P P E P E n n n ξξξξξξξ=⎧⎫⎧⎫⎧⎫=+
+≤=+
+-≤≥-≤⎨⎬⎨⎬⎨⎬
⎩⎭⎩⎭⎩⎭∑由
1,,n ξξ独立同分布,可见221,,,n ξξ独立同分布.根据辛钦大数定律知:
2111
lim ()16
n i i n i p E n ξξ→∞=-≤=∑从而1
lim 1n n G n dx
dx →∞=⎰⎰.
例3 用概率方法证明维尔斯特拉斯[weierstrass ]定理.
假定()f x 在闭区间[],a b 上是连续的,那么,存在一列多项式12(),(),B x B x ,一致收
敛于函数()f x ,[],x a b ∈.
证 不妨设0,1a b ==.假设()f x ,[]0,1x ∈是连续函数,那么()f x 在[]0,1上一致连续并且有界.对于任意[]120,0,0,1x x ε>≤∈存在0δ>,使12()()2
f x f x ε
-<
,只要
12x x ε-<.此外,对于一切01x ≤≤,有()f x k ≤(常数).现在,建立一多项式:
0()(1)n
m m n m n n n m m B x Ef f C x x n n ξ-=⎛⎫⎛⎫==- ⎪ ⎪⎝⎭⎝⎭
∑
,其中n ξ服从二项分布, 参数为1n ≥, 而[]0,1x ∈, 显然(0)(0)n B f =,(1)(1)n B f =.由贝努利大数定律知()lim
n
n x P n
ξ→∞
=,[]
0,1x ∈现在证明()n n B x f n ξ⎛⎫= ⎪⎝⎭一致收敛于()f x ,[]0,1x ∈.由于0
(1)1n
m m
n m n
m C x x -=-=∑,可见()()0()(1)n
m m
n m n n m m B x f x f f x C x x n -=⎡⎤⎛⎫-=-- ⎪⎢⎥⎝⎭⎣⎦
∑,
由此可得:
()()0()(1)n
m m
n m
n n m m B x f x f f x C x x n -=⎛⎫-≤-- ⎪⎝⎭∑()()(1)(1)m m n m m m n m n n m
m
x x n
n
m m f f x C x x f f x C x x n n δδ---<-≥⎛⎫⎛⎫=
--+-- ⎪ ⎪⎝⎭
⎝⎭
∑
∑
2(1)22
2m m n m n n m
x n
k
C x x kP x n δε
ε
ξδ--<⎧⎫
<
+-=
+-≥⎨⎬⎩⎭
∑
. 由于对任意[]0,1x ∈,
P
n
x n ξ−−→可见存在N ,使当时n N ≥,4n P x n k
ξεδ⎧⎫-≥≤
⎨⎬⎩⎭ 从而,当n N ≥时,对于一切[]0,1x ∈,有:()()22
42
2
n B x f x k k
ε
ε
ε
ε
ε-<
+
=
+
=.即
()n B x 关于[]0,1x ∈一致收敛于()f x .
5.4 在计算精确的近似概率方面的应用
例4[15] 现有一大批种子,其中良种占1/6 ,今在其中任选6000 粒,试分别用切比雪夫不等式估计和用中心极限定理计算在这些种子中良种所占的比例与1/6之差小于1%的概率是多少?
解 设取出的种子中的良种粒数为X ,则1
(6000,)6
X
B 于是
1600010006EX np ==⨯= 155
(1)60001000666
DX np p =-=⨯⨯=⨯
(1) 要估计的规律为{}1110006060006100X P P X ⎧⎫
-<=-<⎨⎬⎩⎭
相
当于在切比雪夫不等式中取60ε=,于是
{}21110006016000610060X DX P P X ⎧⎫-<=-<≥-⎨⎬⎩⎭
由题意得 25111100010.23150.76856063600
DX -=-⨯⨯=-= 即用切比雪夫不等式估计此概率不小于0.7685.
(2) 由拉普拉斯中心极限定理,对于二项分布1(6000,)6
B ,可用正态分布5(1000,1000)6
N ⨯近似, 于是所求概率为{}11940106060006100X P P X ⎧⎫-<=<<⎨⎬⎩⎭ 2(2.0785)10.9625
≈Φ-Φ≈Φ-≈ 从本例看出:用切比雪夫不等式只能得出来要求的概率不小于0.7685,而用中心极限定理可得出要求的概率近似等于0.9625.从而知道由切比雪夫不等式得到的下界是十分粗糙的.但由于它的要求比较低,只要知道X 的期望和方差,因而在理论上有许多运用.
当i X 独立同分布(可以是任何分布),计算1()n P a X X b <++≤的概率时,利用中心极限定理往往能得到相当精确的近似概率,在实际问题上广泛运用.
5.5[16][17] 在彩票和保险业的应用
大数定律和中心极限定理是概率论中两类具有极大意义的重要定理. 大数定律证明了在大样本条件下,样本平均值可以看作是总体平均值(数学期望) ,它是“算术平均值法则”的理论基础;中心极限定理比大数定律更为详细具体,它以严格的数学形式阐明了在大样本条件下,不论总体的分布如何,样本均值总是近似的服从正态分布. 正是这个结论使得正态分布在数理统计和误差分析中占有特殊的地位,是正态分布得以广泛应用的理论基础. 本文通过对彩票学和保险业等几个具体事例的引用展现了大数定律和中心极限定理的实际应用.
大数定理在实际生活中应用十分广泛,我们现在以生活中最平常的但都很感兴趣的事情——彩票为例来详细阐述一下大数定理在彩票学中的应用.
我们知道概率论是研究现实世界随机现象的科学,是近代数学的重要组成部分. 它在自然科学以及经济工作中都有着广泛的应用,同时也是数理统计的基础. 彩票投注的中奖概率分布完全符合它的原理. 彩票的投注方法是一个玩数字游戏. 彩票号码的摇
出是随机事件,也可以说是一随机现象,属概率论的一个基本概念. 首先我们应该先清楚什么是随机现象? 我们说随机现象的特点是:事先不能预言其结果,具有偶然性;另一方面,在相同条件进行大量的重复试验,会呈现出某种规律性(特别是随机开奖次数的不断增多).
例如:在相同条件下,多次抛掷质量均匀的同一枚硬币,则出现正面向上的次数约占总抛次数的一半,而且随着抛掷次数的增加,正面向上次数是总抛次数的12.这就是概率论的统计结果.(请看下面5次抛币的试验结果)有人曾经做过抛掷硬币的试验,试验结果记录如下:投掷次数N,正面向上次数M.
N M=
M0.5181
N=1061
=2048
N M=
N=2048
=4040
M0.5069
N M=
M0.5016
=12000
N=6019
N M=
=24000
M0.5005
N=12012
N M=
M0.4996
N=14984
=30000
N M=
M0.5011
N=36124
=72088
由上述情况可以看出投掷次数很大时,其频率稳定于0.5彩票每期摇出的中奖号码(基本号码和特别号码)是一个随机事件,既然是随机事件,必有其分布规律.
1. 2001010期至2001023期“上海风采”电脑福利彩票开奖计14期共摇出14*8112
=
个球.
2. 每个球平均出现
3.6次
3. 奇数出现59次;偶数出现53次
4. 小于或等于15的数47次;大于或等于16的数出现65次
由此,我们引入彩票的一对常用语“冷门号码”及“热门号码”.
有了“冷门号码”及“热门号码”,我们只要扑捉到这种机会,将会提高中奖纪律.
概率分布的四条法则:
1. 奇数.偶数出现的次数应占总数的12(由于不确定因素除外).
2. 大数.小数出现的次数应占总数的12(由于不确定因素除外).
3. 1-10区段,11-20区段,21-31区段,三区段出现的数个占总数的13(由于不确定因素除外).
4. 各数出现的次数,随着实验(开奖)次数的增加不断靠近平均值(由于不确定因素除外).
综上所述,随机的摇球事件随着实验(开奖)次数的增加都会显示出它的某些规律性,而这种规律性可以借助概率论的知识,利用小概率统计法,分析判断号码.
通过数字统计,运用概率论原理来判断冷热号码出现的周期. 分析号码可能出现的区段. 缩小精选号码范围. 为新一期选择号码提供参考依据,从而达到提高中奖得率.
实际上,对于彩票而言,也不是完全没有规律可循,只要经过大量的观察,根据大数定律就可以进行统计预测,提高中奖的几率. 概率论是一门系统学科,一般人了解的概率,不是从理论上认识,仅仅限于经验. 时间的表层认识. 与其硬着头皮去盲目猜测,不如运用简单的概率学统计分析方法更简单,更容易掌握. 把每期中奖号码出现的次数累加起来,一一进行统计,累计到一定量后,就能发现奖项及其相关指标的概率波动特性. 彩民再根据这些进行选号投注,就可以大大提高中奖几率.
中心极限定理指出:如果一个随机变量有众多的随机因素所引起,每个因素在总的变化里起着不大作用,就可以推断描述这个随机现象的随机变量近似的服从正态分布,所以要求随机变量之和落在某个区间上的概率,只要把它标准化,用正态分布作近似计算即可. 中心极限定理还及时了离散型随机变量与连续型随机变量的内在联系,即离散型随机变量的极限分布是正态分布.
中心极限定理对保险业更是具有指导性的意义,一个保险公司的亏盈,是否破产,我们通过学习中心极限定理的知识都可以做到估算和预测. 大数定律是近代保险业赖以建立的基础. 根据大数定律中心极限定理,我们知道承保的危险单位越多,损失概率的偏差越小,反之,承保的危险单位越少,损失概率的偏差越大. 因此,保险人运用大数法则就可以比较精确的预测危险,合理的拟定保险费率. 下面我们以一道具体的有关保险业的实例来阐述一下大数定律和中心极限定理在保险业中的重要作用和具体应用.
例 5 已知在某人寿保险公司里有10000个同一年龄段的人参加保险,在同一年里这些人死亡率为0.1% ,参加保险的人在一年的头一天交付保险费10元,死亡是家属可以从保险公司领取2000元的抚恤金. 求保险公司一年中获利不少于40000 元的概率;保险公司亏本的概率是多少?
解 设一年中死亡的人数为x 人. 死亡概率为0.001P = ,把考虑10000人在一年里是否死亡看成10000重贝努里试验,
保险公司每年收入为10000*10100000= 元,付出2000x 元.
(1) P (保险公司获利不少于40000 元){}(1000002000)40000P x =->=。