第二节中心极限定理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
查表得: (1.65) 0.95053 0.95 20 3 1.65 解得: n 441
n
结论: 441 个数 相加时可使误 差总和的绝对 值小于10 的概 率大于0. 9.
概率统计
例3. 在人寿保险公司里,有16000名同一年龄的人 参加人寿保险。一年里这些人的死亡率为 0.1%;参加保险的人在一年的第一天交付保 险费3元,死亡时家属可以从保险公司领取 2000元。
解: 设 n:应检查产品个数 ,X:其中次品数,则
X ~ B(n, 0.1), n p 0.1n , npq 0.3 n
现要求 n ,使得: P(10 X n) 0.9
由
P ( 10 X n )
近似服从N( 0, 1 )
定
10 0.1n X 0.1n n 0.1n
理 P(
)
3
0.3 n 0.3 n 0.3 n
概率统计
比如: 一台机床已经调试良好,操作正常。但由于机床 的微小震动、工具的微小变形、原材料质量上的 微小差异、工作操作上的微小偏差等等数不清的 随机因素,它们每一个因素在总的影响中所起的 作用都是微小的。而综合起来在产品质量上就形 成一定的误差,这误差近似服从正态分布。
概率统计
研究的问题: 研究相互独立随机变量之和所特有的规律性问题。 (1). 当 n 无限增大时,这个和的极限分布是什么? (2). 在什么条件下极限分布将是正态分布? 在概率论中,习惯于把和的分布收敛于正态分布 这一类定理都叫做中心极限定理。故有: 在一定条件下,大量的随机变量之和的概率分布 以正态分布为极限的定理称为中心极限定理。
因为
( x) 1 ( x)
即 ( 0.1n 10) 0.9 查表得: (1.28 ) 0.9
0.3 n
故 0.1n 10 1. 28 n 146
0.3 n
结论:应检查 146 个产品时,可使这 批产品不被接受的概率为0. 9.
概率统计
例 2. 计算机进行加法计算时,把每个加数取为最接 近它的整数来计算。设所有的取数误差是相互 独立的随机变量,并且都在区间[ -0.5, 0.5 ] 上 服从均匀分布。
k 1
其中 Xk (k 1, 2 n) 的分布律为:
P( X k i ) pi (1 p)1i
i 0, 1
E( Xk ) p, D( Xk ) p(1 p) (k 1, 2 n)
由定理1得:
n
lim
n
P
n np
np(1 p)
x
lim n
P
Xk np
k 1
np(1 p)
k1
n 2
k1
n
k 1
概率统计
的分布函数 Fn ( x) 对于任意 x 满足:
n
Xk n
lim
n
Fn ( x)
lim
n
P
k 1
n
x
x
1 t2 e 2 dt
2
证: (略) 它要用到特征函数和傅利叶变换等等。
注 ▲ 定理1 表明: 当 n 充分大时,n 个具有期望和 方差的独立同分布的随机变量之和 近似服从
P(
n k 1
Xk
0
10 0
)
n
n
n
12
12
12
概率统计
近似服从N ( 0, 1 )
n
P ( 20
3
Xk
k 1
20
3 ) 2 ( 20
3 )1
nn
n
n
2
n
所以要 P( Xk 10 ) 0.9,
只要:
k 1
2 ( 20 3 ) 1 0.9 n
( 20 3 ) 0.95 n
k 1
k 1
概率统计
n
由 定 理
1
P ( 10 0 k1 Xk 0 10 0 )
10 n
10
10
Xk
近似服从N ( 0, 1 )
P ( 1 k1 10
1 ) (1) (1)
2 (1) 1 20.8453 1 0.6826
n
(2)
P (
Xk 10 )
k 1
10 0
x
x
1
t2
e 2 dt
2
概率统计
注 ▲ 定理3表明:正态分布是二项分布的极限分布, 当 n 充分大时可以用正态分布来计算二项分 布的概率。
▲ 在第二章中已介绍当 n 时,二项分布以
泊松分布为极限分布;而在本章中二项分布又 以正态分布为极限分布。这两者的区别是:
在泊松定理中要求 np (为常数) 在中心极限定理中要求 np
2
证明: 若随机变量 X1, X2 , , Xn 相互独立,且服从
同一(0—1)分布,则 X1 X 2 X n 服从参数为 n, p (0 p 1) 的二项分布
概率统计
见教材P125 例6 的结论
由此 n
是
n
个相互独立,服从同一 n
(0--1)
分布的
X1, X 2 X n 之和。即: n Xk
定理2. 设随机变量 X1, X2 Xn 相互独立,它们 具有数学期望和方差为:
E( Xk ) k ,
D( Xk
)
2 k
0
,
k 1, 2
n
记 Bn2
2 k
,
若存在正数 ,
使得当
n
k 1
n
1 Bn2
E
k 1
Xk k 2 0
概率统计
n
则随机变量之和 X k 的标准化变量 Zn :
求: (1). 保险公司因开展这项业务获利不少于 10000元的概率.
(2). 保险公司因开展这项业务亏本的概率.
解: 由题意,死亡人数 X ~ B (16000, 0.001)
这里, np 16000 0.001 16
npq 16 4
概率统计
保险公司一年内这项保险收入是:316000 48000元
(1). 具有有限方差的一列独立同分布的随机变量的 和 经过标准化后是以标准正态分布为极限的. -------- 独立同分布的中心极限定理 或 称为 林德贝尔格----勒维中心极限定理。 当“同分布”为二项分布时就得出该定理的特例, --------棣莫弗---拉普拉斯定理(二 项分布的正态近似)
(2). 对“由大量微小的独立的随机因素”(不要求同 分布)引起并累积成的变量,当随机因素个数 趋于无穷时以正态分布为极限。 -------- 李雅普诺夫中心极限定理。
0.5 0.5
E(Xk )
2
0,
[0.5 (0.5)]2
D( Xk )
12
1 12
n
从而: E( Xk ) 0, k 1
n
n
D( Xk )
k 1
12
n
1200
(1) n 1200, D( Xk )
k 1
10 12
1200
1200
从而 P ( Xk 10 ) P ( 10 Xk 10 )
第五章知识结构图
概率论的理论结果
大数定律
中心极限定理
切比雪 夫大数
定理
贝努利 大数 定理
辛钦 (大数) 定理
独立同 分布的 中心极 限定理
李雅普 诺夫中 心极限
定理
棣莫弗 --拉普 拉斯中 心极限 定理
概率统计
第二节 中心极限定理
问题的引出
概率论中,已经知道正态分布居于头等重要 的地位,许多随机变量都遵循正态分布。
即要: ( 10 0.1 n ) 0.1 0.3 n
此时由于: ( 10 0.1n ) 0.5 0.3 n
概率统计
必定有: 10 0.1 n 0 0.3 n
P 309附表2中 z 0 (z) 0.5
所以要: ( 10 0.1 n ) 0.1 0.3 n
只要:1 ( 0.1 n 10) 0.1 0.3 n
n
n
Xk k
Zn k1
n
k 1
Bn
近似服从标准正态分布。
n
即, Xk Bn Zn k 近似服从正态分布
k 1
k 1
n
~ N ( k , Bn2 )
k 1
▲ 由此,定理2再次表达了正态分布在概率论中的
特殊地位: 无论各个随机变量 Xk 服从什么分
布,只要满足定理2 的条件,那么它们的和当
n
k 1 n
n
n
Xk E( Xk ) Xk k
Zn k1
k 1
n
D( Xk )
k1
k 1
Bn
k 1
的分布函数 Fn ( x) 对于任意 x 满足:
n
Xk
n
k
lim
n
Fn ( x)
lim
n
P
k 1
证明:(略)
k 1
Bn
x
x
1
t2
e 2 dt
2
概率统计
注 ▲ 定理2表明,当 n 充分大时,随机变量:
概率统计
(2). 公司亏本即赔款大于48000元,即一年内有多 于 48000 24(人)死亡
2000
P( X 24) 1 P( X 24)
1 P( X 16 24 16)
4
4
1 P( X 16 2) 1 (2)
4
1 0.97725 0.02275
(1). 获利不少于10000元,即赔偿不大于 38000(元),
即一 年内至多有 38000 19(人)死亡
2000
所以:
X 16 19 16
P( X 19) P(
)
4
4
1
0.75 t 2
e 2 dt
2
( 0.75 ) 0.7734
该公司获利不少于 10000(元)的概率为 0.7734.
概率统计
中心极限定理的客观背景
在实际问题中,常常需要考虑许多随机因素所产生 的总影响:
例如:炮弹射击的落点与目标的偏差,就受着许多 随机因素的影响: 瞄准时的误差,空气阻力所产生的误差, 炮弹或炮身结构所引起的误差等等. 所要研究的是:这些随机因素的总影响.
概率统计
一. 独立同分布中心极限定理
(林德贝尔格---勒维(Levy-Lindberg)定理)
概率统计
P ( 10 0.1n X 0.1n 3 n ) 0.3 n 0.3 n
由3σ准则, (3 n )为 1
(3 n) (10 0.1n) 1 (10 0.1 n )
0.3 n
0.3 n
要 P(10 X n) 0.9
来自百度文库
只要: 1 ( 10 0.1n ) 0.9 0.3 n
自从高斯指出测量误差服从正态分布之 后,人们发现,正态分布在自然界中极 为常见。
大量实验观察也表明:
高斯
如果一个量是由大量相互独立的随机因素的影响所造 成,而每一个别因素在总影响中所起的作用不大,
则这种量一般都服从或近似服从正态分布。
概率统计
是经验之谈呢,还是确有理论依据呢?
在长达两个世纪内一直成为概率论研究的中心问题。数学家们经过卓越 工作建立了一系列定理,解决了这一问题,并指出:
定理1. 设随机变量 X1, X2 Xn 相互独立且服从同
一分布,其数学期望与方差: E( X k ) n
D ( Xk ) 2 , (k 1, 2 ), 则随机变量之和 Xk k 1
的标准化变量 Yn :
n
n
n
n
Xk E( Xk ) Xk n Xk n
Yn k1
k 1
n
D( Xk )
标准正态分布。
虽然在一般情况下,很难求出 X1+ X2 + …+ Xn 的分布的确切形式,但当 n 很大时,可以求 出其近似分布。
概率统计
▲ 定理1 表达了正态分布在概率论中的特殊地位:
尽管 X1, X2 Xn 分布是任意的,但只要 n 充
分大后,其样本平均值 服从正态分布的:
1
n
n k 1
X
k
n 充分大时就近似服从正态分布。
概率统计
三. 棣莫弗---拉普拉斯定理
(De Moivere—laplace 中心极限定理)
定理3. 设随机变量 n 相互独立,且服从参数为
n, p (0 p 1) 的二项分布,则对任意 x
恒有:
lim
n
P
n np
np(1 p)
x
x
1 t2 e 2 dt
的分布却是近似
n
Xk n
Yn k1 n
1
n
n k 1
Xk
1 n
n
1
n
n k 1
Xk
E(X
)
1 D( X ) n
即
1 n
n k 1
Xk
服从正态分布N[E( X ),(
1 n
D( X ))2 ]
或 X ~ N( , 2 n )
这一结果是数理统计中 大样本统计推断的基础
概率统计
二. 李雅普诺夫定理 ( Liapunov 中心极限定理)
求: (1) 现有1200个数相加,误差总和的绝对值小于 10的概率。
(2) 应有多少个数相加时可使误差总和的绝对值 小于10 的概率大于0. 9.
解: 设 X1 , X 2 , X n 为各个加数的取数误差.
则这是一列独立同分布的随机变量,
n
其所有加数的误差总和为: Xk k 1
概率统计
Xk (k 1, 2, n) 在 [ 0.5,0.5] 服从均匀分布
在实际计算中,如果 n 很大但 np或 nq 不大 ( 即 p 很小或 q =1-p 很小 ),则用泊
松定理去近似;如果 n,np 或 nq 都较大,
则用中心极限定理去近似。
概率统计
例1. 抽样检查产品质量时,如果发现次品多于10个 则认为这批产品不能接受。
求:应该检查多少个产品,可使次品率为 10% 的 一批产品不能被接受的概率达到 0. 9?