第五章中心极限定理(2).
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
lim P n x
1
x
e
t2 2
dt
(5.3.3)
18
证 因为 n A ~ B(n, p) ,所以 n A 表示 n 重 Bernoulli 试验中事件 A 出现的次数。定义
1, 第k次试验出现A Xk 0, 否则 则有 n A X 1 X 2 X n 。由于 X 1 , X 2 ,, X n , 相互独立, (0 1 ) 都服从 分布,且有 E X k p, D X k p(1 p) , 因为 n n n X k E X k X k n n A np k 1 k 1 k 1 Yn n n np(1 p) n D X k k 1 所以应用 Lindeberg-levy 中心极限定理有:
i 1 n
显然这种估计方法太保守, 我们可以考虑用概率论的方法重新进行估计。 因为: 0.5 105 E z i 0 , Dz i 3
10
此时可以假定 z i 相互独立,且 n 10000较大, 所以应用 Lindeberg-Levy 中心极限定理有: n z i n n i 1 P z i k n P k k n i 1
上节主要内容回顾 1.大数定律的含义。 2.引理 3.定理 5.2.1 4.定理5.2.2 5.定理5.2.3 6.定理应用
1
§5.3 中心极限定理
• 自从德国数学家Gauss指出测量误差服从正态分 布之后,人们发现,正态分布在自然界中极为常 见。例如炮弹的弹着点服从正态分布,人的许多 生理特征诸如身高、体重等也服从正态分布。 • 观察表明,如果一个量是由大量相互独立的随机 因素综合作用的结果,而每一个随机因素在总的 结果中所起的作用又非常微小。 • 则这个量通常都服从或近似服从正态分布。由此 产生了有关中心极限定理的研究。
k1
dx
b
a
d
20
在这里,顺便澄清一个概念。在前面章节的讨论中, 我们曾学习过二项分布的泊松逼近。 当时,泊松分布虽然是作为二项分布的极限分布而引入的, n 但极限过程是: np , n 而现在所说的“二项分布的极限分布是正态分布” n 这一结论涉及的极限过程是: p是常数 。
x
e
t2 2
dt 恒成立,
4
n n X i ~ N X i , D X i E , i 1 i 1 i 1 所以,概率论中论证随机变量和的极限分布是 正态分布的一系列定理统称为中心极限定理; (2)中心极限定理的结论描述的总是分布函数序列 Fn ( x) PYn x收敛于标准正态分布的情况; (3)不同的中心极限定理研究了分布函数序列 Fn ( x) PYn x不同的收敛条件。
X
i 1
n
i
D ( X i )
i 1
, B n2 k2 ,
k 1
n
若存在 0 ,使得当 n 时, 1 n 2 E X k k 0 ,则恒成立 2 Bn k 1
x
2 定理 5.3.2 称为李雅普诺夫(Liapunov)中心极限定理。 证明略。
15
定理含义分析
• 从理论上揭示了正态分布的形成机制:如果某一 个量的变化是由大量微小的、相互独立的随机因 素综合作用的结果,而且这些随机因素中没有任 何一个是起主导作用的,那么,这个量就是一个 服从正态分布的随机变量,至少它近似地服从正 态分布。这种机制在经济问题中是常见的,当我 们对一些经济问题进行定量分析时,往往假定在 主要因素的影响之外,其它各种因素的影响可以 用一个服从正态分布的随机变量来表示,其根据 即在于此。
P k 1 a np np(1 p )
k2
1 2
n A np np(1 p ) e
x2 2
k2 np(1 p ) b np 1 2 e
t 2
2 2
k 2 k1
3
定义 5.3.1 若独立随机变量序列 X 1 , X 2 ,, X n , 的标准化和
Yn
X
i 1源自文库
n
i
E ( X i )
i 1 n
n
D ( X i )
i 1
使得 lim PYn x
n
1
2 则称随机变量序列 Yn 服从中心极限定理 (The Central Limit Theorem) 。 从上述定义中可以看出: 1) 时, (1)由于当 Yn ~ N (0,
3
12
例.用机器包装味精,每袋味精净重为随机变量,期望值为100
克,标准差为10克,一箱内装200袋味精,求一箱味精净重大 于20500克的概率?
解: 设一箱味精净重为X,箱中第i袋味精净重为Xi,(i=1,2,…,200)
则 且 X1,X2,…,X200独立同分布, EXi=100, DXi=102=100,
k
1 2
k
e
x2 2
dx (k ) (k ) 2(k ) 1
11
题解续
当 k 3 时有: P 0.866103 99.7% 即我们能以 99.7%的概率断言:
1 0.86610 。这个结果只是前面上限估计的 。 60 • 历史上,误差分析是概率论的重要生长点之一。19世纪 初,德国数学家Gauss正是在研究测量误差时引进了正 态分布并发展了具有广泛应用的最小二乘法,至今这仍 是概率论与生产实际具有广泛联系的领域之一。
7
林德贝格定理—勒维 (i.i.d下中心极限定理)强调
X1,X2,…,X n,…为独立同分布序列,期望μ ,方差 σ 2>0, 那么当n充分大时,
X 近似服从 N (n , n
所以
i 1 i
n
2
)
X
i 1
n
i
n
近似服从 N (0,1)
n
n
注 意
lim { i 1
X
n
17
定理5.3.3
定理 5.3.3 若 n A 是随机变量序列,且 n A ~ B(n, p) , n A np (n 1,2,) ,记 n ,则恒成立 np(1 p)
n
2 定理 5.3.3 称为德莫佛 拉普拉斯 (De Moivre-Laplace)中心极限定理。
=0.0002
一箱味精净重大于20500的概率为0.0002.
13
定理5.3.2
定理 5.3.2 设随机变量 X 1 , X 2 ,, X n , 相互独立,
E ( X i )
i 1 n n
且 E( X k ) k , D( X k ) k2 , (k 1,2, ) , 记 Zn
n
lim P n x
1 2
x
e
t2 2
dt
19
这个定理便是 Bernoulli 试验场合下的中心极限定理。 关于这一古典结果在各种场合下的推广, 构成了我们所研究的一系列中心极限定理。
上述定理的结果表明:二项分布的极限分布是正态分布。 因此,当 n 充分大时,若随机变量 n A ~ B(n, p) , 则近似地有: n A ~ N np, np(1 p) , 于是我们可以利用正态分布近似地计算形如 Pa n A b 的概率。 事实上,若记 np , np(1 p) 2 ,则有 Pa n A b
i
n x} ( x)
n
(1)一般地,只要n比较大,就可应用以上定理; (2)应用该定理时,需要找出独立同分布的随机变量序列以及 它们的期望和方差,再应用正态分布的有关计算方法.
8
例题
例 5.3.1 在数值计算中,任何实数 x 都 只能用一定位数的有限小数 y 来近似, 这就产生了一个误差 z x y 。 假定每个数都按四舍五入的方法保留 到十进制小数点后 5 位, 则相应的舍入误差可以看作是 5 5 0.5 10 ,0.5 10 上的均匀分布。 若将 10000 个数 x i 相加, 试估计所有这些数和的误差。
n
X
k 1
n
k
n
n
,
2 定理 5.3.1 称为林德贝格——勒维(Lindeberg-Levy) 中心极限定理,也称为独立同分布的中心极限定理。 证明略。
n
lim PYn x
1
x
e
t2 2
dt
(5.3.1)
6
• Lindeberg-Levy中心极限定理有着非常广 泛的应用。在实际问题中,只要足够大, 便可以把独立同分布的随机变量之和当 作是正态随机变量来处理。 • 这种做法在数理统计中使用得非常普遍, 当处理大样本问题时,它将作为一个非 常重要的工具。
2
定理复习
复习 X~N(μ,σ2) X 定理 设X~N(μ,σ2), Y , 则Y~N(0,1). 所以,若X~N(μ,σ2), 则 P(X<a)= (
a
) ) (
P(X>a)= 1 ( a )
a
P(a<X<b)= (
b
)
中心极限定理就是研究随机变量标准化和的分布函数 收敛于标准正态分布问题,这一点和大数定律的前n项 和的算术平均数收敛有很大相似。
X Xi
i 1
200
由独立同分布的中心极限定理得:
X近似服从正态分布,且EX=∑EXi=200EXi=20000, DX=200DXi=20000, 所求为P(X>20500)= 1-P(X≤20500)
1 (
故
20500 20000 20000
) 1 ( 3.54 )
n
lim PZ n x
1
e
t2 2
dt
(5.3.2)
14
上述定理表明:在相当广泛的情形下, 无论随机变量 X k 服从怎样的分布, 只要 n 充分大,那么它们的和 就近似地服从正态分布。 这就是为什么正态分布是 实际问题中最常见的一种分布, 以及为什么正态分布在概率论中 占有非常重要地位的一个基本原因;
16
• 进一步的研究表明:Liapunov中心极限定理还 不是这类问题的最一般结果。历史上,人们在 长达两个世纪的时间里,曾专注于所谓“独立 和的分布函数向正态分布收敛的最普遍条件”, 以至于有关这部分问题的研究成了那个时期概 率论研究的中心课题,中心极限定理便是因此 而得名。 • 现在,这个问题可以说从某种意义上讲已经得 到了最后的解决。1922年,Lindeberg提出了一 个充分条件(Lindeberg条件);1935年, Feller进一步指出,在某种情形下,这个条件也 是必要的,这样就明确了向正态分布收敛的充 要条件。但本书中我们不展开相关问题的具体 讨论。
n
5
几个常见的中心极限定理。
定理 5.3.1 设随机变量 X 1 , X 2 , , X n , 相互独立, 服从同一分布,且具有数学期望和方差: E( X k ) , D( X k ) 2 0 , (k 1,2, ) ,
n X k E X k k 1 k 1 记 Yn n D X k k 1 则恒成立
9
解 记 S xi , T y i ,
i 1 i 1 n
n
n
则 S T xi y i xi y i z i
i 1 i 1 i 1 i 1
n
n
n
就是我们要估计的总误差。
若以传统的方法估计:因为 z i 0.5 10 5 , 所以得: i z i n 0.5 105 0.05 ,