概率论第五章大数定律与中心极限定理讲解
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
可知,当 n 时,有
1
n
n i1
Xi
P E( X1)
a
因此我们可取 n 次测量值 x1, x2, , xn 的算术平均值
作为a
得近似值,即
a
1 n
n i1
xi ,当n充分大时误差很小。
例4 如何估计一大批产品的次品率 p ? 由伯努利大数定律可知,当 n 很大时,可取频率
lim P{| nA p | } 1 或
n
n
即 nA P p . n
lim P{| nA p | } 0
n
n
证明 引入随机变量
Xi
1, 0,
第i次试验中A发生, 第i次试验中A不发生,i
1,2,
显然 nA X1 X2 X n 且 E(X)i p , D(X)i p(1 p),i 1,2, n
.
即对任意的ε> 0,
lim P{|
n
1 n
n i1
Xi
|
}
1
证明
E(1 n
n i1
Xi)
1 n
n i1
E(Xi)
1 n
n i1
D(1 n
n i1
Xi)
1 n2
n
D(Xi )
i1
1 n2
n
2
i1
2
n
由切比雪夫不等式得:
i 1
1200
1200
心极限定理可得 X k ~ N (n,n 2),即 X k ~ N (0,100)
k 1
k 1
则所求概率为
1200
1200
P k1 X k
20
P
Xk 0
k 1
1200 1 12
20
1200
1 12
大量抛掷硬币 正面出现频率
生产过程中的 字母使用频率 废品率
大量的随机现象中平均结果的稳定性
几个常见的大数定律
定理1(切比雪夫大数定律)
设 X1 , X2 , … 是一列相互独立的随机变量序列,
它们都有相同的数学期望 E(Xi ) 和方差D(X)i 2
则
1
n
n i1
Xi
P
命题 (切比雪夫Chebyshev不等式)
设随机变量X 的数学期望 E(X ) 和方差D(X) 2
存在,则对任意 0 , 不等式
P{|
X
E(X
) |
}
D( X
2
)
或
P{| X
E(X
)
|
}
1
D( X
2
)
成立,
则称此式为切比雪夫不等式。
证明 设 X 为连续性(离散型类似),其密度为 f (x)
7200
P{6800 X 7200}
C
k 104
0.7
k
0.310k
k 6800
用切比雪夫不等式
P{6800 X 7200}
P{6800 7000 X 7000 7200 7000}
P{
X
7000
200} 1
2100 2002
0.95
200
即独立同分布,且具有相同的期望和方差
E Xk D Xk 2 0 k 1,2, ,n.
n
则
n
Xi ~ N (n, n 2 ) ,即
i1
Xi n
i1
~ N (0,1)
n
或
lim
P
n i1
Xi
n
x
(x)
n
则 P{| X E(X ) | } f (x)dx |xE( X )|
|xE
(
X
)|
[
x
E
(
2
X
)]2
f (x)dx
[x
E( X )]2
2
1
1
2
[x
E(X
)]2
f
(x)dx
D( X
2
)
注:Chebyshev不等式对随机变量在以 E(X )为中心
nA / n 作为次品率 p 的估计值。
大数定律以严格的数学形式表达了随机 现象最根本的性质之一:
平均结果的稳定性
第五章
第二节 中心极限定理
中心极限定理的客观背景: 在实际问题中, 常常需要考虑许多随机因素所产生的综合影响.
观察表明:
如果一个量是由大量相互独立的随机因素的影响所 造成,而每一个别因素在总影响X 中所起的作用不大。
且具有相同的数学期望 E(Xi ) ,i 1,2,
则
lim
n
P{|
1 n
n i1
Xi
|
}
1
辛钦
辛钦大数定律中,随机变量的方差可以不存在,只要 独立同分布就可以了。
定理3(伯努利大数定律)
设nA是n重贝努里试验中事件A发生的次数, P是事件A发生的概率,则对任给的ε> 0,有
其中 X k 相互独立,且都服从(0-1)分布。
P{Xk 1} p , P{Xk 0} 1 p
E Xk p , D Xk p(1 p)
由独立同分布的中心极限定理可得
n
lim P{ n np
X k np
x} lim P{ k1
x} (x)
P{| X | 2} 1 2 /2 2 3 0.75 4
例1 一电网有1万盏路灯,晚上每盏灯开的概率为0.7.
求同时开的灯数在6800至7200之间的概率至少为多少?
解 设X 为同时开的灯数。X ~ b(104,0.7)
由二项分布 E(X ) np 7000 D(X ) npq 2100
n
此定理表明,无论 X1, X 2,, X n , 原来服从什么
分布,当n充分大时,之和总可以近似服从正态分布.
例1 某人要测量甲、乙两地之间的距离。限于测量 工具,他分成 1200 段来测量。每段测量误差(单位 厘米)服从于(-0.5,0.5)上的均匀分布。求总距离误 差的绝对值超过20厘米的概率。
n np(1 p)
n np(1 p)
注:此定理表明正态分布是二项分布的极限分布,
当n 充分大时,可以利用正态分布计算二项分布的概率。
推论: 设随机变量 Yn ~ B(n, p).
当n充分大时有:
P{a Yn b}
C
k n
pk
q
nk
ak b
(b np ) ( a np )
例2 已知正常男性成人血液中,每一毫升白细胞数 平均是7300,均方差是700, 利用切比雪夫不等式
估计每毫升白细胞数在 5200~9400 之间的概率 . 解 设每毫升白细胞数为X 依题意,EX =7300,DX =7002 所求为
P{5200 X 9400}
P{5200 7300 X 7300 9400 7300}
又由于各次试验相互独立,所以
X1, X2,
, X n 独立同分布, 则由辛钦大数定律可得
lim P{| nA p | } 1
n
n
例3 如何测量某一未知的物理量a ,使得误差较小?
解 在相同的条件下测量n 次,其结果为
X1, X2,
,
X
,它们可看成是相互独立、相同分布的
n
随机变量,并且有数学期望为a . 于是由辛钦大数定律
1 P
1200
Xk
k 1
10
0
2
Байду номын сангаас 1[
2
2
]
2 22 2 0.0228 0.0456
例2 根据以往经验,某种电器元件的寿命服从均 值为100小时的指数分布. 现随机地取16只,设它们的 寿命是相互独立的. 求这16只元件的寿命的总和大于 1920小时的概率.
第五章 大数定律与中心极限定理
一、大数定律 二、中心极限定理
本章是关于随机变量序列的极限理论。
目的是从理论上对第一章中提出的“频率的 稳定性”给出严格的数学证明。
大数定律:对于随机变量序列 X1, X 2, , X n
描述其平均值
1 n
n i1
Xi
在什么条件下以什么形
式呈现出稳定性。
中心极限定理:对于随机变量序列 X1, X 2, , X n
n
其部分和 X i 在什么条件下以正态分布为极限 i1
分布。
第一节 大数定律
第五章
一、 切比雪夫Chebyshev不等式 二、几个常见的大数定律
定义1 设随机变量序列 X1, X 2, , X n ,如果存
在常数 a ,使得对于任意 0 有:
lim
n
P{|
X
n
a
|
}
1
则称 X n 依概率收敛于a ,记为 X n Pa .
解 设第k 段的测量误差为 X k k 1,2,,1200. 且 X1, X 2,, X1200是独立同分布的随机变量。且
Xk ~ U 0.5,0.5 k 1,2,,1200.
E(Xk) 0
D( X k
)
1 [0.5 12
(0.5)]2
1 12
n
累计误差即总距离误差为 X k,由独立同分布的中
å 1
P{| 1 n
n i= 1
Xi -
m|<
e} ?
1
s2 ne2
所以
lim P{|
n
1 n
n i1
Xi
| } 1
注:当n充分大时,
1 n
n i 1
Xi
差不多不再是随机的了,
其取值接近于其数学期望的概率接近于1.
定理2(辛钦定律)
设随机变量序列X1 , X2 , … 独立同分布,
P{Y 1920} 1 P{Y 1920}
1- (1920 1600) 400
1 (0.8) 1 0.7881 0.2119
下面介绍定理1 的特殊情况。
定理2(棣莫佛-拉普拉斯定理)De Moivre-Laplace
设随机变量 n 服从参数为 n, p 0 p 1的二项分布
npq
npq
这个公式给出了n 较大时二项分布的概率计算方法。
例3 报童沿街向行人兜售报纸,假设每位行人买报 的概率为0.2, 且他们是否买报是相互独立的。求报童 向100位行人兜售之后,卖掉15-30份报纸的概率。
解 设报童卖掉报纸的份数为X ,X ~ bn, p
n 100 p 0.2 np 20 npq 16 4
解 设第i 只元件的寿命为Xi , i=1,2, …,16
由题给条件知,诸Xi 独立,E( Xi ) =100, D( Xi ) =10000
16
16只元件的寿命的总和为 Y Xk
k 1
依题意,所求为P(Y >1920)
由于E(Y )=1600, D(Y )=160000
由中心极限定理, Y 1600 近似N (0,1) 400
P{2100 X EX 2100} P{ X EX 2100}
由切比雪夫不等式
P{ X EX
2100}
1
D( X ) (2100)2
1 ( 700 )2 1 1 8
2100
99
即每毫升白细胞数在5200-9400之间的概率不小于8/9。
大数定律的客观背景
则对任意的 x ,有
n ~ N(np, np(1 p)) n , 近似地
即 n np ~ N (0,1)
np(1 p)
或 lim P{ n np
x
x}
1
t2
e 2 dt x
n np(1 p)
2
证 因为 n ~ b(n, p)
n
所以 n X k k 1
P15
X
30
30 20 15 20 4 4
2.5 1.25 0.9918 0.1056 0.8862
例4 有100台车床彼此独立地工作。每台车床的实
际工作时间占全部工作时间的80%,求下列事件的 概率。
1、任一时刻有70-86台车床工作。
2、任一时刻有80台以上车床工作。
解 设任一时刻工作的车床台数为X 。X ~ bn, p
n 100 p 0.8 np 80 npq 16 4
的一个ε邻域外取值的概率给出了一个上界
D(
X
2
)
.
P{|
X
E(X
) |
} 1
D( X
2
)
可见D(X) 越小,事件{| X | }的概率越接近1。
X 的值密集在其数学期望附近的概率越大。
例如:对未知分布X,取 3 , 2 ,
P{| X | 3} 1 2 / 3 2 8 0.89 9
X X1 X2 Xn
则这种量X 一般都服从或近似服从正态分布。
所以
n
n
X k E( X k )
Zn k 1
k 1 n
D( X k )
k 1
的极限分布是标准
正态分布。这就是下面要介绍的 中心极限定理。
定理1(独立同分布的中心极限定理)
设 X1, X 2, , X n, 相互独立,且服从同一分布,