第五章 大数定律与中心极限定理
合集下载
第五章 大数定律与中心极限定理
中心极限定理
独立随机变量和
设 {Xn} 为独立随机变量序列,记其和为
Yn = ∑Xi
i=1 n
讨论独立随机变量和的极限分布, 指出极限分布为正态分布.
13 July 2011
湖南大学
第五章 大数定律与中心极限定理
第18页 18页
独立同分布下的中心极限定理
林德贝格—勒维中心极限定理 设 {Xn} 为独立同分布随机变量序列,数学期 望为µ, 方差为 σ2>0,则当 n 充分大时,有
解: 设 X 表示命中的炮弹数, 则 X ~ b(500, 0.01)
(1) P( X = 5) = C ×0.015 ×0.99495 =0.17635
5 500
(2) 应用正态逼近: P(X=5) = P(4.5 < X < 5.5) = 0.1742
13 July 2011
5.5 − 5 4.5 − 5 ≈ Φ −Φ 4.95 4.95
第五章 大数定律与中心极限定理
第25页 25页
三、给定 y 和概率,求 n
例7 用调查对象中的收看比例 k/n 作为某电视节
目的收视率 p 的估计。 要有 90% 的把握,使k/n与p 的差异不大于0.05,问至少要调查多少对象?
解:用 Yn表示n 个调查对象中收看此节目的人数,则
P ( Yn / n − p < 0.05) ≈ 2Φ 0.05 n / p(1 − p) − 1 ≥ 0.90
湖南大学
湖南大学
第五章 大数定律与中心极限定理
第16页 16页
X 例 设 1, X2 ,L, Xn是独 立同 布 分 的随 变量 它们 机 , 都服 从 [a, b]上的 [ 均匀 布 f (x)是 a, b]上 连 函 , 分 , 的 续 数 证明 :
大数定律及中心极限定理教学
解
1
以Xk (k=1,2,…,400)记第k个学生来参加会议
2
的家长数,其分布律为
3
pk
4
05
5
8
6
15
7
Xk
8
Xk 相互独立地服从同一分布
9
随机变量
近似服从标准正态分布
添加标题
以Y表示有一名家长来参加会议的学生, 则
添加标题
Y~b(400, 0.8)
三 小结
独立同分布的中心极限定理
01
李雅普诺夫定理
单击此处添加标题
解
单击此处添加标题
切比雪夫(Chebyshev)定理证明
定义
由此得到定理1的另一种叙述:
Th1′
PART 1
说明
Th2:(伯努利大数定理)
定理表明事件发生的频率依概率收敛于 事件的概率。由实际推断原理,在实际应用中, 当试验次数很大时,可以用事件发生的频率来代替事件的概率。
观察表明,如果一个量是由大量相互独立的随机因素的影响所造成,而每一个别因素在总影响中所起的作用不大. 则这种量一般都服从或近似服从正态分布.
自从高斯指出测量误差服从正态分布之后,人们发现,正态分布在自然界中极为常见.
的分布函数的极限.
由于无穷个随机变量之和可能趋于∞,故不研究n个随机变量之和本身而考虑它的标准化的随机变量 在概率论中,习惯于把和的分布收敛于正态分布这一类定理都叫做中心极限定理.
X~b(90000,1/3),
思考题
分布律为
所求概率为
采用棣莫佛-拉普拉斯定理
计算太麻烦!!!
3.棣莫佛-拉普拉斯定理
说明
例题
解
例1 掷一颗骰子1620次,求“六点”出现的次数X 在250~290之间的概率?
第五章大数定律及中心极限定理
k 1
其中 X1, X2 ,, Xn是相互独立的、服从同一
均值为μ,方差为σ2>0的独立同分布的随机变量
n
X1,X2,…,Xn之和 X k 的标准化变量,当n充分
大时,有
k 1
n
k 1
Xk
nm
~近似N(0,1)
ns
n
这样可以用(标准)正态分布来对 X k 作
k 1
理论分析或实际计算,不必求分布函数
19/41
§5.2 中心极限定理
将上式改写为
即对任意的正数ε,当n充分
lim P n
1 n
n k 1
Xk
m
1.
大时,不等式 立的概率很大
|
X
m | 成
3/41
证 由随机变量X1,X2,…,Xn,…相互独立,且具有 相同的数学期望和方差,有
E
1 n
n k 1
Xk
lim
n
P
1 n
(X1
X2
Xn)
p
1,
即
lim
n
P
nA n
p
1.
伯努利大数定理表明,事件发生的频率nA/n依概率收敛
于事件的概率p,以严格的数学形式表达了频率的稳定性和概
率的合理性
近似:当n很大时,事件发生的频率nA/n与概率有较大偏差的 可能性很小,因此由实际推断原理,由于小概率事件几乎不
辛钦定 理
X P m
第五章 大数定律与中心极限定理
∑200
【解】 设 X i 表示“该射手第 i 次射击的得分”,则 Y = X i 表示射手所得总分,
i=1
Xi (i =1, 2, , 200) 独立同分布,分布表如下:
Xi
0
2
3
4
5
p
由于
0.1
0.1
0.2
0.2
0.4
E( Xi ) = 0×0.1+ 2×0.1+ 3×0.2 + 4×0.2 + 5×0.4 = 3.6 ;
试验中发生的概率,这个定律以严格的数学形式刻画了频率的稳定性,在实际应用中,当试 验次数很大时,便可以用事件发生的频率来替代事件的概率.
3、辛钦大数定律
设随机变量序列 X , X , 12
,Xn,
相互独立且服从相同的分布,具有相同的数学期望
E(X i
)
=
μ
,(
i
=
1,
2,
) ,则对任意给定的正数 ε ,有
) ,则对任意实数 x ,有
∑ ⎧
⎪
n
X − nμ i
⎫ ⎪
⎨ lim P i=1
≤ x⎬ =
⎪ n→∞
nσ
⎪
⎩
⎭
∫ 1
2π
x −t2
e
−∞
2 dt = Φ(x) .
154
第五章 大数定律与中心极限定理
n
∑ 【评注】 n 个相互独立同分布、方差存在的随机变量之和 Xi ,当 n 充分大时,近似 i =1
第五章 大数定律与中心极限定理
本章学习要点
① 了解切比雪夫不等式; ② 了解切比雪夫大数定律、伯努利大数定律和辛钦大数定律(独立同分布随机变量的大
【解】 设 X i 表示“该射手第 i 次射击的得分”,则 Y = X i 表示射手所得总分,
i=1
Xi (i =1, 2, , 200) 独立同分布,分布表如下:
Xi
0
2
3
4
5
p
由于
0.1
0.1
0.2
0.2
0.4
E( Xi ) = 0×0.1+ 2×0.1+ 3×0.2 + 4×0.2 + 5×0.4 = 3.6 ;
试验中发生的概率,这个定律以严格的数学形式刻画了频率的稳定性,在实际应用中,当试 验次数很大时,便可以用事件发生的频率来替代事件的概率.
3、辛钦大数定律
设随机变量序列 X , X , 12
,Xn,
相互独立且服从相同的分布,具有相同的数学期望
E(X i
)
=
μ
,(
i
=
1,
2,
) ,则对任意给定的正数 ε ,有
) ,则对任意实数 x ,有
∑ ⎧
⎪
n
X − nμ i
⎫ ⎪
⎨ lim P i=1
≤ x⎬ =
⎪ n→∞
nσ
⎪
⎩
⎭
∫ 1
2π
x −t2
e
−∞
2 dt = Φ(x) .
154
第五章 大数定律与中心极限定理
n
∑ 【评注】 n 个相互独立同分布、方差存在的随机变量之和 Xi ,当 n 充分大时,近似 i =1
第五章 大数定律与中心极限定理
本章学习要点
① 了解切比雪夫不等式; ② 了解切比雪夫大数定律、伯努利大数定律和辛钦大数定律(独立同分布随机变量的大
第五章 数理统计 大数定律与中心极限定理
) 0.999
查正态分布函数表得
(3.1) 0.999
故
N 120 48
≥ 3.1,
从中解得N≥141.5,
即所求N=142.
也就是说, 应供应142 千瓦电力就能以99.9%的 概率保证该车间不会因供电不足而影响生产.
例3 对于一个学生而言,来参加家长会的家长人数
是一个随机变量,设一个学生无家长、 1名家长、名 2 家长来参加会议的概率分别为0.05、.8、.15.若学校 0 0 共有 400名学生,设各学生参加会议的家长数相互 独立,且服从同一分布.
lim P n X np np 1 p x 1 2
x
t
2
e
2
dt x
证明:设 则
第i次试验事件A发生 第i次试验事件A不发生
由中心极限定理,结论得证
当 n 充分大时,二项分布 X ~ B n , p 可近似地用正态分布N np , np 1 p 来代替。
由于无穷个随机变量之和可能趋于∞,故我们 不研究n个随机变量之和本身而考虑它的标准化的随 n 机变量. 即考虑随机变量X k ( k 1,n)的和 X k
k 1
讨论Yn的极限分布是否为标准 正态分布
在概率论中,习惯于把和的分布收敛于正态分 布这一类定理都叫做中心极限定理.
5.2
中心极限定理 标准化随机变量
如
意思是:当
时,Xn落在
内的概率越来越大.
a
而
意思是:
,当
几个常用的大数定律
定理5-2 切比雪夫大数定律
,
设{Xi, i=1,2,...}为独立的随机变量序列, 且存在数学期望、方差 E X n nDBiblioteka X n2 nDX
第五章 大数定理与中心极限定理
说明
1 n 1、定理中{| X i | }是指一个随机事件, n i 1 当n 时,这个事件的概率趋于1.
2、 定理以数学形式证明了随机变量X 1 , X n 1 n 的算术平均X X i 接近数学期望E(X k) n i 1 (k 1,2, n),这种接近说明其具有的稳定性 .
第五章 大数定律与中心极限定理
第五章 大数定律与中心极限定理
§1 大数定律
1.1 切比雪夫不等式 1.2 依概率收敛 1.3 大数定律
§2 中心极限定理
HaiNan University
1
第五章 大数定律与中心极限定理
大数定律的客观背景
事件发生的频率稳定于某一常数 大量随机试验中 测量值的算术平均值具有稳定性
证明 取连续型随机变量的情况来证明.
设 X 的概率密度为 f ( x ), 则有
HaiNan University3第五章 大数定律 Nhomakorabea中心极限定理
P{ X μ ε }
2 x μ ε
x μ ε
f ( x)d x
x μ f ( x)d x 2 ε
1 1 2 2 2 ( x μ) f ( x ) d x 2 σ . ε ε
定理2 (契比雪夫大数定律)
1 nM M 1 D( X i ) 2 D( X i ) 2 . n i 1 n n n i 1 由契比雪夫不等式得: M 1 n 1 n P{ X i E ( X i ) } 1 n n i 1 n i 1 2
HaiNan University
10
第五章 大数定律与中心极限定理
1.3 大数定律
问题 : 设nA是n重贝努利试验中事件A发生 的次数,p是事件A发生的概率,
第五章 大数定律与中心极限定理
上述问题的解决是:
(1) 设X表示保险公司在每一个参保者身上所得的收益,则X为随机变量,服从两点分布,其分布规律为
X 12 12-b Pk 0.998 0.002 故保险公司在每一位参保者身上获的平均收益
E(X)=12×0.998+(12-b)×0.002=12-0.002b
若要使保险公司期望盈利,则应有
解:将船舶每遭受一次波浪冲击看作是一次试验,并假定各次试验是独立的。在90000次波浪冲击中纵摇角度大于3°的次数记为X,则X是一个随机变量,且有X~b(90000,1/3).其分布律为:
所求的概率为:
要直接计算是麻烦的,我们利用棣莫弗-拉普拉斯定理来求它的近似值,即有:
其中n=90000,P=1/3.即有
据统计,某年龄的健康人在五年内死亡的概率为,某保险公司准备开办该年龄段的五年人寿保险业务,预计有2500人参加保险,条件是参加保险者交保险金12元,若五年内死亡,公司支付赔偿金b元(b待定),便有以下几个问题:
(1) 确定b,使保险公司期望盈利;
(2) 确定b,使保险公司盈利的可能性超过99%;
第五章 大数定律与中心极限定理
* 随机现象的规律只有在大量随机现象的考察中才能显现出来。
* 研究大量的随机现象,常常采用极限形式。
* 极限定理的内容很广泛,其中最重要的有二种:大数定律与中心极限定理。
1 大数定律
* 事件发生的频率具有稳定性;
* 大量测量值的算术平均值也具有稳定性。
例如在分析天平上称量一质量为μ的物品,以表示n次重复测量结果,经验告知,当n充分大时,其平均值对μ的偏差是很小的。
定义:设是一个随机变量序列,a是一个常数。若对于任意正数,有:
(1) 设X表示保险公司在每一个参保者身上所得的收益,则X为随机变量,服从两点分布,其分布规律为
X 12 12-b Pk 0.998 0.002 故保险公司在每一位参保者身上获的平均收益
E(X)=12×0.998+(12-b)×0.002=12-0.002b
若要使保险公司期望盈利,则应有
解:将船舶每遭受一次波浪冲击看作是一次试验,并假定各次试验是独立的。在90000次波浪冲击中纵摇角度大于3°的次数记为X,则X是一个随机变量,且有X~b(90000,1/3).其分布律为:
所求的概率为:
要直接计算是麻烦的,我们利用棣莫弗-拉普拉斯定理来求它的近似值,即有:
其中n=90000,P=1/3.即有
据统计,某年龄的健康人在五年内死亡的概率为,某保险公司准备开办该年龄段的五年人寿保险业务,预计有2500人参加保险,条件是参加保险者交保险金12元,若五年内死亡,公司支付赔偿金b元(b待定),便有以下几个问题:
(1) 确定b,使保险公司期望盈利;
(2) 确定b,使保险公司盈利的可能性超过99%;
第五章 大数定律与中心极限定理
* 随机现象的规律只有在大量随机现象的考察中才能显现出来。
* 研究大量的随机现象,常常采用极限形式。
* 极限定理的内容很广泛,其中最重要的有二种:大数定律与中心极限定理。
1 大数定律
* 事件发生的频率具有稳定性;
* 大量测量值的算术平均值也具有稳定性。
例如在分析天平上称量一质量为μ的物品,以表示n次重复测量结果,经验告知,当n充分大时,其平均值对μ的偏差是很小的。
定义:设是一个随机变量序列,a是一个常数。若对于任意正数,有:
第五章__大数定律与中心极限定理讲解
n
n
●伯努利大数定律说明了当重复独立试验次数 n 很大时,频率与其概率之差可为任意小, 即说明了其频率的稳定性。
从而在实际推断中,当试验次数较大时,可以 用事件发生的频率来近似代替概率。
若记
1, 第i次实验中事件A发生 Xi 0,第i次实验中事件A不发生
(i 1, 2
n)
n
P400 X 600 由切比谢夫不等式得
P400 500 X 500 600 500 P| X E(X ) | 100
1
D(X ) 100 2
1
250 100 2
0.975
(2)设需要做n次独立试验, 则X ~ B(n, 0.5), 求n使得
P
0.35
X n
0.65
0.95
P0.35
X n
0.65
P0.35
n
0.5
n
X
0.5 n
0.65n
0.5n
PX 0.5n 0.15n 0.95
成立,由切比谢夫不等式得
DX
0.25n
P X 0.5n 0.15n 1 (0.15n)2 1 (0.15n)2
D( Xi ) c(i 1, 2 ),则对任意 0,有
lim P(
n
1 n
n i 1
Xi
1 n
n i 1
E( Xi )
)
1
证明: 由期望与方差的性质知
E(1
n
n i 1
Xi)
第五章 大数定律与中心极限定理
观察表明,如果一个量是由大量相互独 立的随机因素的影响所造成,而每一个别因 素在总影响中所起的作用不大。则这种量一 般都服从或近似服从正态分布。
休息
由于无穷个随机变量之和可能趋于∞, 故我们不研究n个随机变量之和本身而考虑 它的标准化的随机变量
Zn
X
k 1
n
k
E( X k )
k 1 n
休息
定理1(独立同分布下的中心极限定理)
设X1,X2, …是独立同分布的随机
变量序列,且E(Xi)= ,D(Xi)= 2 , i=1,2,…,则
lim P{ i 1
n
X
n
i
n
n
x}
x
-
1 -t 2 2 e dt 2
休息
它表明,当n充分大时,n个具有期望和 方差的独立同分布的r.v之和近似服从正态分 布。虽然在一般情况下,我们很难求出 Yn= X1+X2+ …+Xn 分布的确切形式。 当 n 很大时,可以求出近似分布:
29 500 30000 X 30000 30 500 30000 P 20000 20000 20000
30 500 30000 29 500 30000 20000 20000
( 5 2 / 2 ) ( 5 2 / 2 )
EXi =100, DXi =10000
休息
16只元件的寿命的总和为 Y X k
k 1
16
由中心极限定理:Y
16
16
2 400 N( 1600 ,
)
E(Y ) E( X k ) E( X k ) 100 16 1600
第5章大数定律与中心极限定理
越小,则事
件{|X - E(X)|<
}的概率越大,即随机变量 X 集中
在期望附近的可能性越大. 也说明方差大小反映随机变量 取值的分散程度。
例1. 已知正常男性成人血液中,每毫升白细胞数平均是 7300,均方差是700 .利用契比雪夫不等式估计每毫升白 细胞数在 5200 ~ 9400 之间的概率
k 1 n
n
D( X k )
k 1
的分布函数的极限.
一、独立同分布的中心极限定理
定理1 设 任意实数 有
为一列相互独立相同分布
的随机变量,且具有数学期望和方差, 则对于
其中
为标准正态分布的分布函数。
若一随机变量可以表示成数量很多的相互独立相 同分布的随机变量的和,则该随机变量可近似服从 正态分布,标准化后就服从标准正态分布。
的概率 求200个仓内老鼠总数超过350只的概率 则 解: 设第i个粮仓内老鼠数目为 独立且同分布
得
例4:有一批电子元件装箱运往外地,正品率为80%, 若要95%以上的概率使箱内正品数多于1000只,问箱内
至少要装多少只元件?
解:设装n只元件, 记X为n只元件中正品的件数, 则 利用定理得
由于当
这个定理表明,二项分布的极限分布是正态分布
当
很大时,我们便可以利用定理 2 来近似计算二
项分布的概率。
例1. 设一个系统由100个相互独立起作用的部件组成, 每个部件的损坏率为0.1。为了使整个系统正常工作, 至少必须有85个部件正常工作,求整个系统正常工作 的概率。
解:设 X 是损坏的部件数,则 X ~ B100, 0.1 则整个系统能正常工作当且仅当 X 15. 由德莫佛-拉普拉斯定理有 15 100 0.1 X 100 0.1 P{ X 15} P 100 0.1 0.9 100 0.1 0.9
第五章 大数定律与中心极限定理
( ) = ∑ X − nµ n ⋅σ D (∑ X )
n n i =1 i
lim FYn ( x) = lim P{Yn ≤ x} = Φ ( x) ,
n→∞ n →∞
(5.6)
其中 Φ ( x) 为标准正态分布函数. 由列维-林德贝格中心极限定理可得计算有关独立同分布随机变量和 的事件概率的近似 .......... 公式:
X ~ B(3000,0.001) ,E(X)=np=3,D(X)=np(1-p)=2.997.
由德莫佛-拉普拉斯中心极限定理得保险公司一年获利不小于 10000 元的概率为
P{10000 ≤ 30000 − 2000 X ≤ 30000} = P{0 ≤ X ≤ 10}
10 − 3 0−3 ≈ Φ − Φ 2.997 2.997
n x − nµ x − nµ P ∑ X i ≤ x = P Yn ≤ ≈ Φ . i =1 n ⋅σ n ⋅σ
{
}
(5.7)
例 1 设一加法器同时收到 20 个噪声电压 Vk ( k = 1,2, " ,20) ,它们是相互独立的随机变量, 且都服从区间(0,10)上的均匀分布,试求 P ∑ Vk > 105 .
第2 页 共6 页
概率论与数理统计
第五章 大数定律 与中心极限定理
定理 3 (辛钦大数定律) 设随机变量 X 1 , X 2 , " , X n , " 相互独立,服从同一分布且存在 相同的期望 E(Xi)=μ(i=1,2,…),则对任意正数ε有
1 n lim P X i − µ < ε = 1. ∑ n→∞ = 1 i n §5.2 中心极限定理
概率论-第5章 大数定律及中心极限定理
§1 大数定律
一、问题的引入
生产过程中的 字母使用频率 废品率 启示:从实践中人们发现大量测量值的算术平均值 有稳定性.
大量抛掷硬币 正面出现频率
§1 大数定律
一、问题的引入
大数定律的概念 概率论中用来阐明大量随机现象平均结果的 稳定性的一系列定理,称为大数定律(law of large number)
§2 中心极限定理
即考虑随机变量X k (k 1, n)的和 X k的标准化变量
k 1 n
Yn
X
k 1
n
k
E ( X k )
k 1 n
n
D ( X k )
2
说明每一个随机变量都有相同的数学期望。
§1 大数定律
检验是否具有相同的有限方差?
Xn P
2
( na ) 1 2 2n
2 n
2
0 1 1 2 n
2
( na ) 1 2 2n
2
1 2 a , E ( X ) 2( na ) 2 2n 2 ) [ E ( X n )]2 a 2 . D( X n ) E ( X n
使得当 x a y b 时,
g( x , y ) g(a , b)பைடு நூலகம் ,
§1 大数定律
于是 { g( X n , Yn ) g(a, b) }
{ X n a Yn b }
X n a Yn b , 2 2
§2 中心极限定理
自从高斯指出测量误差服从正态分布之后,人 们发现,正态分布在自然界中极为常见.
如果一个随机变量是由大量相互独立的随机因 素的综合影响所造成,而每一个别因素对这种综合 影响中所起的作用不大. 则这种随机变量一般都服 从或近似服从正态分布. 现在我们就来研究独立随机变量之和所特有 的规律性问题.
第5章 大数定律及中心极限定理
定理2(辛钦大数定律) 设随机变量序列X1,X2, … 相互独立, 服从同一分布,具有数学期E(Xi)=μ, i=1,2,…, 则对于任意正数ε ,有
辛钦
1 n lim P{| X i | } 1 n n i 1
注
1、辛钦大数定律为寻找随机变量的期望值 提供了一条实际可行的途径.
2、切比雪夫大数定律是辛钦定理的特殊情况. 3、辛钦定理具有广泛的适用性.
例1 在一个罐子中,装有10个编号为0-9的同样 的球,从罐中有放回地抽取若干次, 每次抽一个, 并记下号码. 1 第k次取到号码 0 设 Xk = ,k=1,2, … 0 否则 问对序列{Xk}能否应用辛钦大数定律?
即有
n X k
k 1
n
其中X k ( k 1,2,, n)的分布律为 PX k i p i (1 p)1 i , i 0,1
由于E ( X k ) p, D( X k ) p(1 p) k 1,2,, n),
由定理 4得 n X k np n np lim P{ x } lim P{ k 1 x} n n np(1 p) np(1 p )
V 20 5 105 20 5 PV 105 p 100 12 20 100 12 20
V 20 5 p 0.387 100 12 20
V 20 5 1 p 0.387 100 12 20
n 1 P Xk 1 2 n k 1 上式中令 n 得 1 n lim P{| X i | } 1 n n i 1
n 2
说明
1 n 1、定理中{| X i | }是指一个随机事件, n i 1 当n 时,这个事件的概率趋于1.
辛钦
1 n lim P{| X i | } 1 n n i 1
注
1、辛钦大数定律为寻找随机变量的期望值 提供了一条实际可行的途径.
2、切比雪夫大数定律是辛钦定理的特殊情况. 3、辛钦定理具有广泛的适用性.
例1 在一个罐子中,装有10个编号为0-9的同样 的球,从罐中有放回地抽取若干次, 每次抽一个, 并记下号码. 1 第k次取到号码 0 设 Xk = ,k=1,2, … 0 否则 问对序列{Xk}能否应用辛钦大数定律?
即有
n X k
k 1
n
其中X k ( k 1,2,, n)的分布律为 PX k i p i (1 p)1 i , i 0,1
由于E ( X k ) p, D( X k ) p(1 p) k 1,2,, n),
由定理 4得 n X k np n np lim P{ x } lim P{ k 1 x} n n np(1 p) np(1 p )
V 20 5 105 20 5 PV 105 p 100 12 20 100 12 20
V 20 5 p 0.387 100 12 20
V 20 5 1 p 0.387 100 12 20
n 1 P Xk 1 2 n k 1 上式中令 n 得 1 n lim P{| X i | } 1 n n i 1
n 2
说明
1 n 1、定理中{| X i | }是指一个随机事件, n i 1 当n 时,这个事件的概率趋于1.
概率论第五章 大数定律及中心极限定理
的标准化变量为
n
X i n
Yn i1 n
则Yn的分布函数Fn(x)对任意的x∈(-∞,+∞)都有
n X i n
lim
n
Fn
(
x)
lim
n
P(Yn
x)
lim
n
P
i 1
n
x
x
1
t2
e 2 dt
2
该定理说明,当n充分大时, Yn近似地服从标准正 态分布,Yn~N(0,1), (n )
P|
X
|
2 2
P X
1
2 2
证明 (1)设X的概率密度为p(x),则有
P{| X | } p(x)dx
| x |2
p(x)dx
|x|
|x|
2
1
2
(x
)2
p(
x)dx
2 2
Xi 2
0
pi
1 4
1 2
2
(i 1,2, , n, )
1 4
解
因为 X1, X 2 , , X n ,
相互独立, EX i 0 , E
X
2 i
1
又
DX i
E
X
2 i
EX i
2
1 0
1, i
1,2,
, n,
所以,满足切比雪夫大数定理的条件,可使用大数定理.
第五章---大数定律与中心极限定理
(a , a ) 内的概率越来越大. 0, n0
当 n n0
Xn
a a a
而 X n a 意思是: 0, n0 ,当 n n0
| X n a |
6
5.2 大数定律
我们曾经说, 频率是概率的反映,随 着观察次数的增大, 频率将会逐渐稳定 到概率. 这里是指试验的次数无限增大 时, 在某种收敛意义下逼近某一定数,这 就是所谓大数定律
D(
1 n
n k 1
Xk)
1 n2
n
D( X k )
k 1
8
由契比雪夫不等式,得:
P{|
1 n
n k 1
Xk
1 n
n k 1
E(Xk
)
|
}
1
1 n2
n
D( X k )
k 1
2
n 1
表明: 算术平均值依概率收敛于数学期望
9
5.3 中心极限定理
在一定条件下,大量独立随机变量 的和的分布以正态分布为极限分布的 这一类定理称为中心极限定理
7
契比雪夫大数定律
设随机变量X1, X2, ... , Xn, ...相互独 立,且分别具有期望E(Xk)和方差D(Xk) (k
=1,2,...),若方差有界,则 >0,有:
lim
n
P{|
1 n
n k 1
Xk
1 n
n k 1
E(Xk
)
|
}
1
E
(
1 n
n k 1
Xk )
1 n
n k 1
E(Xk )
∴ 只要供给这个车间141千瓦电, 就可保证因供电
不足而影响生产的可能性小于0.01.
大数定律-中心极限定理
第五章 大数定律及中心极限定理
§5.1 大数定律 §5.2 中心极限定理
§5.1 大数定律
定义1 设Y1, Y2 …,Yn ,...为一随机变量序列,a是常数, 若对任意正数,有
lim
n
P{|Yn
a
|
}
1
则称随机变量序列Y1, Y2 ,…,Yn , ... 依概率收敛于a ,
记为:
Yn P a
性质:设 Xn P a, Yn P b , g(x, y)在点(a, b)连续,
n i 1
Xi
P
提醒:利用切比雪夫不等式证.
此定理表白: 相互独立具有相同期望和方差旳随机变 量X1, X2, …, Xn旳算术平均值依概率收敛于其数学期 望值 .
证
E(X)
E
1 n
n i 1
Xi
1 n
n i 1
E(X i
)
μ
D(X)
D
1 n
n i 1
X
i
1 n2
n
σ2
D(X i )
➢ 贝努力大数定律是辛钦定理旳特殊情况.
§5.2 中心极限定理
在客观实际中有许多随机变量,它们是由 大量旳相互独立旳随机原因旳综合影响所 形成旳,而其中每一种别原因在总旳影响中 起到旳作用都是微小旳.这种随机变量往往 近似旳服从正态分布.这种现象就是中心极 限定理旳客观背景.
本节只简介三个常用旳中心极限定理.
Xi= -1, 第i次碰钉后小球从右落下.
则Xi服从两点分布, E(Xi) =0, D(Xi)=1
Yn=X1+X2+…+Xn 由中心极限定理知,
Yn~N(0,n) 由正态分布旳特征知,小球落在中间 旳概率远远不小于落在两边旳概率.
§5.1 大数定律 §5.2 中心极限定理
§5.1 大数定律
定义1 设Y1, Y2 …,Yn ,...为一随机变量序列,a是常数, 若对任意正数,有
lim
n
P{|Yn
a
|
}
1
则称随机变量序列Y1, Y2 ,…,Yn , ... 依概率收敛于a ,
记为:
Yn P a
性质:设 Xn P a, Yn P b , g(x, y)在点(a, b)连续,
n i 1
Xi
P
提醒:利用切比雪夫不等式证.
此定理表白: 相互独立具有相同期望和方差旳随机变 量X1, X2, …, Xn旳算术平均值依概率收敛于其数学期 望值 .
证
E(X)
E
1 n
n i 1
Xi
1 n
n i 1
E(X i
)
μ
D(X)
D
1 n
n i 1
X
i
1 n2
n
σ2
D(X i )
➢ 贝努力大数定律是辛钦定理旳特殊情况.
§5.2 中心极限定理
在客观实际中有许多随机变量,它们是由 大量旳相互独立旳随机原因旳综合影响所 形成旳,而其中每一种别原因在总旳影响中 起到旳作用都是微小旳.这种随机变量往往 近似旳服从正态分布.这种现象就是中心极 限定理旳客观背景.
本节只简介三个常用旳中心极限定理.
Xi= -1, 第i次碰钉后小球从右落下.
则Xi服从两点分布, E(Xi) =0, D(Xi)=1
Yn=X1+X2+…+Xn 由中心极限定理知,
Yn~N(0,n) 由正态分布旳特征知,小球落在中间 旳概率远远不小于落在两边旳概率.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
x - E [ X ]
2
2
2
f X ( x)dx
( x - E[ X ])2
f X ( x)dx
2
1
2
( x - E[ X ]) f X ( x)dx
Var[ X ]
2
由切比雪夫不定式可直接证明切比雪夫弱大数定律。 定理 5.1.1 (切比雪夫弱大数定律) 设X1, X2, …为独立随机变 量序列,且Var[Xi]≤C,i=1,2,…,则对任意ε>0,有
分别取 n 1, 2, 4,8,32,看其概率分布的变化。
当n +时, X k的概率分布趋向于正态分布
k 1
n
为了防止n +时, X k的中心(即数学期望)趋向,
k 1
n
以及方差无限增大,因此在计算 X k的概率分布时,先
k 1
n
做标准化处理(变换):
X
k 1
X 1 X 2 X n a1 a2 an 0 (n ) n n 若能在某种条件下,对任意ε >0,有
X1 (ω) X 2 (ω) X n (ω) a1 a2 an lim P ω : ε 0 n n n 则称随机变量序列X1, X2, …服从(弱)大数定律。
若能在某种条件下,有
X1 (ω) X 2 (ω) X n (ω) a1 a2 an P ω : lim 0 1 n n n
则称随机变量序列X1, X2, …服从强大数定律
可以证明:若满足强大数定律,则满足弱大数定律。
n
k
E[ X k ]
k 1 n
n
令
Var[ X k ]
k 1
Zn
使得的数学期望E[ Z n ] 0, 方差Var[ Z n ] 1,再考虑Z n的分布。
定义 5.2.1 设X1, X2,… 为随机变量序列,具有有限的数学期
望和方差,若
X
k 1
n
k
E[ X k ]
k 1 n
n
n2
nC C 2 n n
由切比雪夫不等式,有 X1 X 2 X n X1 X 2 X n P - E[ ] ε n n X1 X 2 X n Var[ ] C n 2 0 (n ) 2 nε
则有 X1 X 2 X n X1 X 2 X n lim P - E[ ] ε 0 n n n
X1 , X 2 ,是独立同分布B(1, p)的随机变量序列, E[ X i ] = p , (i = 1, 2,, n),
νn X1 X 2 X n = n n 由辛钦弱大数定律,得 νn lim P p 0 n n 即得伯努利大数定律。
{Yn }满足辛钦大数定律条件,所以 对任意 0, 有 Y1 Y2 Yn lim P - 14 ε 0 n n 即
2 2 2 X X X X X X X P k 1 2 3 4 5 6 3 n 2 X 3 n 1 X 3 n 1 a, n n n a 14 k
推论5.1.1 (伯努利大数定律(频率收敛于概率))
记 vn 是 n 重伯努利试验中成功的次数, p 为一次试验成功
的概率,则对任意给定的>0有
νn lim P - p ε 0 n n 证 设X i 第i次试验时成功的次数,i 1, 2,
1 第i次试验成功 则 Xi 0 第i次试验不成功 P( X i 1) p, P( X i 0) 1 p n次试验中成功的次数vn X 1 X 2 X n
2 X 12 X 2 X 3 X 4 X 5 X 6 X 32n 2 X 3n 1 X 3n P a, n , n 并确定常数a之值.
解:设Yk =X 32k 2 X 3k 1 X 3k ,由于{ X n }是独立同分布的随机变量序列 所以, {Yn }也是独立同分布的随机变量序列,且
律(描述频率依概率1收敛) 。
推论5.1.2 (博雷尔强大数定律) 记vn为n重伯努利试验中成 功的次数,p为一次试验成功的概率,则
νn P lim = p 1 n n
例(习题5.11) 假设某洗衣店为第i个顾客服务的时间X i 服从区间[5,53](单位:分钟)上的均匀分布,且对每 个顾客是相互独立的,试问当n 时,n 次服务时间 1 n 的算术平均值 X i以概率1收敛于何值? n i 1 解: 依题意,显然有 {X n }是一个独立同分布的随机变量序列,
意义:随着n的增大,依概率意义讲,频率pn= vn / n越来越接近概 率p,而pn不接近p的可能性越来越小。 pn p ,因为不管n有多大,仍可能有 pn 偏离p 的情 不能说: lim n 形出现(虽然这些例外情形出现的概率趋于0)。
例(习题5.5) 设{ X n }是独立同分布的随机变量序列,且假设E[ X n ] 2, Var[ X n ] 6, 证明:
{X n }序列的算术平均值依概率1收敛于其公共数学期望.
只要存在有限的公共数学期望,则按柯尔莫哥洛夫强大数定律,
由于X i ~U(5,53),所以E[ X i ] (5 53) / 2 29, i 1, 2, , n 1 n 所以,P lim X i 29 1 n n i 1 1 n 即:n 次服务时间的算术平均值 X i以概率1收敛于29 (分钟) n i 1
以概率1收敛
设有随机变量序列X1, X2 ,…, Xn,…和随机变量Y 如果
P( : lim X n ( ) Y ( )) 1 x
Xn
a.s a.s
则称随机变量序列{Xn}以概率1收敛于Y, (也 称为{Xn}几乎处处收敛于Y )记为
Y Y 则 Xn
P
可以证明,若 X n
Y
强大数定律讨论的就是以概率1收敛.
弱大数定律一般形式:
若随机变量序列{Xn}满足:
1 n lim P X i n n i 1 1 n E[ X i ] n i 1 0
则称{Xn} 服从弱大数定律.
5.1.2 弱大数定律
5.2 中心极限定理
例:设有同分布的随机变量序列: {X 1 ,X 2 , ,X k ,}, 每个X k 都服从: 0 Xk ~ 1 3
n k 1
1 2 3
,
k 1, 2,
和函数 X k X 1 X 2 X n的概率分布随着n的增大 的变化?
第五章 大数定律和中心极限定理
5.1 5.2
大数定律 中心极限定理
§5.1 大数定律
5.1.1 大数定律问题的提法 举例
学校有 10000 个学生,平均身高为 a ;若随意观察 1 个学
生的身高X1,则X1与a可能相差较大。 若随意观察10个学生的身高X1, X2 ,…, X10 ,则10个数据 的均值(X1+X2+…+X10 )/10与a较接近; 若随意观察100个学生的身高X1, X2 ,…, X100 ,则100个数
X1 X 2 X n X1 X 2 X n lim P - E[ ] ε 0 n n n
证 由于X 1 , X 2 ,的独立性有 X1 X 2 X n Var n
Var[ X ]
i i =1
引理 5.1.1 (切比雪夫不等式) 设随机变量X的方差存在,则 对任意ε>0,有
2 证 以X 为连续型随机变量的情形证明。
P X - E[ X ]
x - E [ X ]
P X - E[ X ]
Var[ X ]
f X ( x)dx
=
( x - E[ X ])
n
N (0,1)
d
Var[ X k ]
k 1
则称X1, X2,… 服从中心极限定理。 说明:
按分布收敛
该定义表明若随机变量序列的和函数经标准化后其分
若能在某种条件下,对任意ε >0,有
Байду номын сангаас
X1 (ω) X 2 (ω) X n (ω) a1 a2 an lim P ω : ε 0 n n n
则称随机变量序列X1, X2, …服从(弱)大数定律。
若能在某种条件下,有
X1 (ω) X 2 (ω) X n (ω) a1 a2 an P ω : lim 0 1 n n n
据的均值(X1+X2+…+X100 )/100与a更接近;
若随意观察n(n<10000)个学生的身高X1, X2 ,…, Xn ,则n 个数据的均值(X1+X2+…+Xn )/n,随着n增大而与a充分接近。
对于一般情况,设有随机变量序列X1,X2,…,是否存在
确定数列a1,a2,…,使得在某种收敛意义下,有
则称随机变量序列X1, X2, …服从强大数定律
依概率收敛
设有随机变量序列X1, X2 ,…, Xn,…和随机变量Y
lim P X Y 若对任意的 >0,有 n n 0
则称随机变量序列{Xn}依概率收敛于Y, 记为
Xn
P
Y
弱大数定律讨论的就是依概率收敛.
定理5.1.2 (辛钦弱大数定律) 设X1, X2 ,… 是独立同分布的随机
2
2
2
f X ( x)dx
( x - E[ X ])2
f X ( x)dx
2
1
2
( x - E[ X ]) f X ( x)dx
Var[ X ]
2
由切比雪夫不定式可直接证明切比雪夫弱大数定律。 定理 5.1.1 (切比雪夫弱大数定律) 设X1, X2, …为独立随机变 量序列,且Var[Xi]≤C,i=1,2,…,则对任意ε>0,有
分别取 n 1, 2, 4,8,32,看其概率分布的变化。
当n +时, X k的概率分布趋向于正态分布
k 1
n
为了防止n +时, X k的中心(即数学期望)趋向,
k 1
n
以及方差无限增大,因此在计算 X k的概率分布时,先
k 1
n
做标准化处理(变换):
X
k 1
X 1 X 2 X n a1 a2 an 0 (n ) n n 若能在某种条件下,对任意ε >0,有
X1 (ω) X 2 (ω) X n (ω) a1 a2 an lim P ω : ε 0 n n n 则称随机变量序列X1, X2, …服从(弱)大数定律。
若能在某种条件下,有
X1 (ω) X 2 (ω) X n (ω) a1 a2 an P ω : lim 0 1 n n n
则称随机变量序列X1, X2, …服从强大数定律
可以证明:若满足强大数定律,则满足弱大数定律。
n
k
E[ X k ]
k 1 n
n
令
Var[ X k ]
k 1
Zn
使得的数学期望E[ Z n ] 0, 方差Var[ Z n ] 1,再考虑Z n的分布。
定义 5.2.1 设X1, X2,… 为随机变量序列,具有有限的数学期
望和方差,若
X
k 1
n
k
E[ X k ]
k 1 n
n
n2
nC C 2 n n
由切比雪夫不等式,有 X1 X 2 X n X1 X 2 X n P - E[ ] ε n n X1 X 2 X n Var[ ] C n 2 0 (n ) 2 nε
则有 X1 X 2 X n X1 X 2 X n lim P - E[ ] ε 0 n n n
X1 , X 2 ,是独立同分布B(1, p)的随机变量序列, E[ X i ] = p , (i = 1, 2,, n),
νn X1 X 2 X n = n n 由辛钦弱大数定律,得 νn lim P p 0 n n 即得伯努利大数定律。
{Yn }满足辛钦大数定律条件,所以 对任意 0, 有 Y1 Y2 Yn lim P - 14 ε 0 n n 即
2 2 2 X X X X X X X P k 1 2 3 4 5 6 3 n 2 X 3 n 1 X 3 n 1 a, n n n a 14 k
推论5.1.1 (伯努利大数定律(频率收敛于概率))
记 vn 是 n 重伯努利试验中成功的次数, p 为一次试验成功
的概率,则对任意给定的>0有
νn lim P - p ε 0 n n 证 设X i 第i次试验时成功的次数,i 1, 2,
1 第i次试验成功 则 Xi 0 第i次试验不成功 P( X i 1) p, P( X i 0) 1 p n次试验中成功的次数vn X 1 X 2 X n
2 X 12 X 2 X 3 X 4 X 5 X 6 X 32n 2 X 3n 1 X 3n P a, n , n 并确定常数a之值.
解:设Yk =X 32k 2 X 3k 1 X 3k ,由于{ X n }是独立同分布的随机变量序列 所以, {Yn }也是独立同分布的随机变量序列,且
律(描述频率依概率1收敛) 。
推论5.1.2 (博雷尔强大数定律) 记vn为n重伯努利试验中成 功的次数,p为一次试验成功的概率,则
νn P lim = p 1 n n
例(习题5.11) 假设某洗衣店为第i个顾客服务的时间X i 服从区间[5,53](单位:分钟)上的均匀分布,且对每 个顾客是相互独立的,试问当n 时,n 次服务时间 1 n 的算术平均值 X i以概率1收敛于何值? n i 1 解: 依题意,显然有 {X n }是一个独立同分布的随机变量序列,
意义:随着n的增大,依概率意义讲,频率pn= vn / n越来越接近概 率p,而pn不接近p的可能性越来越小。 pn p ,因为不管n有多大,仍可能有 pn 偏离p 的情 不能说: lim n 形出现(虽然这些例外情形出现的概率趋于0)。
例(习题5.5) 设{ X n }是独立同分布的随机变量序列,且假设E[ X n ] 2, Var[ X n ] 6, 证明:
{X n }序列的算术平均值依概率1收敛于其公共数学期望.
只要存在有限的公共数学期望,则按柯尔莫哥洛夫强大数定律,
由于X i ~U(5,53),所以E[ X i ] (5 53) / 2 29, i 1, 2, , n 1 n 所以,P lim X i 29 1 n n i 1 1 n 即:n 次服务时间的算术平均值 X i以概率1收敛于29 (分钟) n i 1
以概率1收敛
设有随机变量序列X1, X2 ,…, Xn,…和随机变量Y 如果
P( : lim X n ( ) Y ( )) 1 x
Xn
a.s a.s
则称随机变量序列{Xn}以概率1收敛于Y, (也 称为{Xn}几乎处处收敛于Y )记为
Y Y 则 Xn
P
可以证明,若 X n
Y
强大数定律讨论的就是以概率1收敛.
弱大数定律一般形式:
若随机变量序列{Xn}满足:
1 n lim P X i n n i 1 1 n E[ X i ] n i 1 0
则称{Xn} 服从弱大数定律.
5.1.2 弱大数定律
5.2 中心极限定理
例:设有同分布的随机变量序列: {X 1 ,X 2 , ,X k ,}, 每个X k 都服从: 0 Xk ~ 1 3
n k 1
1 2 3
,
k 1, 2,
和函数 X k X 1 X 2 X n的概率分布随着n的增大 的变化?
第五章 大数定律和中心极限定理
5.1 5.2
大数定律 中心极限定理
§5.1 大数定律
5.1.1 大数定律问题的提法 举例
学校有 10000 个学生,平均身高为 a ;若随意观察 1 个学
生的身高X1,则X1与a可能相差较大。 若随意观察10个学生的身高X1, X2 ,…, X10 ,则10个数据 的均值(X1+X2+…+X10 )/10与a较接近; 若随意观察100个学生的身高X1, X2 ,…, X100 ,则100个数
X1 X 2 X n X1 X 2 X n lim P - E[ ] ε 0 n n n
证 由于X 1 , X 2 ,的独立性有 X1 X 2 X n Var n
Var[ X ]
i i =1
引理 5.1.1 (切比雪夫不等式) 设随机变量X的方差存在,则 对任意ε>0,有
2 证 以X 为连续型随机变量的情形证明。
P X - E[ X ]
x - E [ X ]
P X - E[ X ]
Var[ X ]
f X ( x)dx
=
( x - E[ X ])
n
N (0,1)
d
Var[ X k ]
k 1
则称X1, X2,… 服从中心极限定理。 说明:
按分布收敛
该定义表明若随机变量序列的和函数经标准化后其分
若能在某种条件下,对任意ε >0,有
Байду номын сангаас
X1 (ω) X 2 (ω) X n (ω) a1 a2 an lim P ω : ε 0 n n n
则称随机变量序列X1, X2, …服从(弱)大数定律。
若能在某种条件下,有
X1 (ω) X 2 (ω) X n (ω) a1 a2 an P ω : lim 0 1 n n n
据的均值(X1+X2+…+X100 )/100与a更接近;
若随意观察n(n<10000)个学生的身高X1, X2 ,…, Xn ,则n 个数据的均值(X1+X2+…+Xn )/n,随着n增大而与a充分接近。
对于一般情况,设有随机变量序列X1,X2,…,是否存在
确定数列a1,a2,…,使得在某种收敛意义下,有
则称随机变量序列X1, X2, …服从强大数定律
依概率收敛
设有随机变量序列X1, X2 ,…, Xn,…和随机变量Y
lim P X Y 若对任意的 >0,有 n n 0
则称随机变量序列{Xn}依概率收敛于Y, 记为
Xn
P
Y
弱大数定律讨论的就是依概率收敛.
定理5.1.2 (辛钦弱大数定律) 设X1, X2 ,… 是独立同分布的随机