5.1大数定律
大数定律与中心极限定律
D
n i 1
Xi
1 n2
n i 1
D
Xi
1 n2
n i 1
pi qi
1 n2
n 4
1 4n
根据切比雪夫不等式,有
0 P{| X E
X
| } D X
2
1
4n 2
所以
lim P{| X p | } 0
n
(前面两个定理说明,只要 X 的方差 D X
当n充分大时能任意地小,则大数定律就成立,
(在概率论中,习惯上把和的极限分布收敛于正态分布 的那一类定理称为中心极限定理.)
定义 设 Xn (n= 1,2, … )是相互独立的随机变量序列,
假定EXk , DXk都存在, 令
n
n
n
n
Xi E( Xi ) Xi EXi
Yn i1
i 1 n
i1
i 1 n
D( Xi )
DXi
i 1
nn证: 因为源自EXE1 n
n i 1
Xi
1 n
E
n i 1
Xi
1 n
n i 1
E
X
i
1 n
np
p
D
X
D
1 n
n i 1
Xi
1 n2
D
n i 1
Xi
1 n n2 i1
D
X
i
1 n2
npq
pq n
1 4n
根据切比雪夫不等式,有
D X
1
0 P{| X E X | } 2 4n 2
当n很大,0<p<1是一个定值时, (或者说,np也很大时) 二项分布近似服从正态分布N(np, np(1p)).
5.1 大数定律
e
2
或者
P{| X E ( X ) | e } 1
D( X )
e
2
.
电子科技大学
马尔科夫不等式及大数定律
概率估计
方差性质
重复试验次数估计
二. 大数定律的定义 1. 依概率收敛 定义5.1.1 设Xn, n=1,2…是一个随机变量 序列, X 是一个随机变量或常数, 若对于任意 的e > 0, 有
林德伯格—列维 中心极限定理 棣莫佛—拉普拉斯 中心极限定理
辛钦大数定律
电子科技大学
马尔科夫不等式及大数定律
例5.1.1 设随机变量序列 X1, X2,·, Xn· 服从如 · · · · 下的分布:
P{ Xn = 0 }= 1
则对任意的 e 0, 有
P{ Xn = 2n }=
lim P{ X n e } lim P{ X n 2n} 0
电子科技大学
马尔科夫不等式及大数定律
例5.1.4 泊松大数定律 设Xk,k=1,2…是相互独立的随机变量序列,
P{ X n 1} pn , P{ X n 0} 1 pn qn .
则随机变量序列{Xk}, k=1,2…服从大数定律. 分析 根据切比雪夫大数定理仅需证明存 在常数C,使 D(Xn ) < C, k = 1,2,…
电子科技大学
马尔科夫不等式及大数定律
3.小概率事件原理
概率很小的事件,在
一次试验中几乎是不可能发生的,从而在实
际中可看成不可能事件.
定理5.1.3 辛钦大数定律
设Xk,k=1,2…是相互独立同分布的随机
变量序列,若Xk的数学期望存在,则{Xk}服
第五章大数定律及中心极限定理
k 1
其中 X1, X2 ,, Xn是相互独立的、服从同一
均值为μ,方差为σ2>0的独立同分布的随机变量
n
X1,X2,…,Xn之和 X k 的标准化变量,当n充分
大时,有
k 1
n
k 1
Xk
nm
~近似N(0,1)
ns
n
这样可以用(标准)正态分布来对 X k 作
k 1
理论分析或实际计算,不必求分布函数
19/41
§5.2 中心极限定理
将上式改写为
即对任意的正数ε,当n充分
lim P n
1 n
n k 1
Xk
m
1.
大时,不等式 立的概率很大
|
X
m | 成
3/41
证 由随机变量X1,X2,…,Xn,…相互独立,且具有 相同的数学期望和方差,有
E
1 n
n k 1
Xk
lim
n
P
1 n
(X1
X2
Xn)
p
1,
即
lim
n
P
nA n
p
1.
伯努利大数定理表明,事件发生的频率nA/n依概率收敛
于事件的概率p,以严格的数学形式表达了频率的稳定性和概
率的合理性
近似:当n很大时,事件发生的频率nA/n与概率有较大偏差的 可能性很小,因此由实际推断原理,由于小概率事件几乎不
辛钦定 理
X P m
概率论与数理统计第5章-大数定律与中心极限定理
又设函数 g ( x , y ) 在点 (a , b ) 连续,
P 则 g( X n , Yn ) g(a , b ).
证明
因为 g( x , y ) 在 (a , b) 连续,
0, 0,
g( x , y ) g(a , b) ,
g ( x, y) g (a, b) ,
因此0 P{ g( X n , Yn ) g(a, b) }
n 0, P X n a P Yn b 2 2
P 则 g( X n , Yn ) g(a , b).
[证毕]
定理5.1(贝努里大数定律) 设nA是n重贝努里试验中事件A发生的 次数, p是事件A在一次试验中发生的概率, 则对于任意的 0, 有
P P 注 : 若X n X , Yn Y , 则 P P (1) X n Yn X Y ;(2) X n Yn X Y;
Xn P X (3) X nYn XY ;(4) Yn Y
P
依概率收敛序列的性质
P P 设 Xn a , Yn b, (a , b为常数)
第五章 大数定律与中心极限定理
5.1 大数定律 5.2 中心极限定理
“概率是频率的稳定值”。前面已经提到,当随机 试验的次数无限增大时,频率总在其概率附近摆动, 逼近某一定值。大数定理就是从理论上说明这一结果。 正态分布是概率论中的一个重要分布,它有着非常广 泛的应用。 中心极限定理阐明,原本不是正态分布的一般随机 变量总和的分布,在一定条件下可以渐近服从正态分 布。这两类定理是概率统计中的基本理论,在概率统 计中具有重要地位。
大数定律的客观背景 大量的随机现象中平均结果的稳定性
5.1大数定律
证:
1 n 1 n 1 n E( X k ) E( X k ) n k 1 n k 1 n k 1 1 n 1 D( X k ) 2 n k 1 n 1 1 2 2 D( X k ) 2 n n n k 1
n
由Chebyshev不等式得:
n A n “ 稳定于”事件 A 在一次试验中发生
的概率是指:
nA nA 频率 与 p 有较大偏差 p 是 n n
小概率事件, 因而在 n 足够大时, 可以用频 率近似代替 p . 这种稳定称为依概率稳定.
或
n nA lim P p 1 n n
证: 引入 r.v. 序列{Xk}
1, Xk 0, 第k次试验 A发生 第k次试验 A 发生
pq
设P( X k 1) p, 则E ( X k ) p, D( X k ) n X 1 , X 2 ,, X n 相互独立,nA X k
正数, 有
1 n lim P X k 1. n n k 1
3、Bernoulli 大数定律 1)内容:设 nA 是 n 次独立重复试验中事件 A 发生的次数, p 是每次试验中 A 发生的概率, 则 nA P p 0 0 有 lim n
由 Chebyshev大数定律,得
1 n lim P X k p 1. n n k 1
k 1
nA 即: lim P p 1 n n
2)伯努利(Bernoulli)大数定律的意义
在概率的统计定义中, 事件 A 发生的频率
第五章 大数定律及中心极限定理
大数定律及中心极限定理
定理1 (切比雪夫定理旳特殊情况)设随机变量序
列 X1,X2,…,Xn, ...相互独立,且具有相同旳数学期望
和方差: E(Xk)=,D(Xk)=2 (k=1,2,...) , 则对任意
旳
> 0,有
lim P n
1 n
n
Xi
i 1
1
即
X
1 n
第五章 大数定律及中心极限定理
§5.1 大数定律 §5.2 中心极限定理
§5.1 大数定律
定义1 设Y1, Y2 …,Yn ,...为一随机变量序列,a是常数, 若对任意正数,有
lim
则称随机变量序列Y1, Y2 ,…,Yn , ... 依概率收敛于a ,
记为: Yn P a
性质:设 Xn P a, Yn P b , g(x, y)在点(a, b)连续,
100
于是, 一盒螺丝钉旳重量为 X Xi i 1
且 E( X i ) 100, D( X i ) 10, n 100
由中心极限定理
100
P{ X 10200} P{ i 1
Xi
10200}
P
100
Xi
i 1
n
n
10200 n n
P
X
1000 100
10200 1000
Φ
k 120 48
Φ
120 48
0.999
k 141.48,
至少供电142千瓦,才干确保以不不大于99.9%旳概率正常工作.
例3 在人寿保险企业里,有3000个同一年龄旳人参加保险.设在
一年内这些人旳死亡率为0.1%, 参加保险旳人在一年旳头一天 交付保险费10元,死亡时,家眷可从保险企业领取2023元. 求 (1)保险企业一年中获利不不大于10000元旳概率;
第5章大数原理
2. 随机模拟计算(Monte Carlo 方法)
I = ∫ f ( x ) dx I 1 =∫ f ( x ) dx = Ef ( X ), b−a a b−a
b a b
X ~ U (a , b)
随机生成 n 个服从 (a,b)上均匀分布的随机 变量 X1,…,Xn,因此 f (X1),…,f(Xn) 独立而且 具有相同的数学期望 I/(b-a)。 积分 I 可以通过它们的算术平均近似得到。
∑C
k =a
b
k n
p q
k
≈Φ(
)
例5.1.2 抛掷一个均匀硬币 100 次,近似计算 正面出现的次数X 介于 40~ 60 之间的概率。 解. 第四章利用切比雪夫不等式已求出下界: P( 40 ≤X ≤60) ≥ 0.75 。 X ~ B(100,0.5),EX = 50,DX = 25,所以 X - 50 P( 40 ≤X ≤60) = P(-2 ≤ ——— ≤2) 5 ≈Φ(2) - Φ(-2) = 2×0.9772 - 1 = 0.9544。 精确值是 0.9647998
Yn = S n − ES n DS n ,n≥1
标准化部分和的期望是 0,方差是 1 。
5.2.2. 随机现象正常状态的分布
定理 5.1.3 (独立同分布情况)
X1,X2,…是独立同分布的随机变量序列, 期望µ、方差σ2 都存在,则对于任意的实数 x, 随机序列X1,X2,…的标准化部分和的分布 函数 Fn(x) 收敛到标准正态分布函数Φ(x)。
证明. 贝努里定理可看成切比雪夫定理的特例。 A 发生的次数 nA 实际上服从 B(n,p) 。 根据二项分布的分解: nA = X1 + X2 + …+ Xn , 这里每个 Xk 服从参数 p 的两点分布; 因此由切比雪夫定理得到贝努利定理成立。
高等数学5.1 大数定律
设
P X n a ,
P Yn b ,
函数 g( x , y ) 在点 ( a , b ) 连续 , 则
P g( X n , Yn ) g ( a , b) .
伯努利大数定律是将概率的统计定义用数学式 表示出来, 它表明随着 n 的增大, 事件 A发生
2、定理5.2(切比雪夫定理的特殊情况): 设随机变量 X1 ,X2 , … , Xn , … 相互独立 , 且 具有相同的数学期望和方差:
E( X k ) = ,
D( X k ) = 2 .
作前个随机变量的算术平均 则对于任意正数 ε , 有
1 n X = Xk n k =1
lim P
1 n lim P X k = 1 . n n k =1
定理5.2表明, 当 n 很大时, 随机变量 X1 ,X2 , … , Xn
的算术平均 X 接近于数学期望
E ( X1 ) = E ( X 2 ) = = E( X n ) = .
当然这种接近是在概率意义下的接近 . 有定理5.2 作保证, 当变量数学期望未知的时候, 可以选择一 些与该变量独立且有相同数学期望的随机变量, 用 它们的算术平均数作为数学期望的估计值, 选取的 随机变量个数越多, 估计程度就越好, 这在实际问 题的处理中是十分有用的 .
3、定理5.3(辛钦定理):
设随机变量 X1 ,X2 , … , Xn , … 相互独立 , 服从
同一分布, 具有数学期望
E( X k ) =
则对于任意正数 ε , 有
(k = 1, 2, ) ,
1 n lim P X k = 1 . n n k =1
概率论与数理统计5.1大数定律
即
1 n lim P X i ò 1. n n i 1
证明超本课程范围,略,详见魏宗舒的教材。 定律的含义:观测量X在相同的条件下重复观测n 次,当n充分大时,“观测值的算术平均值接近 于期望”是一大概率事件。 以任意大的把握用观测值 1 n 的算术平均值近似期望。 xi 依概率收敛于 n i 1 1 n 即n充分大时, x xi n i 1 9
2
n
1.
6
说明大量随机试验的平均具有稳定性.
2). 一般情形 定理 设随机变量列 { X n }相互独立,且均具有 数学期望, 且方差有界,即 D( X n ) C, n 1, 2,..., 则 ò 0, 有 1 n 1 n lim P X i E ( X i ) ò 1. n n i 1 n i 1
成立,则称 X n 服从大数定律。
随机变量列前若干项的算术平均依概率收敛于某 数列。
4
切比雪夫(Chebyshev)不等式
设随机变量X具有有限数学期望EX和方差DX,则 对于任意正数
,如下不等式成立。
DX
P X EX
2
——切比雪夫不等式
5
2. 切比雪夫定理
1). 特殊情形 定理5.1 设随机变量列 { X n }相互独立,且具有相 同的数学期望和方差, E( X n ) , D( X n ) 2 , n 1, 2,...,
A发生的频率代替概率的理论依据.
前面介绍的大数定律要求各随机变量方差存在。
8
于 ò 0, 有
4. 辛钦大数定律(样本平均数稳定性) 定理 设随机变量X1,X2,…,Xn,„相互独
5.1 大数定律-
若对任意的 ε >0,有
lim P
n
Yn a
1,
则称Y1,Y2 , Yn , 依概率收敛于 a,记作 Yn P a .
性质:若 Xn P a ,Yn P b,函数 g(x, y)在点(a,b) 连续,则 g( Xn ,Yn ) P g(a, b)。
1 n
n k 1
Xk2
2
1.
内容小结
大数定理 ——契比雪夫定理的特殊情况
辛钦定理 X 伯努利大数定理
1 n
n k 1
Xk
P
f A P p
n
频率的稳定性是概率定义的客观基础, 而伯努利大数 定理以严密的数学形式论证了频率的稳定性.
大数定律给出了:以算术平均值代替均值、以频率代替 概率、以样本推断总体的理论基础。
2
1.
解 因为 X1, X2 , , Xn , 是相互独立同分布的,
所以
X
2 1
,
X
2 2
,
,
X
2 n
,
也是相互独立同分布的,(P75 定理)
又 E( Xk2 ) D( Xk ) [E( Xk )]2 2 ,
由辛钦定理知
对于任意正数 , 有
lim
n
P
(2) 在实际应用中,当试验次数很大时,便可以用事件的频 率来代替事件的概率。
补例 设随机变量 X1, X2 , , Xn , 独立同分布,且 E( Xk ) 0,
D( Xk ) 2 , k 1, 2, , 证明对任意正数 有
lim
概率论与数理统计 第五章
贝努里定理. 它的叙述如下:设是n次重复独立 对于任意给定的ε>0,有
lim P{| nA p | } 1
n
n
lim P{| nA p | } 1
n
n
其中nA/n是频率,p是概率,即次数多
时事件发生的频率收敛于概率.表示频率的稳定性.
定理3
lim P{|
n
1 n
n i 1
Xi
| } 1
数理统计的方法属于归纳法,由大量的资料作依据,而不
是从根据某种事实进行假设,按一定的逻辑推理得到的.例
如统计学家通过大量观察资料得出吸烟和肺癌有关,吸烟
者得肺癌的人比不吸烟的多好几倍.因此得到这个结论.
数理统计的应用范围很广泛.在政府部门要求有关的资
料给政府制定政策提供参考.由局部推断整体,学生的假期
第五章 大 数 定 律 与 中 心 极 限 定 律
§ 5.1大 数 定 律
定理1(切比雪夫定理) 设X1,X2,...,Xn,...是相互独立的随机变
量序列若存在常数C,使得D(Xi)≤C. (i=1,2,...n),则对任意给
定的ε>0,有
lim P{|
n
1 n
n i 1
[Xi
E( X i )] |
7200 6800 2
200 1
D 2
1
2100 2002
0.95
可见虽有10000盏灯,只要电力供应7200盏灯即有相当大的保 证率切贝谢夫不等式对这类问题的计算有较大价值,但它的精度 不高.为此我们研究下面的内容.
2021/9/5
10
§ 5.2 中 心 极 限 定 理
在随机变量的一切可能性的分布律中,正态分布占有特殊的
第五章大数定律与中心极限定理
Xi
1 n
n i 1
E(Xi)
1,
则称{Xn}服从大数定律.
(2)伯努利大数定律是切比雪夫大数定律的特例
(3) 伯努利大数定律和切比雪夫大数定律的证明 都用到切比雪夫不等式,而且需要方差存在。
定理 5.1.4. 辛钦大数定律
设X1, X 2 ,..., X n,...是独立同分布的随机变量序列,
意义:只要试验次数够大,发生事件的频率无限接近于 概率,频率稳定性,频率代替概率。
定理 5.1.3. 切比雪夫大数定律
设X1 , X 2 ,, X n ,是一相互独立的随机变 量序列,
它们的数学期望和方差 均存在,且方差有共同 的上界,
即存在常数 K 0,使得 D ( X i ) K , i 1,2, ,
不等式给出了X 与它的期望的偏差不小于的概率
的估计式.
例 1 E( ) 4, D( ) 0.2, 则由切比雪夫不等式知
P{| 4 | 2} P{| 4 | 1}
,
P{ X
}
2 2
,
P{1 7}
定义 5.1.1设{X n}是一个随机变量序列,a是常数,
若对于任意的 0,有
已知整个系统中至少有84个部件正常工作,系统
工作才正常.试求系统正常工作的概率.
解: 记Y为100个部件中正常工作的部件数,则
Y 近似服从 N(100 0.9,100 0.9 (1 0.9))
即Y 近似服从N (90, 9)
因此,所求概率为
P{Y 84}=1-P{Y<84}=1-P{ Y-90 < 84-90 }
解: 设Xi为第i个螺丝钉的重量,i 1, 2,...,100.
且设X 为一盒螺丝钉的重量.
大数定理
2、独立同分布情形下的中心极限定理 (林德伯格—列维定理) 设 是一个独立同
分布的随机变量序列 且
记
则对任一实数 x 有
此定理说明,不论 当 足够大时,总可以近似地认为
原
来服从什么分布,只要是独立同分布,
或
由定理知随机变量
V E (V ) D(V )
所以 V 20 5 105 20 5 P 105 P V 20 100 12 20 100 12
a np np(1 p)
)
P( X 30) 1 P( X 30)
例3: 某保险公司多年的统计资料表明, 在索赔户中被盗索赔户占20%,以X表示 在随机抽查的100个索赔户中因被盗向保 险公司索赔的户数。
Hale Waihona Puke (1)写出X的概率分布;(2) 求被盗索赔户不少于14户且不多于30
户的概率;
证:设X是连续型随机变量,它的分布密度为:
则
用对立事件的计算公式:
二、大数定律
1、随机变量序列的收敛定义 是一随机变量 定义1 设 序列,如果存在一个常数
n
对
总有 lim P{| X n | } 1 成立。 则称 依概率收敛于
P P
P 记为 X n
性质:若 X n a, n Y b, 函数 g ( x , y ) 在 ( a, b) 连续, 则有 g ( X n , Yn ) g ( a, b).
3、德莫佛-拉普拉斯中心极限定理
设 N A 是 n 重伯努利试验中事件A发生的
次数, p 是每次试验事件A发生的概率,即
N A ~ B ( n, p )
,则 有
《概率论与数理统计》课件第五章大数定律及中心极限定理
4.大样本统计推断的理论基础
是什么?
大数定律中心极限定理
随机现象中平均结果的稳定性
大数定律的客观背景
大量抛掷硬币正面出现频率
字母使用频率
生产过程中的废品率
§5.1 大数定律
背景:1. 频率稳定性2. 大量测量结果算术平均值的稳定性
回顾
随机现象的主要研究方法
概率分布
01
证:_x001A__x001B__x001B_,_x001A__x001B__x001B_,⋯, _x001A__x001B__x001B_, ⋯相互独立同分布,则_x001A__x001B__x001B__x001B_,_x001A__x001B__x001B__x001B_, ⋯,_x001A__x001B__x001B__x001B_, ⋯也相互独立同分布,由辛钦大数定律得证.
第五章 大数定律及中心极限定理
§5.1 大数定律§5.2 中心极限定理
要点:用切比雪夫不等式估算概率独立同分布,用中心极限定理计算对于二项分布,当n很大时,计算
本章要解决的问题
1.为何能以某事件发生的频率
作为该事件的概率的估计?
2.为何能以样本均值作为总体
期望的估计?
3.为何正态分布在概率论中占
解:(1)设X表示一年内死亡的人数,则~(, ),其中=,=.%. 设Y表示保险公司一年的利润,=×−.需要求的是_x001A_<_x001B_.
由中心极限定理
_x001A_<_x001B_=_x001A_×−<_x001B_ =_x001A_>_x001B_=−_x001A_≤_x001B_
且,
由中心极限定理
解:设为第i个螺丝钉的重量, 相互独立同分布. 于是,一盒螺丝钉的重量为
第5章 大数定律和中心极限定理
.由德莫佛-拉普拉斯定理,得
8040 10000 0.8 7940 10000 0.8 P 7940 X 8040 10000 0.8 1 0.8 10000 0.8 1 0.8 1 1.5 1 1 1.5 0.7745
2. 中心极限定理
本章
上页
下页
5.2 中心极限定理
1. 标准化变量 定义:设随机变量X的数学期望为E(X),方差为D(X) 令Y= E(Y)= X E( X ) E D X
X E( X ) D X
1 D X
则称Y为X的标准化随机变量.
E[ X E ( X )]
5.1 大数定律
2. 依概率收敛 定义1:
5.1 大数定律
3. 大数定律
定理1 (切比雪夫大数定理) 设X1 , X 2 ,, X n , 是相互独立的 随机变量序列,它们的数学期望和方差都存在, 且存在一个常 数 l ,对任意 i Z , 均有D( X i ) l, 则对任意 0, 都有
所求为满足
的最小的n .
X P (0.74 0.76) 0.90 n
X P (0.74 0.76) 可改写为 n P(0.74n< X<0.76n )
=P(-0.01n<X-0.75n< 0.01n) = P{ |X-E(X)| <0.01n} 在切比雪夫不等式中取 0.01n,则 X P (0.74 0.76) = P{ |X-E(X)| <0.01n} n 0.1875n 1875 D( X ) 1 1 1 2 2 0.0001n n (0.01n)
概率论与数理统计:5_1大数定律
P(X ) E(X )
证 仅证连续型 r.v.的情形
P( X
)
f
(x)dx
x
f
(x)dx
1
0
xf
(x)dx
E(X
)
推论 1 ——马尔可夫 ( Markov ) 不等式
设随机变量 X 的k阶绝对原点矩 E( |X |k)
存在,则对于任意实数 > 0,
P(|
X
|
由 Chebyshev 不等式, = 0.01n ,故
P|
令
X
0.75n
|
0.01n
1
0.1875n (0.01n)2
1
0.1875n (0.01n)2
0.90
解得 n 18750
大数定律
贝努里(Bernoulli) 大数定律
设 nA 是 n 次独立重复试验中事件 A 发生 的次数, p 是每次试验中 A 发生的概率, 则 0 有
lim P
n
1 n
n k 1
Xk
0
或
lim P
n
1 n
n k 1
Xk
1
定理的意义
具有相同数学期望和方差的独立 r.v.序列的 算术平均值依概率收敛于数学期望.
当 n 足够大时, 算术平均值几乎是一常数.
数学 期望
可被
算术 均值
近似代替
注1 X1, X 2,, X n , 不一定有相同的数学 期望与方差,可设
P940
X
1060
1059
Ck 6000
k 941
1 6
k
5 6
6000k
概率论5.1大数定理的概念
研究大量的随机现象,常常采用极限形式,由此导致对极限定理进行研究. 极限定理的内容很广泛,其中最重要的有两种:与大数定律中心极限定理§5.1大数定理的概念:大量的随机现象中平均结果的稳定性大数定律的客观背景大量抛掷硬币正面出现频率字母使用频率生产过程中的废品率……§5.2切贝谢夫不等式.设随机变量X 有期望E (X )和方差,则对于任给>0,DX ε2εεDX}|)X (E X {|P ≤≥-21εεDX}|)X (E X {|P -≥<-或:证明:2εεDX}|)X (E X {|P ≤≥-如果X 是离散型随机变量,那么:=≥-}|)X (E X {|P ε∑≥-εEX x k k p 1≥-εEX x k Θ()∑≥--≤εεEX x k k k p EX x 22()∑-≤k k p EX x 22ε2εDX=如果X 是连续型随机变量,可证明结论成立.说明:1.切贝谢夫不等式成立的条件是:DX ,EX 存在.2.切贝谢夫不等式给出了随机变量的离差的绝对值与其方差DX 的关系.EX X -方差DX 越小,随机变量X 与其期望EX 的离差也越小.EX ( )ε-EX ε+EX X EX 的代表性强.3.给出了以下概率的下界或上界:}|)X (E X {|P ε<-21DXε-≤1≤{|()|}P X E X ε-≥2DX ε≤0≤3.切贝谢夫不等式:}|)X (E X {|P ε<-21εDX -≥由此:21εεεDX }EX X EX {P -≥+<<-当EX 和DX 已知时,可估计对称区间的概率但精确度不高.例设电站供电网有10000盏点灯,夜晚每一盏灯开灯的概率都是0.7,而假定开,关时间彼此独立,估计夜晚同时开着的等数在6800与7200之间的概率?解:令X 表示在夜晚同时开着的灯数,它服从参数n=10000,p=0.7的二项分布.EX=np=7000DX=npq=2100P(6800<X<7200)=}X {P 20070002007000+<<-}EX X {P 200<-≥22001DX -=0.95(一)定理1(切贝谢夫大数定律)∑∑==∞→=<-n i n i i i n X E n X n P 111}|)(11{|lim ε设X 1,X 2, …是相互独立的随机变量序列,它们都有有限的期望EX i 和方差DX i ,并且方差有共同的上界,即D (X i ) ≤K ,i =1,2, …,切比雪夫则对任意的ε>0,§5.3 大数定理证明:∑∑==∞→=<-n i n i i i n X E n X n P 111}|)(11{|lim ε∑==n i i X n 11ξ令:⎭⎬⎫⎩⎨⎧<-∑∑==n i n i i i |)X (E n X n P 1111ε=ξE 则:⎪⎪⎭⎫ ⎝⎛∑=n i i X n E 11∑==n i i EX n 11{}εξξ<-=E P 1≤由切贝谢夫不等式得:{}21εξεξξD E P -≥<-22111n i i DX n ε==-∑21K n ε≥-注意定理的几个条件:1.独立性:ΛΛn X ,X ,X 21相互独立.2.均值,方差的存在性.Λ,,i DX ,EX i i 21=存在.3.所有方差都有共同的上界.Λ,,i kDX i 21=<由此看出:切贝谢夫定理的条件比不等式的强.(二).依概率收敛于a 的定义.{}n ξ若存在常数a ,使得对于任何有:0>εεξ<-a n ∞→n lim {}1=P 1.{}n ξ是随机变量序列.ΛΛn ,,ξξξ212.εξ<-a n 是指随机变量序列收敛于a .…..(*)3. (*)说明当n 增大时,几乎是必然事件.{}n ξ∑=ni i X n 11随机的了,取值接近于其数学期望几乎是必然事件.即当n 充分大时,差不多不再是切比雪夫大数定律给出了平均值稳定性的科学描述∑=ni i X n 11∑=ni i EX n 11P作为切比雪夫大数定律的特殊情况,有下面的定理.1}|1{|lim 1=<-∑=∞→εμni i n X n P 设X 1,X 2, …是独立随机变量序列,且E (X i )= ,D (X i )= ,i =1,2,…,则对任给>0,2σμε说明:随机变量的算术平均值依概率收敛于其均值.推论:贝努里设X 是n 重贝努里试验中事件A 发生的次数,p 是事件A 发生的概率,⎩⎨⎧=否则,发生次试验如第,01A i X i 引入i =1,2,…,n 则∑==ni iX X 1∑==ni i X n n X 11是事件A 发生的频率X i 01p kp1-p(三)贝努里大数定律.于是有下面的定理:设X 是n 重贝努里试验中事件A 发生的次数,p 是事件A 发生的概率,则对任给的ε> 0,定理3(贝努里大数定律)1=<-∞→}|p nX{|P lim n ε贝努里说明:当试验次数增大时,事件发生的频率稳定于概率.贝努里大数定律表明,当重复试验次数n 充分大时,事件A 发生的频率X /n 与事件A 的概率p 有较大偏差的概率很小.贝努里大数定律提供了通过试验来确定事件概率的方法.0=≥-∞→}|p nX{|P lim n ε或:任给ε>0,贝努里大数定律请看演示蒲丰投针问题中解法的理论依据就是大数定律当投针次数n 很大时,用针与线相交的频率m /n 近似针与线相交的概率p ,从而求得π的近似值.针长L 线距aamLn 2≈π解:因为针长L 与平行线的交点数m 成正比.kL m =aaπ为求k,令L=aπ做n 次试验,其交点个数为2n,于是:a k n π=2an k π2=a nL m π2=ma nL 2=π只需要令:a L 21=m n ≈π试验2212次,其中交点有704次,则:22123.142704π≈=下面给出的独立同分布下的大数定律,不要求随机变量的方差存在.设随机变量序列X 1,X 2, …独立同分布,具有有限的数学期E (X i )=μ,i=1,2,…,则对任给ε>0 ,定理2(辛钦大数定律)1}|1{|lim 1=<-∑=∞→εμn i i n X n P 辛钦大数定律辛钦请看演示例如要估计某地区的平均亩产量,要收割某些有代表性的地块,例如n 块. 计算其平均亩产量,则当n较大时,可用它作为整个地区平均亩产量的一个估计.中心极限定理在实际问题中,常常需要考虑许多随机因素所产生总影响.例如:炮弹射击的落点与目标的偏差,就受着许多随机因素的影响.观察表明,如果一个量是由大量相互独立的随机因素的影响所造成,而每一个别因素在总影响中所起的作用不大. 则这种量一般都服从或近似服从正态分布.自从高斯指出测量误差服从正态分布之后,人们发现,正态分布在自然界中极为常见.∑∑∑===-=nk k nk nk k kn X D X E XZ 111)()(设:ΛΛn X ,X ,X ,X 321是相互独立的随机变量nX X X X +++=Λ21其有限和函数为:称:为规范和.∑∑∑===-=nk k nk nk k kn X D X E XZ 111)()(的分布函数的极限.可以证明,满足一定的条件,上述极限分布是标准正态分布.考虑中心极限定理设ΛΛn X ,X ,X 21是相互独立的随机变量有期望值i i EX α=及方差+∞<=2ii DX σ()Λ21,i =若每个i X 对总和∑=ni iX 1的影响不大.其规范和的分布函数的极限分布为标准正态分布.定理5.3: (李雅普诺夫定理)=⎪⎪⎭⎫⎝⎛∑=ni i X E 1∑=n i i EX 1∑==ni i 1α=⎪⎪⎭⎫ ⎝⎛∑=ni i X D 1∑=n i i DX 1∑==n i i 12σ∑∑∑===-=ni i ni ni i in )X (D )X (E XZ 111∑==ni in S 12σ令:()∑=-=ni i inXS 11α()dte x Z P lim t xn n 2221-∞-∞→⎰=≤π()x Φ=}{lim 1x nn XP ni in ≤-∑=∞→σμ⎰∞=x-2t -dt e 212π设X 1,X 2, …是独立同分布的随机变量序列,且E (X i )= ,D (X i )= ,i =1,2,…,则2σμ列维一林德伯格(Levy -Lindberg )定理.定理1(独立同分布下的中心极限定理)2随机样本.sav})1({lim x p np npY P n n ≤--∞→设随机变量服从参数n, p (0<p <1)的二项分布,则对任意x ,有n Y dte xt ⎰∞--=2221π定理表明,当n 很大,0<p <1是一个定值时(或者说,np (1-p )也不太小时),二项变量的分布近似正态分布N (np ,np (1-p )).n Y 定理(棣莫佛-拉普拉斯定理)请看演示中心极限定理的直观演示例1 根据以往经验,某种电器元件的寿命服从均值为100小时的指数分布. 现随机地取16只,设它们的寿命是相互独立的. 求这16只元件的寿命的总和大于1920小时的概率.由题给条件知,诸X i 独立,16只元件的寿命的总和为∑==161k kX Y 解: 设第i 只元件的寿命为X i , i =1,2, …,16E (X i )=100, D (X i )=10000依题意,所求为P (Y >1920)由于E (Y )=1600,D (Y )=160000由中心极限定理,近似N (0,1)4001600-Y P (Y >1920)=1-P (Y ≤1920)).(801Φ-≈=1-0.7881=0.2119⎪⎭⎫ ⎝⎛-≤--=4001600192040016001Y P ⎪⎭⎫ ⎝⎛≤--=8040016001.Y P例2. (供电问题)某车间有200台车床,在生产期间由于需要检修、调换刀具、变换位置及调换工件等常需停车. 设开工率为0.6, 并设每台车床的工作是独立的,且在开工时需电力1千瓦.问应供应多少瓦电力就能以99.9%的概率保证该车间不会因供电不足而影响生产?设需要x千瓦电力.由题意得:()999≤0.P≥Xx用X 表示在某时刻工作着的车床数,解:对每台车床的观察作为一次试验,每次试验观察该台车床在某时刻是否工作,工作的概率为0.6,共进行200次试验.依题意,X ~B (200,0.6),现在的问题是:P (X ≤x )≥0.999的最小的x .求满足设需x 千瓦电力,(由于每台车床在开工时需电力1千瓦,x 台工作所需电力即x 千瓦.)由德莫佛-拉普拉斯极限定理)1(p np np X --近似N (0,1),于是P (X ≤x )= P (0≤X ≤x )这里np =120, np (1-p )=48)()x (4812048120---≈ΦΦ)x (48120-≈Φ查正态分布函数表得由≥0.999,)x (48120-Φ从中解得x ≥141.5,即所求x =142.(千瓦)也就是说, 应供应142 千瓦电力就能以99.9%的概率保证该车间不会因供电不足而影响生产.999.0)1.3(=Φ48120-x ≥3.1,故例3在一个罐子中,装有10个编号为0-9的同样的球,从罐中有放回地抽取若干次,每次抽一个,并记下号码.问对序列{X k },能否应用大数定律?诸X k 独立同分布,且期望存在,故能使用大数定律.解: ,9.01.001~⎭⎬⎫⎩⎨⎧k X k =1,2, …E (X k )=0.1,⎩⎨⎧=否则次取到号码第001k X k (1) 设,k =1,2, …∑=∞→=<-nk k n X n P 11}|1.01{|lim ε即对任意的ε>0,解: ,9.01.001~⎭⎬⎫⎩⎨⎧k X k =1,2, …E (X k )=0.1,诸X k 独立同分布,且期望存在,故能使用大数定律.(2) 至少应取球多少次才能使“0”出现的频率在0.09-0.11之间的概率至少是0.95?解:设应取球n 次,0出现频率为∑=n k k X n 11,n .)X (E n k k 101=∑=n.)X (D nk k 0901=∑=由题可知:95011010901.}.X n .{P n k k ≥≤≤∑=由中心极限定理近似N (0,1)n nX nk k 3.01.01-∑=n X n n k k 3.01.011-=∑=}11.0109.0{1≤≤∑=nk k X n P 1)30(2-≈n Φn X n nk k 3.01.011-∑=近似N (0,1)}n /...n /..X n n /...{P n k k 30101103010130100901-≤-≤-=∑=}n n /..X n n {P n k k 3030101301≤-≤-=∑=95.01)30(2≥-n Φ欲使975.0)30(≥n Φ即96.130≥n查表得从中解得3458≥n 即至少应取球3458次才能使“0”出现的频率在0.09-0.11之间的概率至少是0.95.(3) 用中心极限定理计算在100次抽取中,数码“0”出现次数在7和13之间的概率.解:在100次抽取中, 数码“0”出现次数为∑=1001k kX 3101001-∑=k kX即近似N (0,1)由题:所求概率为:∑=≤≤1001)137(k k X P =⎪⎪⎭⎫⎝⎛∑=1001k k X E 1010100=⨯.=⎪⎪⎭⎫⎝⎛∑=1001k k X D 9090100=⨯.即在100次抽取中,数码“0”出现次数在7和13之间的概率为0.6826.∑=≤≤1001)137(k kXP =0.68263101001-∑=k kX近似N (0,1))13101(1001≤-≤-=∑=k kXP )1()1(-Φ-Φ≈1)1(2-Φ=请看演示戏院设座问题作业:1.预习§7.1-§7.32.练习P116 10 14 153.思考题:A 组:如果X 是连续型随机变量.证明:2{|()|}DXP X E X εε-≥≤B 组:写出大数定理与中心极限定理的内容并说明其含义如果X 是连续型随机变量.=≥-}|)X (E X {|P ε()dx x |)X (E x |⎰≥-εϕ()()dx x )X (E x |)X (E x |⎰≥--≤εϕε22()()⎰∞+∞--≤dx x )X (E x ϕε222εDX=。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一节
大数定律
一、大数定律的客观背景 二、几个常见的大数定律 三、大数定律的应用 四、小结
一、大数定律的客观背景
“概率”的概念是如何产生的
设n次独立重复试验中事件 A发生的
次数为 nA,则当 n 时,有
nA Xn p n 随机变量
n重伯努利试验
频率 怎样理解“越来越接近”? 概率 P( A)
2
令n , 且概率不能大于 1,有 1 n lim P{| Yn | } lim P{| X k | } 1 n n n k 1
ቤተ መጻሕፍቲ ባይዱ
定义 设Y1 ,Y2 ,…,Yn ,…是一个随机变量序列, a 是一
个常数。若对于任意正数 ,有 lim P{| Yn a | } 1
例: 设计算机屏幕上有一矩形区域G(不妨设G的面
积为1),现用鼠标在G的内部任画一封闭曲线L, 求L 围成 的内部图形D的面积
G
L D
用计算机产生一串相互独 立、均服从G 上均匀分布的随机变 量(随机点)
( X 1 , Y1 ), ( X 2 , Y2 ), , ( X n , Yn ) 记事件 A {产生的随机点落入D 中} nA ( X 1 , Y1 ), ( X 2 , Y2 ), , ( X n , Yn ) 落入 D 中个数
n
0.5069 0.5181 0.5016 0.5005 0.4923
二、几个常见的大数定理
随机变量 X 1 , X 2 ,, X n ,相互独立, 是指对任意
n 1, X 1 , X 2 ,, X n 都相互独立.
定理1 切比雪夫(Chebyshev)定理的特殊情况
设随机变量 X 1 , X 2 ,…, X n 相互独立,且具有相同的数学 期望和方差, E ( X k ) , D( X k ) 2 ,( k 1,2,) ,做前 n个
( A) Pa b
(C ) P a a
( B) Pa E b
√
( D) P E b a
辛钦(ХИНЧИН 1894 1959 )苏联数 学家和数学教育家,现代概率论的奠基者之 一. 辛钦 1894 年 7 月 19 日生于莫斯科康德罗 沃, 1959 年 11 月 18 日逝世于莫斯科 .1916 年 毕业于莫斯科大学,先後在莫斯科大学和苏 联科学院斯捷克洛夫数学研究所等处工 作.1927年成为教授.1935年获得物理数学博 士学位.1939年被选为苏联科学院通讯院士. 辛钦在分析学、数论、概率论及对统计 学力学的应用等方面有重要贡献.
1 n Xk 序列 Yn n k 1
依概率收敛于 ,即
1 n P Yn X k n k 1
定理2(伯努利大数定理)
设 nA 是 n次独立重复试验中事件 A 发生的次数, p 是事件 A在每次试验中发生的概率,则对于任意 0 , 有 或
nA lim P{| p | } 1 n n nA lim P{| p | } 0 n n
说明 (1)定理表明 当重复试验次数 n 充分大时,
事件 A 发生的频率 nA / n 收敛于事件 A 发生的概率
p. 定理以严格的数学形式表 达了频率的稳定性.在
便可以用事件发生 实际应用中, 当试验次数很大时,
的频率来近似代替事件的概率.
( 2)
如果事件 A 的概率很小, 则由伯努利大数定理知事 件 A 发生的频率也是很小的, 或者说事件 A 很少发 这一原理称为小概率原理. 它的实际应用很广泛, 但 在 应注意到, 小概率事件与不可能事件是有区别的, 多次试验中,小概率事件也可能发生.
Xn p 怎样定义极限 lim n “频率稳定性”的严格数学描述是什么
“抛硬币”试验 ,记
A { 正面朝上} nA A次试验中 A 发生的次数 nA 则 A 发生的频率为 X n n 1,2, n
蒲丰(1707-1788) 法国数学家、自然哲学家
n nA 实验者 4048 2048 蒲 丰 2048 1061 德 · 摩根 12000 6019 皮尔逊 24000 12012 皮尔逊 39699 罗曼诺夫斯基 80640 频率稳定性:X n 0.5n
证明 因为 nA ~ b(n, p), 所以
nA X 1 X 2 X n ,
其中 X 1 , X 2 ,, X n 相互独立, 且都服从以 p 为参数 的 0 1 分布, 因而
E ( X i ) p, D( X i ) p(1 p), i 1,2,, n n nA 由定理2即证得 (*) 1 式. 注意到 X i , n i 1 n
第五章 大数定律及中心 极限定理
概述
概率论与数理统计是研究随机现象统计规律性 的学科. 随机现象的规律性只有在相同的条件下进 行大量重复试验时才会呈现出来. 也就是说,要从 随机现象中去寻求必然的法则,应该研究大量随机 现象.研究大量的随机现象,常常采用极限形式,由 此导致对极限定理进行研究. 极限定理的内容很广 泛,其中最重要的有两种: 大数定律与中心极限定理
G
L
由伯努利大数定律有 D nA P D 的面积 | D | P ( A ) n G 的面积
nA 故当 n充分大时, D的面积 | D | n .
在概率论发展初期,由于概率的数学定义尚未明 确,所以缺乏理解概率收敛的理论基础,故把频率“趋 于”概率视为经大量试验而得到的结果,就象物理学 中的定律一样. 在概率论的公理化体系建立以后,大数定律可在 为什么叫”大数定律” 理论上进行严格的证明而成为意义明确的定理,故现 而不叫“大数定理” 在教材上称为“大数定理”.
nA P 1 抛硬币试验的频率稳定性 X n n 2
1
1 2
nA n
1 /2 1 2
O
n
k
由此得到定理1的另一种叙述:
定理1 设随机变量 X 1 , X 2 ,…, X n 相互独立 , 且具
有 相 同 的 数 学 期 望 和 方 差 ,
E ( X k ) , D( X k ) 2 , ( k 1,2,) , 则随机变量
生, 即“概率很小的事件在个别试验中几乎不会发生”
定理3(辛钦定理)
人物介绍 辛钦
设随机变量 X 1 , X 2 ,…, X n 相互独立,服从同一分 布, 且具有相同的数学期望 E ( X k ) ( k 1,2,) , 则对于任意 0 ,有
1 n lim P{| X k | } 1 n n k 1
切 比 雪 夫 , П . Л . ( Чебb Iшев , ПaфHутий Лbвович) 1821年5月16日生于 俄国卡卢加; 1894年12月8日逝世于彼得堡.
切比雪夫出身于贵族家庭,他母亲也出 身名门,切比雪夫的左脚生来有残疾,切比 雪夫终身未娶,日常生活十分简朴,他的一 点积蓄全部用来买书和制造机器。 1894 年 11 月底,他的腿疾突然加重,随后思维也出现 了障碍,同年12月 8日上午 9时逝世于自己的 书桌前。
n
a 则称Y1 ,Y2 ,…,Yn ,…依概率收敛于 a ,记为Yn
P
.
说明
n
lim P{| X n X | } 0
P
n
lim P{| X n X | } 1
X n X的直观含义:随着 n的 增 大 ,
绝对误差 X n X 较大的可能性越来越小 。
1 n 随机变量的算术平均Yn X k ,则对于任意正数 ,有 n k 1 lim P{| Yn | }
n
1 n lim P{| X k | } 1 n n k 1
说明
(1)此定理也称为切比雪夫大数定理;
(2) 在所给的条件下,当n充分大时, n个随机变量的算术平均值与它们的数学期望 有较小的偏差的可能性比较大。可以考虑用算 术平均值作为所研究指标值的近似值。
1837 年,年方 16 岁的切比雪夫进入莫斯 科大学,成为哲学系下属的物理数学专业的 学生。大学毕业之后,切比雪夫一面在莫斯 科大学当助教,一面攻读硕士学位。 1853 年, 切比雪夫被选为彼得堡科学院候补院士,同 时兼任应用数学部主席. 1856年成为副院士。 1859年成为院士. 切比雪夫是彼得堡数学学派的奠基人和 当之无愧的领袖. 他在概率论、解析数论和函 数逼近论领域的开创性工作从根本上改变了 法国、德国等传统数学大国的数学家们对俄 国数学的看法,使得俄国步入世界数学强国 之列.
说明 伯努利大数定理是辛钦定理的特殊情况。 n个随机变量的算术平均值以概率收敛于算术平 均值的数学期望。
给出了“频率稳定性”的严格数学解释. 提供了通过试验来确定事件概率的方法. 是数理统计中参数估计的重要理论依据之一.
是Monte Carlo 方法的主要数学理论基础.
三、大数定律的应用
Monte Carlo方法或称为计算机随机模拟方法、 计算机仿真方法是科学与工程中的一种重要工具. Monte Carlo 方法的原理主要基于大数定律.
四
小结
1、切比雪夫(Chebyshev)定理的特殊情况 用算术平均值作为所研究指标值的近似值。
2. 伯努利定理 事件发生的频率依概率收敛于事件的概率 3. 辛钦定理 n个随机变量的算术平均值以概率收敛于 算术平均值的数学期望。
课 堂 练 习
已知随机变量 的期望 E 与期望 D , 分布未知, 则对于任何实数 a, ba b都可以估计出概率( )
切比雪夫不等式
n n 1 1 1 证明: E[ n X ] E ( X ) k n n k 1 k n k 1 n 2 1 1 2 1 n D ( X k ) 2 n 2 D[ X k ] n n n k 1 n