(完整版)大数定律和中心极限定理
中心极限定理和大数定律
中心极限定理和大数定律中心极限定理和大数定律是统计学中非常重要的两个概念。
它们在统计学中被广泛应用,对于理解随机事件的规律性和分析数据具有重要意义。
本文将对中心极限定理和大数定律进行详细的阐述。
一、中心极限定理1. 定义中心极限定理是指当样本量足够大时,样本均值的分布近似于正态分布。
也就是说,如果我们从总体中抽取足够多的样本,并计算每个样本的平均值,那么这些平均值将近似于正态分布。
2. 原理中心极限定理的原理可以用数学公式表示为:当n趋向于无穷大时,样本均值(Xbar)服从正态分布N(μ,σ^2/n)。
其中,μ代表总体均值,σ代表总体标准差。
3. 应用中心极限定理在实际应用中非常广泛。
例如,在质量控制过程中,我们可以通过抽取一小部分产品进行检测,并根据检测结果推断整个批次产品的质量状况。
而根据中心极限定理,我们可以通过抽取足够多的样本并计算样本均值,来推断总体均值和标准差,从而判断整个批次产品的质量是否符合要求。
二、大数定律1. 定义大数定律是指当样本量足够大时,样本平均值趋近于总体平均值。
也就是说,如果我们从总体中抽取足够多的样本,并计算每个样本的平均值,那么这些平均值将趋近于总体的平均值。
2. 原理大数定律的原理可以用数学公式表示为:当n趋向于无穷大时,样本均值(Xbar)趋近于总体均值(μ)。
3. 应用大数定律在实际应用中也非常广泛。
例如,在股票市场中,我们可以通过抽取一小部分股票进行分析,并根据分析结果预测整个市场的走势。
而根据大数定律,我们可以通过抽取足够多的股票并计算它们的收益率,来推断整个市场的平均收益率和风险水平。
三、中心极限定理和大数定律之间的关系1. 相似性中心极限定理和大数定律都是关于样本均值的定理,它们都是基于样本量足够大的前提条件下成立的。
2. 区别中心极限定理和大数定律的主要区别在于它们所描述的内容不同。
中心极限定理描述了样本均值的分布情况,而大数定律描述了样本均值与总体均值之间的关系。
大数定律和中心极限定理
大数定律和中心极限定理1 大数定律这里强调的是总体与样本大数定律就是说:当随机事件发生的次数足够多时,发生的频率趋近于预期的概率大数定律说的是当随机事件重复多次时频率的稳定性,随着试验次数的增加,事件发生的频率趋近于预期的“概率”2 赌徒缪误:1,2,4,8-----在赌钱时——输了就翻倍,一直到赢为止有人说:如果已经连续4次出现正面,接下来的第5次还是正面的话,就接连有5次“正面”,根据概率论,连抛5次正面的几率是1/25=1/32。
所以,第5次正面的机会只有1/32,而不是1/2。
以上混淆了“在硬币第1次抛出之前,预测接连抛5次均为正的概率”和“抛了4次正之后,第5次为正的概率”,既(11111)---- 1/32,(1111)1 ---- 1/2。
3 中心极限定理3.1 大数定律和中心极限定理的关系:上面通过赌徒谬误介绍了概率论中的大数定律。
大数定律说的是当随机事件重复多次时频率的稳定性,随着试验次数的增加,事件发生的频率趋近于预期的“概率”。
但大数定律并未涉及概率之分布问题。
此外大数定律说明了在一定条件下,当系统的个体足够多时,系统的算数平均值会集中在期望位置。
从这个角度,中心极限定理包含了大数定律。
因为中心极限定理在于揭示系统在期望附近的统计性质,即“以何种方式”集中在期望。
总的来说就是——大数定律反映的是频率->概率(或者认为广义的期望);而中心极限定理反映的是——在整体结果下,结果内部发生各种情况下的一个概率分布情况。
3.2 那什么是中心极限定理?中心极限定理指的是分别适用于不同条件的一组定理,但基本可以用一句通俗的话来概括它们:大量相互独立的随机变量,其求和后的平均值以正态分布(即钟形曲线)为极限。
Eg:以二项分布为例进行解释(抛硬币)对于抛n次硬币,出现正面k次的一个分布情况,如下:但是对于二项分布不一定是对对称的,除了受抛的次数n影响,还受对应的概率p的影响3.3 晋级再后来,中心极限定理的条件逐渐从二项分布推广到独立同分布随机序列,以及不同分布的随机序列。
第五章大数定律及中心极限定理
k 1
其中 X1, X2 ,, Xn是相互独立的、服从同一
均值为μ,方差为σ2>0的独立同分布的随机变量
n
X1,X2,…,Xn之和 X k 的标准化变量,当n充分
大时,有
k 1
n
k 1
Xk
nm
~近似N(0,1)
ns
n
这样可以用(标准)正态分布来对 X k 作
k 1
理论分析或实际计算,不必求分布函数
19/41
§5.2 中心极限定理
将上式改写为
即对任意的正数ε,当n充分
lim P n
1 n
n k 1
Xk
m
1.
大时,不等式 立的概率很大
|
X
m | 成
3/41
证 由随机变量X1,X2,…,Xn,…相互独立,且具有 相同的数学期望和方差,有
E
1 n
n k 1
Xk
lim
n
P
1 n
(X1
X2
Xn)
p
1,
即
lim
n
P
nA n
p
1.
伯努利大数定理表明,事件发生的频率nA/n依概率收敛
于事件的概率p,以严格的数学形式表达了频率的稳定性和概
率的合理性
近似:当n很大时,事件发生的频率nA/n与概率有较大偏差的 可能性很小,因此由实际推断原理,由于小概率事件几乎不
辛钦定 理
X P m
第10次课大数定律及中心极限定理
定义
Y 是一个随机变量序列, 设Y1,Y2 ,L n ,L是一个随机变量序列,a是
一个常数.若对于任意正数ε,有
lim P{| Yn − a |< ε} =1
n→∞
则称序列Y1,Y2 ,L n ,L依概率收敛于a.记为 Y Yn →a.
P
P P 性质 设Xn →a,Yn →b, 又设函数 ( x, y)在 g
( 连续, 点 a, b)连续,则g( Xn ,Yn ) →g(a, b).
P
注意 :
{ Xn} 依概率收敛于a,意味着对任意给定的ε > 0,
当n充分大时,事件 Xn − a < ε的概率很大,接近于 ; 1 并不排除事件 Xn − a ≥ ε的发生,而只是说它发生的 可能性很小 .
依概率收敛比高等数学中的普通意义下的收敛 弱些,它具有某种不确定性 .
n 近似地 n
很大时, 数。但当n很大时,可用正态分布来近似求解。 但当 很大时 可用正态分布来近似求解。
k=1
定理2(李雅普诺夫定理) 定理 (李雅普诺夫定理)
相互独立, 设随机变量X1, X2 ,L, Xn L相互独立,它们具 有数学期望和方差: 有数学期望和方差: E( Xk ) = µk , D( Xk ) = σk ,(k = 1,2,L )
或
nA lim P{| − p |< ε } = 1 n→∞ n nA lim P{| − p |≥ ε } = 0 n→∞ n
证明 因 nA ~ b(n, p), 此 表 为 为 由 可 示
nA = X1 + X2 +L+ Xn
其中X1, X2 ,L, Xn相互独立,且都服从 以p为参数的(0 −1)分布。因而E( Xk ) = p,
第四章 大数定律和中心极限定理
设需N台车床工作, 现在的问题是:
求满足
P(X≤N)≥0.999
的最小的N.
(由于每台车床在开工时需电力1千瓦,N台 工作所需电力即N千瓦.)
由德莫佛-拉普拉斯极限定理
X np 近似N(0,1), np(1 p)
于是 P(X≤N)= P(0≤X≤N)
这里 np=120, np(1-p)=48
第四章
大数定律和中心极限定理
§1 大数定率
一. 切比雪夫不等式 若r.v.X的期望和方差存在,则对任意0,
有
D( X ) P{| X E( X ) | } ; 2
这就是著名的切比雪夫(Chebyshev)不等式。 它有以下等价的形式:
P{| X E( X ) | } 1 D( X ) . 2
P{Y 60000 0.9 }
P{Y>60000}=P{1000012-aX>60000}
=P{X60000/a}0.9; 由中心极限定理,上式等价于
60000 10000 0.006 ( a ) 0.9 10000 0.006 0.994
a 3017
例3 根据以往经验,某种电器元件的寿命服从均值为 100小时的指数分布. 现随机地取16只,设它们的寿 命是相互独立的. 求这16只元件的寿命的总和大于 1920小时的概率. 解: 设第i只元件的寿命为Xi , i=1,2, …,16
7 500 100 100 2 P{ X i 500} 1 35 1 (8.78) 0 i 1 10 12
2.德莫佛-拉普拉斯中心极限定理(De MoivreLaplace)
设随机变量n(n=1, 2, ...)服从参数为n, p(0<p<1) 的二项分布,则
第五章大数定律与中心极限定理
Note:1.X1+X2+…Xn~N(nu, na2)
2.和的期望等于期望之和;和的方方差等于方方差的和(独立立,同分布)
2.拉普拉斯中心心极限定理理
1.条件:服从二二项分布,结论
2.实际上是林林德伯格的中心心极限定理理的特殊情况
定义:Xn依概率收敛于a(概率上收敛,但概率推不不出事件)(类似于极限的定义)
2.切比比雪夫大大数定律律
1.条件:相ห้องสมุดไป่ตู้独立立,期望,方方差均存在,方方差有上界
2.结论:1/n(Xi)依概率收敛于1/n(EXi)(依概率收敛于期望)
3.特别的,若独立立,同分布,有EX,DX(存在)
Note:和的期望等于期望之和;和的方方差等于方方差的和(独立立)
第五章 大大数定律律与中心心极限定理理
一一 切比比雪夫不不等式 二二 大大数定律律 三 中心心极限定理理
一一 切比比雪夫不不等式(作估计)
1.公式形式(大大小小)
2.意义:EX很有用用,偏离的越多,概率越小小
3.有上限的,最多
4.“由切比比雪夫不不等式”才能用用
二二 大大数定律律
1.依概率收敛
3.辛辛钦大大数定律律
1.条件:独立立,同分布,期望存在等于u(3个)
2.结论:1/n(Xk)依概率收敛于u
4.伯努利利大大数定律律
1.条件:X为n重伯努利利发生生的次数,发生生概率为p
2.X/n依概率收敛于p
三 中心心极限大大数定律律
1.列列维——林林德伯格中心心极限定理理
1.条件:独立立,同分布,期望,方方差存在
1-5大数定律与中心极限定理
n
å Xi - np
lim P{ i=1
£ x} =
x
ò n®¥ np(1- p)
-¥
. 1
-
e
x2 2
dx
=
F(x)
2p
定理表明,有关二项分布的计算,当 n 很大时,
可以通过关于 F(x) 的计算来解决.另外,当 n
很大时,二项分布可以用正态分布来近似.
3. 林德伯格中心极限定理
lim
n®¥
P{
X
n
-m
< e}=1.
这一结论,称为样本均值的稳定性定理,它使算
ห้องสมุดไป่ตู้
术平均法则有了理论依据。对一个随机变量 X 进行
次 n 次重复独立观测,得到 n 个不完全相同的观测
值 x1, x2,L, xn ,这些结果可以看作是服从同一分布的 n 个独立随机变量 X1, X2,L, Xn 的试验值.而当 n 充分 大时,所以观测值的算术平均接近数学期望的概率
=0
n
å 其 中
mi
=
E
(
X
i
),s
2 i
=
D( X i ),
Bn2
=
s
2 i
.则对任意实数
i =1
x ,有
å ò lim P{ 1
B n®¥ n
n
(Xi
i =1
- mi ) £ x} =
x -¥
1 2p
e
-
x2 2
dx
.
=
s
2 i
i =1
则对 x 一致地有
å ò lim P{ 1
B n®¥ n
第五章 大数定理与中心极限定理
说明
1 n 1、定理中{| X i | }是指一个随机事件, n i 1 当n 时,这个事件的概率趋于1.
2、 定理以数学形式证明了随机变量X 1 , X n 1 n 的算术平均X X i 接近数学期望E(X k) n i 1 (k 1,2, n),这种接近说明其具有的稳定性 .
第五章 大数定律与中心极限定理
第五章 大数定律与中心极限定理
§1 大数定律
1.1 切比雪夫不等式 1.2 依概率收敛 1.3 大数定律
§2 中心极限定理
HaiNan University
1
第五章 大数定律与中心极限定理
大数定律的客观背景
事件发生的频率稳定于某一常数 大量随机试验中 测量值的算术平均值具有稳定性
证明 取连续型随机变量的情况来证明.
设 X 的概率密度为 f ( x ), 则有
HaiNan University3第五章 大数定律 Nhomakorabea中心极限定理
P{ X μ ε }
2 x μ ε
x μ ε
f ( x)d x
x μ f ( x)d x 2 ε
1 1 2 2 2 ( x μ) f ( x ) d x 2 σ . ε ε
定理2 (契比雪夫大数定律)
1 nM M 1 D( X i ) 2 D( X i ) 2 . n i 1 n n n i 1 由契比雪夫不等式得: M 1 n 1 n P{ X i E ( X i ) } 1 n n i 1 n i 1 2
HaiNan University
10
第五章 大数定律与中心极限定理
1.3 大数定律
问题 : 设nA是n重贝努利试验中事件A发生 的次数,p是事件A发生的概率,
(完整word版)第五章大数定律与中心极限定理
第五章 大数定律与中心极限定理§5.1 大数定律 §5.2 中心极限定理一、填空题1.设2(),()E X D X μσ==,则由切比雪夫不等式有{||3}P X μσ-≥≤ 1/9 ; 2.设随机变量12,,,n X X X 相互独立同分布,且()i E X μ=,()8i D X =,(1,2,,)i n =, 则由切比雪夫不等式有{}||P X με-≥≤28n ε 。
并有估计{}||4P X μ-<≥ 112n-; 3.设随机变量n X X X ,,,21 相互独立且都服从参数为 的泊松分布,则 1lim n i i n X n P x n λλ=→∞⎧⎫-⎪⎪⎪≤=⎬⎪⎪⎪⎩⎭∑ ()x Φ ;4.设随机变量X 和Y 的数学期望分别为2-和3,方差分别为1和4,而相关系数为0.5-,则根据切比雪夫不等式,{||6}P X Y +≥≤;解:因为 ()()()220E X Y E X E Y +=+=-+=,cov(.)()()0.5141XY X Y D X D Y ρ==-=-, ()()()2cov(.)142(1)3D X Y D X D Y X Y +=++=++⨯-=,故由切比雪夫不等式,231{||6}{|()0|6}612P X Y P X Y +≥=+-≥≤=. 5.设随机变量12,,,n X X X 相互独立,都服从参数为2的指数分布,则n →∞时,211n n i i Y X n ==∑依概率收敛于 。
解:因为 11(),(),(1,2,,)24i i E X D X i n ===,所以 22111()()()442i i i E X D X E X =+=+=,故由辛钦大数定律,对0ε∀>,有{}2111lim ()lim 12n n n i n n i P Y E Y P X n εε→∞→∞=⎧⎫-<=-<=⎨⎬⎩⎭∑,即 211n n i i Y X n ==∑依概率收敛于21()2i E X =。
大数定律及中心极限定理
返回主目录
第五章 大数定律及中心极限定理
例1
§2 中心极限定理
某车间有200台车床,它们独立地工作着,开工 率为0.6,开工时耗电各为1千瓦,问供电所至少要 供给这个车间多少电力才能以99.9%的概率保证 这个车间不会因供电不足而影响生产. 解: 记某时在工作着的车床 数为 X, X ~ B(200,0.6). 则 设至少要供给这个车间r千瓦电才能以99.9%的概率 保证这个车间不会因供电不足而影响生产.由题 r k 意有:P{ X ≤ r} = ∑ C200 (0.6) k (0.4) 200k
1
k
∑X n
n
= p (1 p ), k = 1, 2 , , n ,
i
p |< ε } = 1 ,
第五章 大数定律及中心极限定理
§1 大数定律
定理 4(辛钦大数定律) 设 X 1 ,, X n , 相互独立同分布,且 具有 数学期望 EX k = ,k = 1,2,, n, ,
则:对任意的ε > 0 ,有
k =1 k =1 n n
∑ DX
k =1
n
k
,
若对任意 x ∈ R1 ,有 nlim P{Z n ≤ x} = >∞
1 2π
Hale Waihona Puke ∞∫ext2 2
dt .
则称 { X n } 服从中心极限定理.
返回主目录
第五章 大数定律及中心极限定理
§2 中心极限定理
定理1 (独立同分布的中心极限定理) 设 X 1 ,, X n , 是独立同分布的随机变量序 列,且 EX k = ,DX k = σ 2 ≠ 0, (k = 1,2,) 则 { X n } 服从中心极限定理,即:
第五章大数定律与中心极限定理
Xi
1 n
n i 1
E(Xi)
1,
则称{Xn}服从大数定律.
(2)伯努利大数定律是切比雪夫大数定律的特例
(3) 伯努利大数定律和切比雪夫大数定律的证明 都用到切比雪夫不等式,而且需要方差存在。
定理 5.1.4. 辛钦大数定律
设X1, X 2 ,..., X n,...是独立同分布的随机变量序列,
意义:只要试验次数够大,发生事件的频率无限接近于 概率,频率稳定性,频率代替概率。
定理 5.1.3. 切比雪夫大数定律
设X1 , X 2 ,, X n ,是一相互独立的随机变 量序列,
它们的数学期望和方差 均存在,且方差有共同 的上界,
即存在常数 K 0,使得 D ( X i ) K , i 1,2, ,
不等式给出了X 与它的期望的偏差不小于的概率
的估计式.
例 1 E( ) 4, D( ) 0.2, 则由切比雪夫不等式知
P{| 4 | 2} P{| 4 | 1}
,
P{ X
}
2 2
,
P{1 7}
定义 5.1.1设{X n}是一个随机变量序列,a是常数,
若对于任意的 0,有
已知整个系统中至少有84个部件正常工作,系统
工作才正常.试求系统正常工作的概率.
解: 记Y为100个部件中正常工作的部件数,则
Y 近似服从 N(100 0.9,100 0.9 (1 0.9))
即Y 近似服从N (90, 9)
因此,所求概率为
P{Y 84}=1-P{Y<84}=1-P{ Y-90 < 84-90 }
解: 设Xi为第i个螺丝钉的重量,i 1, 2,...,100.
且设X 为一盒螺丝钉的重量.
大数定理及中心极限定理
标准正态分布的分布函 数.
从而知当n充分大时,
n
Xk n
k
近似服从标准正态分布
N (0,1)
n
n
X k 近似服从正态分布 N (n, n 2 )
k 1
例1 一加法器同时收到20 个噪声电压Vk (k 1,2, 20), 设它们是相互独立的随机变量,
20
且都在区间(0,10) 上服从均匀分布, 记 V Vk , k 1
§4.1 大数定律
一、切比雪夫不等式 (P107)
若 r .v X 的期望和方差存在,则对任意0,
有
P{|
X
E(
X
) |
}
D( X
) ;
这就是著名的切比雪夫(Chebyshev)不等式。
它有以下等价的形式:
P{|
X
E(
X
) |
}
D(
X
)
.
二、依概率收敛
设{Xn}为随机变量序列,X为随机变量,若任给 >0, 使得
E( Xk ) p, D( Xk ) p(1 p) (k 1,2, , n),
根据定理4.6得
lim P n
n np
np(1 p)
x
lim n
P
n
Xk
k 1
np(1
np p)
x
x
1
t2
e 2 dt ( x).
2π
定理4.8表明:
正态分布是二项分布的极限分布, 当n充分大 时, 可以利用该定理来计算二项分布的概率.
D( Yn
)
n
D(
k
Xk
)
n
P {| Yn
概率论-第5章 大数定律及中心极限定理
§1 大数定律
一、问题的引入
生产过程中的 字母使用频率 废品率 启示:从实践中人们发现大量测量值的算术平均值 有稳定性.
大量抛掷硬币 正面出现频率
§1 大数定律
一、问题的引入
大数定律的概念 概率论中用来阐明大量随机现象平均结果的 稳定性的一系列定理,称为大数定律(law of large number)
§2 中心极限定理
即考虑随机变量X k (k 1, n)的和 X k的标准化变量
k 1 n
Yn
X
k 1
n
k
E ( X k )
k 1 n
n
D ( X k )
2
说明每一个随机变量都有相同的数学期望。
§1 大数定律
检验是否具有相同的有限方差?
Xn P
2
( na ) 1 2 2n
2 n
2
0 1 1 2 n
2
( na ) 1 2 2n
2
1 2 a , E ( X ) 2( na ) 2 2n 2 ) [ E ( X n )]2 a 2 . D( X n ) E ( X n
使得当 x a y b 时,
g( x , y ) g(a , b)பைடு நூலகம் ,
§1 大数定律
于是 { g( X n , Yn ) g(a, b) }
{ X n a Yn b }
X n a Yn b , 2 2
§2 中心极限定理
自从高斯指出测量误差服从正态分布之后,人 们发现,正态分布在自然界中极为常见.
如果一个随机变量是由大量相互独立的随机因 素的综合影响所造成,而每一个别因素对这种综合 影响中所起的作用不大. 则这种随机变量一般都服 从或近似服从正态分布. 现在我们就来研究独立随机变量之和所特有 的规律性问题.
大数定律和中心极限定理
1 n
,则X n
P
证明: 利用切比雪夫不等式 :
P(|
Xn
0 | )
D(Xn )
2
1
n 2
0.
9
例:在n重贝努里试验中,若已知每次试验 事件A出现的概率为0.75, 试利用切比雪夫不等式计算, (1)若n=7500,估计A出现的频率在0.74至0.76 之间的概率至少有多大; (2)估计n,使A出现的频率在0.74至0.76之 间的概率不小于0.90。
解:设在n重贝努里试验中,事件A出现的次数为X,
则X Bn,0.75,
E X np 0.75n, D X npq 0.1875n,
又
fn A
X n
(1) n 7500, P
0.74
X n
0.76
P X 0.75n 0.01n
1
0.1875n
0.01n 2
1
1875 7500
解:设X
i为第i次所倒的红酒重量(单位:ml),则X
相互独立且
i
分布相同,E(Xi ) 100, D(Xi ) 322,i 1, 2,L ,55.
根据独立同分布的中心极限定理:知
55
Xi 55100 近似
i 1
~ N 0,1,
32 55
所以
55
P{倒了55次后该瓶红酒仍有剩余} P{ Xi 6000} i 1
由德莫佛--拉普拉斯中心极限定理,知
Y
1500
1 10
近似
~ N (0,1).
1500
1 10
9 10
设教室需要设a个座位,由题意知a需要满足
a 1500 1
95% P{Y a} (
大数定律-中心极限定理
§5.1 大数定律 §5.2 中心极限定理
§5.1 大数定律
定义1 设Y1, Y2 …,Yn ,...为一随机变量序列,a是常数, 若对任意正数,有
lim
n
P{|Yn
a
|
}
1
则称随机变量序列Y1, Y2 ,…,Yn , ... 依概率收敛于a ,
记为:
Yn P a
性质:设 Xn P a, Yn P b , g(x, y)在点(a, b)连续,
n i 1
Xi
P
提醒:利用切比雪夫不等式证.
此定理表白: 相互独立具有相同期望和方差旳随机变 量X1, X2, …, Xn旳算术平均值依概率收敛于其数学期 望值 .
证
E(X)
E
1 n
n i 1
Xi
1 n
n i 1
E(X i
)
μ
D(X)
D
1 n
n i 1
X
i
1 n2
n
σ2
D(X i )
➢ 贝努力大数定律是辛钦定理旳特殊情况.
§5.2 中心极限定理
在客观实际中有许多随机变量,它们是由 大量旳相互独立旳随机原因旳综合影响所 形成旳,而其中每一种别原因在总旳影响中 起到旳作用都是微小旳.这种随机变量往往 近似旳服从正态分布.这种现象就是中心极 限定理旳客观背景.
本节只简介三个常用旳中心极限定理.
Xi= -1, 第i次碰钉后小球从右落下.
则Xi服从两点分布, E(Xi) =0, D(Xi)=1
Yn=X1+X2+…+Xn 由中心极限定理知,
Yn~N(0,n) 由正态分布旳特征知,小球落在中间 旳概率远远不小于落在两边旳概率.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章 大数定律和中心极限定理一、内容提要(一)切贝谢夫不等式 1. 切贝谢夫不等式的内容设随机变量X 具有有限的数学期望E (X )和方差D (X ),则对任何正数ε,下列不等式成立。
(){}()(){}().1,22εεεεX D X E X P X D X E X P -≤-≤≥-2. 切贝谢夫不等式的意义(1)只要知道随机变量X 的数学期望和方差(不须知道分布律),利用切贝谢夫不等式,就能够对事件(){}ε≥-X E X 的概率做出估计,这是它的最大优点,今后在理论推导及实际应用中都常用到切贝谢夫不等式。
(2)不足之处为要计算(){}ε≥-X E X P 的值时,切贝谢夫不等式就无能为力,只有知道分布密度或分布函数才能解决。
另外,利用本不等式估值时精确性也不够。
(3)当X 的方差D (X )越小时,(){}ε≥-X E X P 的值也越小,表明X 与E (X )有较大“偏差”的可能性也较小,显示出D (X )确是刻画X 与E (X )偏差程度的一个量。
(二)依概率收敛如果对于任何ε>0,事件{}ε a X n -的概率当n →∞时,趋于1,即{}1lim =-∞→ε a X P n n ,则称随机变量序列X 1,X 2,…,X n ,…当n →∞时依概率收敛于α。
(三)大数定律 1. 大数定律的内容(1)大数定律的一般提法若X 1,X 2,…,X n ,…是随机变量序列,如果存在一个常数序列α1,…,αn ,…,对任意ε>0,恒有11lim 1=⎭⎬⎫⎩⎨⎧-∑=∞→ε n i n i n a X n P , 则称序列{X n }服从大数定律(或大数法则)。
(2)切贝谢夫大数定律设随机变量X 1,X 2,…,X n ,…相互独立,分别有数学期望E(X i )和方差D(X i ),且它们的方差有公共上界C ,即()().,,,2,1, n i C X D i =≤则对于任意的ε>0,恒有()111lim 11=⎭⎬⎫⎩⎨⎧-∑∑==∞→ε n i ni i i n X E n X n P 。
(3)辛钦大数定律设X 1,X 2,…,X n ,…是一列独立同分布的随机变量,且数学期望存在:() ,2,1,==i a X E i则对于任意的ε>0,有11lim 1=⎭⎬⎫⎩⎨⎧-∑=∞→ε n i i n a X n P 。
(4)贝努里大数定律设n A 是n 次独立试验中事件A 发生的次数,p 是事件A 在每次试验中发生的概率,则对于任意的ε>0,恒有1lim =⎭⎬⎫⎩⎨⎧-∞→ε p n n P A n 。
2. 大数定律的意义(1)大数定律从理论上证明了“频率的稳定性”,对概率论的建立起了奠基作用。
(2)切贝谢夫大数定律说明经验平均值接近于理论平均值;辛钦大数定律说明随机变量的平均值接近于数学期望,这是测量中取平均值的理论依据;贝努里大数定律说明了频率具有稳定性,即频率收敛于概率,这是用频率f n (A )来估计概率p 的理论依据。
(3)把独立随机变量和的平均作为大数定律的研究对象在理论上的应用上都是重要的。
(四)中心极限定理 1. 中心极限定理的内容(1)独立同分布中心极限定理设随机变量X 1,X 2,…,X n ,…相互独立,服从同一分布,且具有有限的数学期望和方差:E (X K )=μ,D (X K )=σ2≠0,(K =1,2,…,n ,…),则随机变量σμn n XY nK Kn ∑=-=1的分布函数F n (x ),对于任意的x ,满足()⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧≤-=∑=∞→x n n X P x F n K K n n σμ1lim lim (2)德莫佛一拉普拉斯中心极限定理设随机变量() ,2,1=n n η具有参数为n ,p )10(<<p 的二项分布,则对于任意区间],(b a ,恒有()⎰-∞→=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤--b a dt tn n e b p np np a P 22211lim πη 。
2. 中心极限定理的意义(1)中心极限定理从理论上证明了“许多类型”的随机变量,它们的极限分布服从正态分布,这既肯定了正态分布在概率论中处于主导地位,又给概率计算提供了强有力有手段。
(2)中心极限定理是把独立随机变量的和作为研究对象。
(3)应用中心极限定理前的准备步骤(a )把问题归结为独立随机变量的和∑==nK KXX 1。
(b )把和“中心化”:().11∑∑==-nK K nK KX E X(c )把和再“标准化”:()().111∑∑∑===-nK KnK K nK K X D X E X对于独立同分布中心极限定理标准化后是,1σμn n XnK K∑=-对于德莫佛一拉普拉斯中心极限定理标准化后是().1p np npn --η(4)由独立同分布中心极限定理知:若X 1,X 2,…,X n ,…独立同分布,则n →∞时,随机变量X= X 1+X 2,+…+X n =∑=ni i X 1渐近地服从正态分布N (E (X ),D (X ))=N (n μ,n σ2),或()()σμn n X X D X E X -=-渐近地服从标准正态分布N (0,1)。
由德莫佛一拉普拉斯中心极限定理知,若随机变量X ~B (n ,p ),则当n 充分大时,npqnp X -就近似服从标准正态分布N (0,1)。
记为()1,0~.N npqnp X da - 从而得当n 较大时,二项分布的近似计算公式{}.⎪⎪⎭⎫⎝⎛--⎪⎪⎭⎫⎝⎛-Φ=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧-≤--=≤npq np a npq np b npq np b npq np X npq np a P b X a P二、要 求1. 掌握切贝谢夫不等式,会用切贝谢夫不等式估计(){}ε X E X P -、(){}.ε≥-X E X P2. 了解大数定理的内容和意义。
3. 掌握中心极限定理的内容,会做一些简单应用题。
三、例题分析例1 在每次试验中,事件A 发生的概率为0.5,利用切贝谢夫不等式估计在1000次独立试验中,事件A 发生的次数在400~600之间的概率。
分析 利用切贝谢夫不等式估计某事件的概率,需作如下准备:(1)恰当地选择随机变量X ;(2)求出E (X ),D (X );(3)依题意确定ε。
在此基础上可利用切贝谢夫不等式进行估计。
解 设X 表示在1000次独立试验中,事件A 发生的次数,则X ~B (1000,0.5),且E (X )=np =500,D (X )=npq =250.于是{}{}{},100100100500100600400 -=--=X P X P X P在切贝谢夫不等式中,取ε=100,则有{}(){}().403910000250110011006004002=-=-≥-=X D X E X P X P 即在1000次独立试验中,事件A 发生的次数在400~600之间的概率在4039以上。
例2 利用切贝谢夫不等式估计随机变量与其数学期望差的绝对值大于三倍均方差的概率。
分析 依题意,要估计()(){}X D X E X P 3≥-只需在切贝谢夫不等式中取()X D 3=ε即可。
解 设随机变量X 的期望为E (X ),方差为D (X ),在切贝谢夫不等式中,取()X D 3=ε,则有()(){}()()9193=≤≥-X D X D X D X E X P 。
评注 由例1、例2可以看出:利用切贝谢夫不等式可以对随机变量的分布做出估计,即对于任意的ε,可以估计出(){}(){}εε≥--X E X P X E X P , 。
当然这种估计还是非常粗略的,如X ~N (μ,σ2),则{}%3.03 σμ≥-X P 。
而利用切贝谢夫不等式进行估计,则{}913≤≥-σμX P 。
切贝谢夫不等式更重要的价值在于对理论研究的贡献,大数定律的理论证明是其中之一。
例3 设X 为连续型随机变量,p (x )为分布密度,如果E |X |K (K 为正整数)存在,则对于任意的ε>0,有{}KKXE X P εε≤≥证明{}()()()().11KKKKx KKKx x XE dx x p x dx x p xdx x p xdx x p X P εεεεεεεε=≤=⎪⎪⎭⎫⎝⎛≤=≥⎰⎰⎰⎰∞+∞-≥≥≥说明 切贝谢夫不等式的证明方法是很有特色的,同样在本题的证明过程中两次加强了不等式,其一是利用在积分区间1≥≥KK x,x εε上。
其二是利用被积函数非负扩大积分区间(由部分区间扩大到整个数轴上)。
例4 计算机进行加法计算时,把每个加数取为最接近它的整数来计算。
设所有的“加数”取整数的误差是相互独立的随机变量且都在[-0.5,0.5]上均匀分布。
若将1200个数相加,求误差总和的绝对值小于15的概率。
分析 以随机变量X 表示误差总和,X K 表示各个加数取整数的误差(K =1,2,…,1200),则∑==12001K K X X 。
由于X 1,X 2,…X 1200相互独立且服从同一分布,由中心极限定理得X 近似地服从正态分布,从而可计算出{}15 X P 。
解 以随机变量X 表示误差总和,X K (K =1,2,…,1200)表示各个加数取整的误差,则.12001∑==K K X X由题意知X 1,X 2,…X 1200相互独立都在[-0.5,0.5]上服从均匀分布,因此()()()()()()()().100,0,1200,2,1,121125.05.0,025.05.0120011200112001120012==⎪⎭⎫ ⎝⎛===⎪⎭⎫ ⎝⎛===+==+-=∑∑∑∑====K K K K K K K K K K X D X D X D X D X E X E K X D X E由中心极限定理知()()101000XX X D X E X =-=-近似地服从标准正态分布。
所以 {}{}151515 X P X P -=()().8664.05.15.11015101015=-Φ-Φ≈⎭⎬⎫⎩⎨⎧-= X P 例5 现存有一批种子,其中良种占61,今取6000粒种子,试以0.99的概率推断,在这6000粒种子中良种所占的比例与61的差是多少?相应的良种在哪个范围? 分析 以随机变量X 表示在6000粒种子中良种的个数,则⎪⎭⎫ ⎝⎛61,6000~B X 。
由于n =6000较大,由德莫佛一拉普拉斯定理知6510001000⨯-=-X npqnp X 近似地服从N (0,1)。
依题意,就是要确定ε>0,使.99.0616000=⎭⎬⎫⎩⎨⎧-ε X P解 以随机变量X 表示6000粒种子中的良种粒数,则⎪⎭⎫ ⎝⎛61,6000~B X 。