(完整版)大数定律及中心极限定理
第五章大数定律及中心极限定理
解 E(Vk)=5, D(Vk)=100/12 (k=1,2,…,20).
20
Vk 20 5
Z k1
V 20 5
100/ 12 20 100/ 12 20
近似服从正态分布N(0,1),
P{V 105} P{ V 20 5 105 20 5 }
100/ 12 20 100/ 12 20
设随机变量 X1 , X2 ,…, X n 相互独立, 服从同一分
布 , 且 具 有 相 同 的 数 学 期 望 和 方 差 , E(Xk) ,
D( Xk ) 2 0,(k 1,2,),则随机变量
n
n
n
Xk E( Xk ) Xk n
Yk k1
k 1 n
D( Xk )
k1
n
k 1
n k 1
Xk
|
}
1
说明
伯努利大数定理是辛钦定理的特殊情况。
n个随机变量的算术平均值以概率收敛于算术平
均值的数学期望。
三 小结
1、切比雪夫(Chebyshev)定理的特殊情况 用算术平均值作为所研究指标值的近似值。
2. 伯努利定理 事件发生的频率依概率收敛于事件的概率
3. 辛钦定理 n个随机变量的算术平均值以概率收敛于算术 平均值的数学期望。
(2.5) 0.9938
三 小结
1、独立同分布的中心极限定理
2.李雅普诺夫定理
3.棣莫佛-拉普拉斯定理
n
n
n
n
Xk E( Xk ) Xk k
Zn k1
k 1 n
D( Xk )
k1
k 1
Bn
k 1
近似服从标准正态分布N(0,1)。
中心极限定理和大数定律
中心极限定理和大数定律中心极限定理和大数定律是统计学中非常重要的两个概念。
它们在统计学中被广泛应用,对于理解随机事件的规律性和分析数据具有重要意义。
本文将对中心极限定理和大数定律进行详细的阐述。
一、中心极限定理1. 定义中心极限定理是指当样本量足够大时,样本均值的分布近似于正态分布。
也就是说,如果我们从总体中抽取足够多的样本,并计算每个样本的平均值,那么这些平均值将近似于正态分布。
2. 原理中心极限定理的原理可以用数学公式表示为:当n趋向于无穷大时,样本均值(Xbar)服从正态分布N(μ,σ^2/n)。
其中,μ代表总体均值,σ代表总体标准差。
3. 应用中心极限定理在实际应用中非常广泛。
例如,在质量控制过程中,我们可以通过抽取一小部分产品进行检测,并根据检测结果推断整个批次产品的质量状况。
而根据中心极限定理,我们可以通过抽取足够多的样本并计算样本均值,来推断总体均值和标准差,从而判断整个批次产品的质量是否符合要求。
二、大数定律1. 定义大数定律是指当样本量足够大时,样本平均值趋近于总体平均值。
也就是说,如果我们从总体中抽取足够多的样本,并计算每个样本的平均值,那么这些平均值将趋近于总体的平均值。
2. 原理大数定律的原理可以用数学公式表示为:当n趋向于无穷大时,样本均值(Xbar)趋近于总体均值(μ)。
3. 应用大数定律在实际应用中也非常广泛。
例如,在股票市场中,我们可以通过抽取一小部分股票进行分析,并根据分析结果预测整个市场的走势。
而根据大数定律,我们可以通过抽取足够多的股票并计算它们的收益率,来推断整个市场的平均收益率和风险水平。
三、中心极限定理和大数定律之间的关系1. 相似性中心极限定理和大数定律都是关于样本均值的定理,它们都是基于样本量足够大的前提条件下成立的。
2. 区别中心极限定理和大数定律的主要区别在于它们所描述的内容不同。
中心极限定理描述了样本均值的分布情况,而大数定律描述了样本均值与总体均值之间的关系。
大数定律与中心极限定理
的方差存在,且有共同的上界,即
Var( Xi ) c,i 1,2,
则 {Xn} 服从大数定律,即对任意的 0
lim
n
P
1
n i 1
Xi
1 n
n i 1
E( Xi )
1
成立.
定理3 (辛软大数定律)设 X1, X 2,X n , 为一列相互独立且相同分布的随机变量,若
Xi (i 1,2,) 的数学期望存在,则 {X n} 服从大数
例5.2.2 某工厂有 200 台同类型的机器,每台
机器工作时需要 50 kW 的电力。由于功率的原 因,每台机器的开工率为 0.75 ,各台机器是否 工作是相互独立的.问
(1)在任一时刻,恰有 144 至 160 台机器正在 工作的概率为多少?
(2)在任一时刻,需要至少供应多少电力才能 保证“因电力不足而使一些机器停工”的概率小于 0.01?
概率论与数理统计
二、中心极限定理
定理5.2.1 (独立同分布的中心极限定理) 设随机
变量序列 X1, X 2,X n , ,相互独立且服从同一 分布,它们具有相同的数学期望和方差
E Xi Var( X i ) 2 0
n
其中 i = 1,2,3,…, 则前 n 个随机变量之和 Xi 的标 i 1
准化变量
lim P Yn np x Φ(x) n np(1 p)
其中 (x) 为标准正态分布的分布函数.
例3 一个加法器可同时收到 20 个噪声电压 Vk
k 1,2,,20,设它们是相互独立的随机变量,
且都在 0,10 上服从均匀分布,记
20
V Vk k 1
求 P{V 105} 的近似值。
练习 一食品店有三种蛋糕出售,由于售出哪
大数定律和中心极限定理
大数定律和中心极限定理1 大数定律这里强调的是总体与样本大数定律就是说:当随机事件发生的次数足够多时,发生的频率趋近于预期的概率大数定律说的是当随机事件重复多次时频率的稳定性,随着试验次数的增加,事件发生的频率趋近于预期的“概率”2 赌徒缪误:1,2,4,8-----在赌钱时——输了就翻倍,一直到赢为止有人说:如果已经连续4次出现正面,接下来的第5次还是正面的话,就接连有5次“正面”,根据概率论,连抛5次正面的几率是1/25=1/32。
所以,第5次正面的机会只有1/32,而不是1/2。
以上混淆了“在硬币第1次抛出之前,预测接连抛5次均为正的概率”和“抛了4次正之后,第5次为正的概率”,既(11111)---- 1/32,(1111)1 ---- 1/2。
3 中心极限定理3.1 大数定律和中心极限定理的关系:上面通过赌徒谬误介绍了概率论中的大数定律。
大数定律说的是当随机事件重复多次时频率的稳定性,随着试验次数的增加,事件发生的频率趋近于预期的“概率”。
但大数定律并未涉及概率之分布问题。
此外大数定律说明了在一定条件下,当系统的个体足够多时,系统的算数平均值会集中在期望位置。
从这个角度,中心极限定理包含了大数定律。
因为中心极限定理在于揭示系统在期望附近的统计性质,即“以何种方式”集中在期望。
总的来说就是——大数定律反映的是频率->概率(或者认为广义的期望);而中心极限定理反映的是——在整体结果下,结果内部发生各种情况下的一个概率分布情况。
3.2 那什么是中心极限定理?中心极限定理指的是分别适用于不同条件的一组定理,但基本可以用一句通俗的话来概括它们:大量相互独立的随机变量,其求和后的平均值以正态分布(即钟形曲线)为极限。
Eg:以二项分布为例进行解释(抛硬币)对于抛n次硬币,出现正面k次的一个分布情况,如下:但是对于二项分布不一定是对对称的,除了受抛的次数n影响,还受对应的概率p的影响3.3 晋级再后来,中心极限定理的条件逐渐从二项分布推广到独立同分布随机序列,以及不同分布的随机序列。
(完整版)大数定律和中心极限定理
第五章 大数定律和中心极限定理一、内容提要(一)切贝谢夫不等式 1. 切贝谢夫不等式的内容设随机变量X 具有有限的数学期望E (X )和方差D (X ),则对任何正数ε,下列不等式成立。
(){}()(){}().1,22εεεεX D X E X P X D X E X P -≤-≤≥-2. 切贝谢夫不等式的意义(1)只要知道随机变量X 的数学期望和方差(不须知道分布律),利用切贝谢夫不等式,就能够对事件(){}ε≥-X E X 的概率做出估计,这是它的最大优点,今后在理论推导及实际应用中都常用到切贝谢夫不等式。
(2)不足之处为要计算(){}ε≥-X E X P 的值时,切贝谢夫不等式就无能为力,只有知道分布密度或分布函数才能解决。
另外,利用本不等式估值时精确性也不够。
(3)当X 的方差D (X )越小时,(){}ε≥-X E X P 的值也越小,表明X 与E (X )有较大“偏差”的可能性也较小,显示出D (X )确是刻画X 与E (X )偏差程度的一个量。
(二)依概率收敛如果对于任何ε>0,事件{}ε a X n -的概率当n →∞时,趋于1,即{}1lim =-∞→ε a X P n n ,则称随机变量序列X 1,X 2,…,X n ,…当n →∞时依概率收敛于α。
(三)大数定律 1. 大数定律的内容(1)大数定律的一般提法若X 1,X 2,…,X n ,…是随机变量序列,如果存在一个常数序列α1,…,αn ,…,对任意ε>0,恒有11lim 1=⎭⎬⎫⎩⎨⎧-∑=∞→ε n i n i n a X n P , 则称序列{X n }服从大数定律(或大数法则)。
(2)切贝谢夫大数定律设随机变量X 1,X 2,…,X n ,…相互独立,分别有数学期望E(X i )和方差D(X i ),且它们的方差有公共上界C ,即()().,,,2,1, n i C X D i =≤则对于任意的ε>0,恒有()111lim 11=⎭⎬⎫⎩⎨⎧-∑∑==∞→ε n i ni i i n X E n X n P 。
第五章大数定律及中心极限定理
k 1
其中 X1, X2 ,, Xn是相互独立的、服从同一
均值为μ,方差为σ2>0的独立同分布的随机变量
n
X1,X2,…,Xn之和 X k 的标准化变量,当n充分
大时,有
k 1
n
k 1
Xk
nm
~近似N(0,1)
ns
n
这样可以用(标准)正态分布来对 X k 作
k 1
理论分析或实际计算,不必求分布函数
19/41
§5.2 中心极限定理
将上式改写为
即对任意的正数ε,当n充分
lim P n
1 n
n k 1
Xk
m
1.
大时,不等式 立的概率很大
|
X
m | 成
3/41
证 由随机变量X1,X2,…,Xn,…相互独立,且具有 相同的数学期望和方差,有
E
1 n
n k 1
Xk
lim
n
P
1 n
(X1
X2
Xn)
p
1,
即
lim
n
P
nA n
p
1.
伯努利大数定理表明,事件发生的频率nA/n依概率收敛
于事件的概率p,以严格的数学形式表达了频率的稳定性和概
率的合理性
近似:当n很大时,事件发生的频率nA/n与概率有较大偏差的 可能性很小,因此由实际推断原理,由于小概率事件几乎不
辛钦定 理
X P m
第10次课大数定律及中心极限定理
定义
Y 是一个随机变量序列, 设Y1,Y2 ,L n ,L是一个随机变量序列,a是
一个常数.若对于任意正数ε,有
lim P{| Yn − a |< ε} =1
n→∞
则称序列Y1,Y2 ,L n ,L依概率收敛于a.记为 Y Yn →a.
P
P P 性质 设Xn →a,Yn →b, 又设函数 ( x, y)在 g
( 连续, 点 a, b)连续,则g( Xn ,Yn ) →g(a, b).
P
注意 :
{ Xn} 依概率收敛于a,意味着对任意给定的ε > 0,
当n充分大时,事件 Xn − a < ε的概率很大,接近于 ; 1 并不排除事件 Xn − a ≥ ε的发生,而只是说它发生的 可能性很小 .
依概率收敛比高等数学中的普通意义下的收敛 弱些,它具有某种不确定性 .
n 近似地 n
很大时, 数。但当n很大时,可用正态分布来近似求解。 但当 很大时 可用正态分布来近似求解。
k=1
定理2(李雅普诺夫定理) 定理 (李雅普诺夫定理)
相互独立, 设随机变量X1, X2 ,L, Xn L相互独立,它们具 有数学期望和方差: 有数学期望和方差: E( Xk ) = µk , D( Xk ) = σk ,(k = 1,2,L )
或
nA lim P{| − p |< ε } = 1 n→∞ n nA lim P{| − p |≥ ε } = 0 n→∞ n
证明 因 nA ~ b(n, p), 此 表 为 为 由 可 示
nA = X1 + X2 +L+ Xn
其中X1, X2 ,L, Xn相互独立,且都服从 以p为参数的(0 −1)分布。因而E( Xk ) = p,
大数定律与中心极限定理
大数定律与中心极限定理大数定律和中心极限定理是统计学中两个重要的概念,它们被广泛应用于概率论、数理统计以及各种实际问题的分析与推导中。
本文将详细介绍大数定律与中心极限定理的概念、原理及应用,以期帮助读者更好地理解和应用这两个定律。
一、大数定律大数定律是指在随机试验中,当试验次数趋于无穷时,样本均值趋近于总体均值的概率趋于1的现象。
简言之,大数定律说明了在重复独立试验的过程中,随着试验次数增加,样本均值与总体均值之间的差距将会逐渐减小。
大数定律有多种形式,其中最为著名的是弱大数定律和强大数定律。
弱大数定律也称为大数定律的辛钦特例,它是在满足一定条件下,样本均值趋近于总体均值的概率收敛于1。
而强大数定律则对样本均值的收敛速度和稳定性做出了更严格的要求。
在实际应用中,大数定律可以用来解释和预测各种现象。
例如,当进行大规模的舆情调查时,可以通过随机抽样的方式来获取一部分样本,然后利用大数定律来推断出总体的舆情倾向。
此外,在生产过程中对产品质量的控制和检验中,也可以使用大数定律来判断产品的批量质量是否合格。
二、中心极限定理中心极限定理是概率论中的一个重要定理,它说明了在某些条件下,当样本容量足够大时,样本均值的分布将近似服从于正态分布。
也就是说,无论总体分布是否服从正态分布,在大样本条件下,样本均值的分布都将趋于正态分布。
中心极限定理的重要性在于它提供了许多统计推断和参数估计的基础。
例如,在对总体均值进行估计时,可以利用样本均值的分布接近于正态分布来构建置信区间,从而对总体均值进行区间估计。
此外,中心极限定理还为假设检验提供了支持。
假设检验是统计推断的一种常用方法,通过对样本数据进行假设检验,可以判断总体参数是否与假设相符。
而中心极限定理则为假设检验提供了理论基础,使得假设检验的结果更加可靠和准确。
综上所述,大数定律和中心极限定理是统计学中两个重要的理论基础。
大数定律说明了随机试验中样本均值与总体均值的关系,而中心极限定理则揭示了样本均值的分布特征。
第五章大数定律与中心极限定理
X lim P{
n i 1
n
i
np } lim
n
np(1 p)
Y np P{ n x} np(1 p)
1 2
e
t2 2
dt
例: 设某妇产医院出生男孩的概率为 0.515,求在 10000 个新生儿中,出生的女孩不少于男孩的概率.
解法1 设X为10000个新生儿中男孩个数 则X服从B(n,p),其中n=10000,p=0.515 由德莫弗-拉普拉斯中心极限定理,所求概率为
2
不等式求概率 P X 的近似值.
解
当 2时
P X 2
2
2
2
2
1 4
当 3时
P X 3
3
2
1 9
§1.2 大数定律
• 定义:设{Xk}是随机变量序列,数学期望 E(Xk)(k=1,2,...)存在,若对于任意ε >0,有
22 1 P{| X 20 | 4} 2 4 4
P{| X 20 | 4}
1 P{| X 20 | 4}
1 3 1 4 4
例:已知随机变量 X 的数学期望为 E(X)=μ ,方 差 D( X ) ,当 2 和 3 时,试用切比雪夫
n
1 n P{| X k | } 1 n k 1
注:
1 n 1 n E( X k ) E( X k ) n k 1 n k 1
例: 设随机变量 X 1 , X 2 ,, X n , 相互独立,且有如 下表的分布律,问:对随机变量 X 1 , X 2 ,, X n , 可 否使用大数定理?
167;34大数定律和中心极限定理
1 n
nk1 Xk E(Xk)
(3)
1n nk1Xk
P
也就是当观察次数无限增多时,观察
结果的算术平均值几乎变成一个常数,不是随机的了。
定理2(贝努利大数定理)设n是n次独立试验 中事件A发生的次数,则对任意的正数有
lim P | np| 1 , 其P 中 A p
n n
引人随机变量
k=1,2,…则对任意实数 x有
n
Xk
n
lim Pk1`
x
x
1
t2
e 2dt
n
n
2
n
Xk n
(1)令Ynk1 n 的分布Fn函 x, 数那么
n l i F m ( nx ) n l i P m (Y nx) x 2 1e t2 2d t (x)
E n Xk n E(Xk)n, k1 k1
课内练习2. 某单位设置一电话总机,共有200架分机.设每个 电话分机是否使用外线通话是相互独立的. 设每时刻每个分 机有 5% 的概率要使用外线通话. 问总机需要多少外线才能 以不低于90%的概率保证每个分机要使用外线时可供使用?
设需要k条外线, X为某时刻通话的分, 机数 则 X ~ B (2,0 0 .0 0 )5 n , p 1,n 0 p 9 .5 q P(0Xk)kn npp q 0 nnpp q
|X n a | a X n a
Xn
a a a
或Xn落在(a - ε,a + ε )的概率无限接近于1。
二、两个大数定理
定理1 ( 切比雪夫大数定律 ) 设X1,X2,…,Xn…是一
个随机变量序列, 且E(Xk)= ,D(Xk)=2 (k=1,2,…)
则对任意正数 , 有
第五章 大数定理与中心极限定理
说明
1 n 1、定理中{| X i | }是指一个随机事件, n i 1 当n 时,这个事件的概率趋于1.
2、 定理以数学形式证明了随机变量X 1 , X n 1 n 的算术平均X X i 接近数学期望E(X k) n i 1 (k 1,2, n),这种接近说明其具有的稳定性 .
第五章 大数定律与中心极限定理
第五章 大数定律与中心极限定理
§1 大数定律
1.1 切比雪夫不等式 1.2 依概率收敛 1.3 大数定律
§2 中心极限定理
HaiNan University
1
第五章 大数定律与中心极限定理
大数定律的客观背景
事件发生的频率稳定于某一常数 大量随机试验中 测量值的算术平均值具有稳定性
证明 取连续型随机变量的情况来证明.
设 X 的概率密度为 f ( x ), 则有
HaiNan University3第五章 大数定律 Nhomakorabea中心极限定理
P{ X μ ε }
2 x μ ε
x μ ε
f ( x)d x
x μ f ( x)d x 2 ε
1 1 2 2 2 ( x μ) f ( x ) d x 2 σ . ε ε
定理2 (契比雪夫大数定律)
1 nM M 1 D( X i ) 2 D( X i ) 2 . n i 1 n n n i 1 由契比雪夫不等式得: M 1 n 1 n P{ X i E ( X i ) } 1 n n i 1 n i 1 2
HaiNan University
10
第五章 大数定律与中心极限定理
1.3 大数定律
问题 : 设nA是n重贝努利试验中事件A发生 的次数,p是事件A发生的概率,
大数定律及中心极限定理
返回主目录
第五章 大数定律及中心极限定理
例1
§2 中心极限定理
某车间有200台车床,它们独立地工作着,开工 率为0.6,开工时耗电各为1千瓦,问供电所至少要 供给这个车间多少电力才能以99.9%的概率保证 这个车间不会因供电不足而影响生产. 解: 记某时在工作着的车床 数为 X, X ~ B(200,0.6). 则 设至少要供给这个车间r千瓦电才能以99.9%的概率 保证这个车间不会因供电不足而影响生产.由题 r k 意有:P{ X ≤ r} = ∑ C200 (0.6) k (0.4) 200k
1
k
∑X n
n
= p (1 p ), k = 1, 2 , , n ,
i
p |< ε } = 1 ,
第五章 大数定律及中心极限定理
§1 大数定律
定理 4(辛钦大数定律) 设 X 1 ,, X n , 相互独立同分布,且 具有 数学期望 EX k = ,k = 1,2,, n, ,
则:对任意的ε > 0 ,有
k =1 k =1 n n
∑ DX
k =1
n
k
,
若对任意 x ∈ R1 ,有 nlim P{Z n ≤ x} = >∞
1 2π
Hale Waihona Puke ∞∫ext2 2
dt .
则称 { X n } 服从中心极限定理.
返回主目录
第五章 大数定律及中心极限定理
§2 中心极限定理
定理1 (独立同分布的中心极限定理) 设 X 1 ,, X n , 是独立同分布的随机变量序 列,且 EX k = ,DX k = σ 2 ≠ 0, (k = 1,2,) 则 { X n } 服从中心极限定理,即:
第五章大数定律与中心极限定理
Xi
1 n
n i 1
E(Xi)
1,
则称{Xn}服从大数定律.
(2)伯努利大数定律是切比雪夫大数定律的特例
(3) 伯努利大数定律和切比雪夫大数定律的证明 都用到切比雪夫不等式,而且需要方差存在。
定理 5.1.4. 辛钦大数定律
设X1, X 2 ,..., X n,...是独立同分布的随机变量序列,
意义:只要试验次数够大,发生事件的频率无限接近于 概率,频率稳定性,频率代替概率。
定理 5.1.3. 切比雪夫大数定律
设X1 , X 2 ,, X n ,是一相互独立的随机变 量序列,
它们的数学期望和方差 均存在,且方差有共同 的上界,
即存在常数 K 0,使得 D ( X i ) K , i 1,2, ,
不等式给出了X 与它的期望的偏差不小于的概率
的估计式.
例 1 E( ) 4, D( ) 0.2, 则由切比雪夫不等式知
P{| 4 | 2} P{| 4 | 1}
,
P{ X
}
2 2
,
P{1 7}
定义 5.1.1设{X n}是一个随机变量序列,a是常数,
若对于任意的 0,有
已知整个系统中至少有84个部件正常工作,系统
工作才正常.试求系统正常工作的概率.
解: 记Y为100个部件中正常工作的部件数,则
Y 近似服从 N(100 0.9,100 0.9 (1 0.9))
即Y 近似服从N (90, 9)
因此,所求概率为
P{Y 84}=1-P{Y<84}=1-P{ Y-90 < 84-90 }
解: 设Xi为第i个螺丝钉的重量,i 1, 2,...,100.
且设X 为一盒螺丝钉的重量.
大数定理及中心极限定理
标准正态分布的分布函 数.
从而知当n充分大时,
n
Xk n
k
近似服从标准正态分布
N (0,1)
n
n
X k 近似服从正态分布 N (n, n 2 )
k 1
例1 一加法器同时收到20 个噪声电压Vk (k 1,2, 20), 设它们是相互独立的随机变量,
20
且都在区间(0,10) 上服从均匀分布, 记 V Vk , k 1
§4.1 大数定律
一、切比雪夫不等式 (P107)
若 r .v X 的期望和方差存在,则对任意0,
有
P{|
X
E(
X
) |
}
D( X
) ;
这就是著名的切比雪夫(Chebyshev)不等式。
它有以下等价的形式:
P{|
X
E(
X
) |
}
D(
X
)
.
二、依概率收敛
设{Xn}为随机变量序列,X为随机变量,若任给 >0, 使得
E( Xk ) p, D( Xk ) p(1 p) (k 1,2, , n),
根据定理4.6得
lim P n
n np
np(1 p)
x
lim n
P
n
Xk
k 1
np(1
np p)
x
x
1
t2
e 2 dt ( x).
2π
定理4.8表明:
正态分布是二项分布的极限分布, 当n充分大 时, 可以利用该定理来计算二项分布的概率.
D( Yn
)
n
D(
k
Xk
)
n
P {| Yn
大数定律与中心极限定理
大数定律与中心极限定理大数定律和中心极限定理是概率论中两个重要的定理,它们分别描述了随机变量序列的极限行为。
在统计学和概率论中,这两个定理被广泛应用于估计和推断,对于理解随机现象的规律具有重要意义。
一、大数定律大数定律是概率论中的一个基本定理,它描述了独立同分布随机变量序列的均值在概率意义下收敛于其数学期望的现象。
大数定律分为弱大数定律和强大数定律两种形式。
1. 弱大数定律弱大数定律又称为辛钦大数定律,它是概率论中最早被证明的大数定律之一。
弱大数定律指出,对于独立同分布的随机变量序列$X_1, X_2, \cdots, X_n$,如果这些随机变量的数学期望存在且有限,记为$E(X_i)=\mu$,则随着样本量$n$的增大,样本均值$\bar{X}_n=\frac{1}{n}\sum_{i=1}^{n}X_i$以概率1收敛于数学期望$\mu$,即$\lim_{n \to \infty}P(|\bar{X}_n-\mu|<\varepsilon)=1$,其中$\varepsilon$为任意小的正数。
弱大数定律的直观解释是,随着样本量的增加,样本均值会逐渐接近总体均值,即样本的平均表现会趋向于总体的真实情况。
这一定律在统计学中有着广泛的应用,例如在抽样调查、质量控制等领域中被频繁使用。
2. 强大数定律强大数定律是大数定律的另一种形式,它要求更高,即要求随机变量序列的方差有限。
强大数定律指出,对于独立同分布的随机变量序列$X_1, X_2, \cdots, X_n$,如果这些随机变量的方差存在且有限,记为$Var(X_i)=\sigma^2$,则随着样本量$n$的增大,样本均值$\bar{X}_n$以概率1收敛于数学期望$\mu$,即$\lim_{n \to\infty}P(\bar{X}_n=\mu)=1$。
强大数定律相比于弱大数定律更加严格,要求随机变量序列的方差有限,但在实际应用中,强大数定律的条件并不总是成立。
大数定律和中心极限定理
1 n
,则X n
P
证明: 利用切比雪夫不等式 :
P(|
Xn
0 | )
D(Xn )
2
1
n 2
0.
9
例:在n重贝努里试验中,若已知每次试验 事件A出现的概率为0.75, 试利用切比雪夫不等式计算, (1)若n=7500,估计A出现的频率在0.74至0.76 之间的概率至少有多大; (2)估计n,使A出现的频率在0.74至0.76之 间的概率不小于0.90。
解:设在n重贝努里试验中,事件A出现的次数为X,
则X Bn,0.75,
E X np 0.75n, D X npq 0.1875n,
又
fn A
X n
(1) n 7500, P
0.74
X n
0.76
P X 0.75n 0.01n
1
0.1875n
0.01n 2
1
1875 7500
解:设X
i为第i次所倒的红酒重量(单位:ml),则X
相互独立且
i
分布相同,E(Xi ) 100, D(Xi ) 322,i 1, 2,L ,55.
根据独立同分布的中心极限定理:知
55
Xi 55100 近似
i 1
~ N 0,1,
32 55
所以
55
P{倒了55次后该瓶红酒仍有剩余} P{ Xi 6000} i 1
由德莫佛--拉普拉斯中心极限定理,知
Y
1500
1 10
近似
~ N (0,1).
1500
1 10
9 10
设教室需要设a个座位,由题意知a需要满足
a 1500 1
95% P{Y a} (
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章大数定律及中心极限定理【基本要求】1、了解切比雪夫不等式;2、了解切比雪夫大数定律,Bernoulli大数定律和辛钦大数定律成立的条件及结论;3、了解独立同分布的中心极限定理(列维—林德伯格定理)和德莫佛—拉普拉斯中心极限定理(二项分布以正态分布为极限分布)的应用条件和结论,并会用相关定理近似计算有关随机事件的概率。
【本章重点】切比雪夫不等式,切比雪夫大数定理及Bernoulli大数定理。
【本章难点】对切比雪夫大数定理及独立同分布的中心极限定理的理解。
【学时分配】2学时【授课内容】§5.1 大数定律0.前言在第一章我们提到过事件发生的频率具有稳定性,即随着试验次数的增加,事件发生的频率逐渐稳定于某个常数,这一事实显示了可以用一个数来表征事件发生的可能性大小,这使人们认识到概率是客观存在的,进而由频率的三条性质的启发和抽象给出了概率的定义,而频率的稳定性是概率定义的客观基础。
在实践中人们还认识到大量测量值的算术平均值也具有稳定性,而这种稳定性就是本节所要讨论的大数定律的客观背景,而这些理论正是概率论的理论基础。
下面介绍三个定理,它们分别反映了算术平均值及频率的稳定性。
一、切比雪夫大数定律12事件的频率稳定于概率,能否有p nlimnn =μ∞→,答案是否定的。
而是用)(0}{∞→→ε≥-μn p nP n [依概率收敛]来刻划(弱)。
或者用{}1n n P p n →∞μ−−−→=[a.e.收敛] 来刻划(强)。
1.定义:设 ,,,,21n X X X 是一个随机变量序列,a 是一个常数,若对于任意正数ε,有()1lim =<-∞→εa X P n n ,则称序列 ,,,,21n X X X 依概率收敛于a .记为a X Pn −→−. 2.切比雪夫不等式设随机变量ξ具有有限的期望与方差,则对0>∀ε,有2)())((εξεξξD E P ≤≥-或2)(1))((εξεξξD E P -≥<-证明:我们就连续性随机变量的情况来证明。
设~()p x ξ,则有22()()(())(())()()x E x E x E P E p x dx p x dx ξεξεξξξεε-≥-≥--≥=≤⎰⎰2221()(())()D x E p x dx ξξεε+∞-∞≤-=⎰该不等式表明:当)(ξD 很小时,))((εξξ≥-E P 也很小,即ξ的取值偏离)(ξE 的可能性很小。
这再次说明方差是描述ξ取值分散程度的一个量。
切比雪夫不等式常用来求在随机变量分布未知,只知其期望和方差的情况下,事件{}E ξξε-≥概率的下限估计;同时,在理论上切比雪夫不等式常作为其它定理证明的工具。
3.定理1(切比雪夫大数定律)设}{n ξ是相互独立的随机变量序列,每一随机变量都有有限的方差,且一致有界,即存在常数C ,使 ,2,1)(=≤i C D i ξ,则对任意的0>ε,有01111=ε≥ξ-ξ∑∑==∞→})(E n n {P lim n i ni i i n [即31111()()n n pi i i i E n n n ξξ==−−→→∞∑∑] 证明:由切比雪夫不等式知:,0>∀ε有:)(0)1(1})(11{022********∞→→=≤=≤≥-≤∑∑∑∑====n n Cn nC n D n D E n n P ni ini i n i n i i i εεεξξεεξξ该定理表明:当n 很大时,随机变量n ξξ,,1 的算术平均值11ni i n ξ=∑接近于其数学期望11()ni i E n ξ=∑,这种接近是在概率意义下的接近。
通俗的说,在定理的条件下,n 个相互独立的随机变量算术平均值,在n 无限增加时将几乎变成一个常数。
推论:设n ξξ,,1 是相互独立的随机变量,由相同的数学期望和方差,2,1)(,)(2===i D E i i σξμξ,则,0>∀ε有0}1{lim 1=≥-∑=∞→εμξni i n n P (即∑=n i i n 11ξ以概率收敛于μ)这个结论有很实际的意义:人们在进行精密测量时,为了减少随机误差,往往重复测量多次,测得若干实测值n ξξ,,1 ,然后用其平均值∑=ni i n 11ξ来代替μ。
切比雪夫大数定律是最基本的大数定理,作为切比雪夫大数定律的特殊情形有Bernoulli 大数定理和辛钦大数定律。
二、Bernoulli 大数定律定理2:设n μ是n 重Bernoulli 试验中事件A 出现的次数,而)10(<<p p 是事件A 在每次试验中出现的概率,则对0>∀ε,0lim =⎭⎬⎫⎩⎨⎧≥-∞→εμp n P n n 证明:令⎩⎨⎧=不出现次试验中第出现次试验中第A i A i i 01ξ,n i ,1,2, =4 则12,,,n ξξξ相互独立且n nμ=∑=n i i n 11ξ,P E i =)(ξ,11()n i i E p n =ξ=∑,41)1()(≤-=P P D i ξ,n i ,1,2, =故由切比雪夫大数定律立刻推出贝努里大数定律。
或者,直接由切比雪夫不等式,对0>∀ε,有⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧ε≥⎪⎭⎫ ⎝⎛ξ-ξ=⎭⎬⎫⎩⎨⎧ε≥-μ≤∑∑==n i i n i i n n E n P P n P 111100111212→ε-=⎪⎭⎫ ⎝⎛ξε≤∑=n )p (p n D n i i )(∞→n 即P n p n →μ )(∞→n 。
故{i ξ}服从大数定律。
Bernoulli 大数定律表表明:事件发生的频率nnμ依概率收敛于事件的概率p ,这个定理以严格的数学形式表达了频率的稳定性。
就是说当n 很大时,事件发生的频率于概率有较大偏差的可能性很小。
由实际推断原理,在实际应用中,当试验次数很大时,便可以用事件发生的频率来代替事件的概率。
切比雪夫大数定律(定理1)中要求随机变量12,,,,n ξξξ的方差存在,但在这些随机变量服从相同分布的场合,并不需要这一要求,从而我们有以下的定理: 三、辛钦大数定律定理3:设随机变量n ξξ,,1 独立同分布,且具有数学期望(),1,2,i E i ξμ==,则,0>∀ε有0}1{lim 1=≥-∑=∞→εμξni i n n P (即∑=n i i n 11ξ以概率收敛于μ) 证明:略。
显然,Bernoulli 大数定律是辛钦大数定律的特殊情况。
5§5.2 中心极限定理0.前言在客观实际中有许多随机变量,它们是由大量的相互独立的随机因素的综合影响所形成的,而其中每一个因素在总的影响中所起的作用都是微小的,这种随机变量是近似地服从正态分布,这种现象就是中心极限定理的客观背景。
中心极限定理的内容包含极限,因而称它为极限定理是很自然的,又由于它在统计中的重要性,称它为中心极限定理这是Poyla 在1920年取得名字。
设{n ξ}是相互独立的随机变量序列,它们的期望与方差均存在,考虑)()(111∑∑∑===ξξ-ξ=ζni i ni i ni in D E (标准化和) 2,1=n ,这时对于任意的n 都有1,0=ζ=ζn n D E ,因而当∞→n 时,n ζ不至于发生趋向于0或∞这种情形,这时讨论它的分布才有意义。
下面研究n ζ的分布:中心极限定理有多种不同的形式,下面我主要讲独立同分布的中心极限定理及其一特殊情形:一、定理1:(Levy-Lindeberg 极限定理)[独立同分布的中心极限定理]设}{n ξ是独立同分布的随机变量序列,且2,σξμξ==i i D E (0>σ), ,2,1=i ,均存在,则R x ∈∀,有)(21lim 212x dt e x n n P x t n i i n Φ=π=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧≤σμ-ξ⎰∑∞--=∞→ 证:(略)该定理也可改写为:对b a <∀,有)()(}{lim 1a b b n n a P ni in Φ-Φ=≤σμ-ξ<∑=∞→6在一般情况下,很难求出n 个随机变量之和1ni i ξ=∑的分布函数,该定理表明:当n 充分大时,可以通过()x Φ给出其近似分布,这样就可以利用正态分布对1ni i ξ=∑作理论分析或作实际计算,其好处是明显的。
二、定理2(De Moivre-Laplace 极限定理)(定理1的特殊情形) 设(1,2,)n n μ=是n 重Bernoulli 试验中成功的次数,已知每次试验成功的概率为()10<<p p ,则对,R x ∈∀有()22lim }xn tnpP x dt x eμ--∞→∞-≤==Φ。
该定理也可改写为:b a <∀,有()()lim {}n P a b b a →∞<≤=Φ-Φ证明: 令⎩⎨⎧=ξ次试验不出现成功第次试验出现成功第i i i 01 则}{i ξ为独立同分布的随机变量序列,且,(1)i i E p D p p ξ=ξ=-均存在显然:1nn i i μξ==∑,此时n npμζ-=该定理为上定理的一个特殊情形,故由上定理该定理得证。
中心极限定理表明:在相当一般的条件下,当独立随机变量的个数增加时,其和的分布趋于正态分布。
因此,只要和式中加项的个数充分大,就可以不必考虑和式中的随机变量服从什么分布,都可以用正态分布来近似,这在应用上是有效的和重要的。
作为以上两个定理的应用,我们给出下面例子:例1:一加法器同时收到20个噪声电压)20,,2,1( =k V k ,设它们是相互独立的随机变量,且都在区间(0,10)上服从均匀分布。
记∑==201k k V V ,求)105(>V P 的近似值。
解:)20,,2,1(12100)(,5)( ===k V D V E k k ,由定理1,得 )105(>V P )20)1210(52010520)1210(520(⨯->⨯-=V P7)387.020)1210(100(>-=V P)387.020)1210(100(1≤--=V P)387.0(1Φ-≈ 348.0=即有 )105(>V P 348.0≈例2:一船舶在某海区航行,已知每遭受一次波浪的冲击,纵摇角大于 3的概率为31=p ,若船舶遭受了90000次波浪冲击,问其中有30500~29500次纵摇角大于 3的概率是多少?解:设}3{ 纵摇角大于=A ,1)(==p A P ,的次数发生次波浪冲击中表示在 A 90000X 。
则),(3190000B ~X ,由定理2得)()〈()1(30500)1(X )1(29500P 30500X 29500P p np np p np np p np np --≤--<--=≤))311(3190000319000030500)311(31900003190000X )311(3190000319000029500(-⨯⨯-≤-⨯⨯-<-⨯⨯-=P )225()225(-Φ-Φ≈995.0=。