第二节中心极限定理解读
第二节-中心极限定理要点
定理的应用:对于独立的随机变量序列 X n,不管
Xi (i 1, 2, , n) 服从什么分布,只要它们是同分布,
且有有限的数学期望和方差,那么,当n充分大时,这
n
些随机变量之和 X i 近似地服从正态分布 N n, n 2 i 1
从演示不难看到中心极限定理的客观背景
f
g
h
例:20个0-1分布的和的分布
k 1
概率论中有关论证独立随机变量的和的极限分布 是正态分布的一系列定理称为中心极限定理。
独立同分布的中心极限定理
设随机变量X1,X2,…,Xn相互独立,服从同一分
布,且有有限的数学期望 和方差 2 ,则随机变量
n
Xi n
Yn i1 n 的分布函数 Fn (x) 满足如下极限式
lim n
lim
n
P
i 1
n
x
(
x);
这一讲我们介绍了中心极限定理 中心极限定理是概率论中最著名的结果 之一,它不仅提供了计算独立随机变量之和 的近似概率的简单方法,而且有助于解释为 什么很多自然群体的经验频率呈现出钟形曲 线这一值得注意的事实.
在后面的课程中,我们还将经常用到中心 极限定理.
1
x t2
e 2 dt
2
即对任意的 a < b,
lim P a Yn np b
n
np(1 p)
1
b t2
e 2 dt
2 a
Y n ~ N (np , np(1-p)) (近似)
正态分布的概率密度的图形
x
二项分布的随机变量可看作许多相互独立
的0-1分布的随机变量之和, 下面是当x-
(1) 至少命中180发炮弹的概率; (2) 命中的炮弹数不到200发的概率.
第二节中心极限定理
x,总成立
lim P{ μn np x} x
n np(1 p)
1
t2
e 2 dt
2π
定理表明:若 Yn服从二项分布,当n很大时, Yn
的标准化随机变量 Yn np 近似服从标准正态 np(1 p)
分布.
由此可知:当n很大,0<p<1是一个定值时(或
者说,np(1-p)也不太小时),服从二项分布B(n,p) 的随机变量 Yn近似服从正态分布 N(np,np(1-p)).
200 200} 15
P{13.33 X 200 0} Φ(0) Φ(13.33)
15
Φ(0) [1 Φ(13.33)] 0.5 (1 1) 0.5
例2.一食品店有三种蛋糕出售,由于售出哪一种蛋糕 是随机的,因而售出一只蛋糕的价格是一个随机变 量,它取1(元),1.2 (元),1.5(元)各值的概率分别为 0.3,0.2,0.5.某天售出300只蛋糕.求这天的收入至少 达400 (元)的概率
D( X i ) E(X i2) [E(X i)]2 1.713 1.292 0.0489
由独立同分布中心极限定理知:
300
X i 300 1.29近似
i 1
~ N (0,1))
即
300 0.0489
300
i 1
Xi
387近似
~
N (0,1))
3.8301
300
300
P{ i 1
Xi
400}
X i 387 P{ i1
3.8301
400 387 }
3.8301
300
X i 387
P{ i1
3.39} 1 Φ(3.39)
4-2中心极限定理
的分布函数 Fn ( x ) 对于任意 x 满足
n
lim Fn ( x ) lim P {Yn x } lim P{ k 1
n x n
Xk n
n
n
x}
1 2π
t2 e 2 dt
( x ).
定理4.6表明:
当 n , 随机变量序列 Yn 的分布函数收敛于 标准正态分布的分布函 数.
x
x
1 e 2π
t2 2
dt ( x ).
注 1º 定理4.7表明: 正态分布是二项分布的极限分布, 当n充分大 时, 可以利用该定理来计算二项分布的概率.
即 若n ~ B( n, p ) ( n 1,2,; 0 p 1),则
n的标准化随机变量: n E (n ) n np Yn D(n ) np(1 p )
例4 对于一个学生而言, 来参加家长会的家长 人数是一个随机变量. 设一个学生无家长、1名 家长、 2名家长来参加会议的概率分别为0.05、 0.8、0.15. 若学校共有400名学生, 设各学生参加 会议的家长数相互独立, 且服从同一分布. (1) 求 参加会议的家长数X超过450的概率; (2) 求有1名 家长来参加会议的学生数不多于340的概率. 解 (1) 以 X k ( k 1, 2,, 400) 记
且都在区间 ( 0,10) 上服从均匀分布 , 记 V Vk ,
k 1 20
求 P {V 105} 的近似值 .
解
100 E (Vk ) 5, D(Vk ) ( k 1,2,,20). 12 V E (V ) V 20 5 Z 100 D(V ) 20 12
第二节 中心极限定理
1 2
e
x
t2 2
dt
q=1-p
定理表明,当n很大,0<p<1是一个定值 时(或者说,np(1-p)也不太小时),二项变 量的分布近似正态分布 N(np,np(1-p)).
例2某保险公司多年的统计资料表明,在索赔户中被 盗索赔户占20%,以X表示在随机抽查的100个索赔户 中因被盗向保险公司索赔的户数 (1) 写出X的概率分布
第五章
Hale Waihona Puke 大数定律和中心极限定理§5.2 中心极限定理
大数定律揭示了大量随机变量的算术平均值
在一定条件下具有某种稳定性这一重要规律。
而在概率论中还有一类重要的极限定理,它是 解决在什么条件下,大量独立的随机变量的和 的分布是以正态分布为极限分布。
列维一林德伯格(Levy-Lindberg)定理. 定理1(独立同分布下的中心极限定理) 设X1, X2, …是独立同分布的随机变量序 列,且E(Xi)= ,D(Xi)= 2 ,i=1,2,…, 则 n X i n x 1 -t 2 2 i 1 e dt lim P{ x } n - 2 n
解: 设Xi (i=1,2…n)为第i箱重量,n为所求箱 数由条件知X1 , X2 … Xn是独立同分布的, 而n箱总重量X = X1 +X2 + … + Xn E(Xi )=50 DX 5
i
E(X ) = 50n
D(X) = 25n
由中心极限定理, X近似N(50n,25n)
P(X ≤5000)= P ( X 50n 5000 50n ) 5 n 5 n 1000 10n ( ) 0.977 ( 2) n 1000 10n 由此可见 2 n
第二节 中心极限定理
1
t2
e 2 dt Φ( x) .
n np(1 p)
2
该定理表明,当 n 时,二项分布以正态分布
为极限分布.
实际应用中,若随机变量X ~ B(n, p) ,只要 n 充
分大,即有
~ X 近似地 N(np, npq),或
即有近似计算公式
~ X np 近似地 N(0,1), npq
观察表明,如果一个量是由大量相互独立的随 机因素的影响所造成,而每一个别因素在总影响中 所起的作用不大. 则这种量一般都服从或近似服从 正态分布.
4
中心极限定理,正是从理论上证明,对于大 量的独立随机变量来说,只要每个随机变量在总 和中所占比重很小,那么不论其中各个随机变量 的分布函数是什么形状,也不论它们是已知还是 未知,而它们的和的分布函数必然和正态分布函 数很近似。这就是为什么实际中遇到的随机变量 很多都服从正态分布的原因,也正因如此,正态 分布在概率论和数理统计中占有极其重要的地位。
[1 Φ(1.34)] 2 0.1802.
12
~ Sn
12 /
n
近
似
地
N
(0,
1)
,
(2) 数据个数n应满足条件:
P{| Sn | 10 } P
| Sn | n / 12
10
0.90
,
n / 12
即 2Φ( 10 ) 1 0.90 , Φ( 10 ) 0.95 ,
P{40 X 60} Φ( 60 50) Φ( 40 50)
47.5
47.5
2Φ(1.45) 1 0.853 .
注 由切比雪夫不等式,
第五章__大数定律与中心极限定理讲解
n
n
●伯努利大数定律说明了当重复独立试验次数 n 很大时,频率与其概率之差可为任意小, 即说明了其频率的稳定性。
从而在实际推断中,当试验次数较大时,可以 用事件发生的频率来近似代替概率。
若记
1, 第i次实验中事件A发生 Xi 0,第i次实验中事件A不发生
(i 1, 2
n)
n
P400 X 600 由切比谢夫不等式得
P400 500 X 500 600 500 P| X E(X ) | 100
1
D(X ) 100 2
1
250 100 2
0.975
(2)设需要做n次独立试验, 则X ~ B(n, 0.5), 求n使得
P
0.35
X n
0.65
0.95
P0.35
X n
0.65
P0.35
n
0.5
n
X
0.5 n
0.65n
0.5n
PX 0.5n 0.15n 0.95
成立,由切比谢夫不等式得
DX
0.25n
P X 0.5n 0.15n 1 (0.15n)2 1 (0.15n)2
D( Xi ) c(i 1, 2 ),则对任意 0,有
lim P(
n
1 n
n i 1
Xi
1 n
n i 1
E( Xi )
)
1
证明: 由期望与方差的性质知
E(1
n
n i 1
Xi)
概率论与数理统计第5章第2节
P(940 X 1060 )
用正态分布近似计算
由中心极限定理,
1000, 5000 X ~ N 6
近似
1000, 5000 X ~ N 6 1 X P(940 X 1060 ) P 0.01 6000 6 1060 1000 940 1000 5000 6 5000 6
1 令 Xi 0
第i位顾客选择了甲 i 1,2 2000 否则
1 令 Xi 0
第i位顾客选择了甲 否则
1 X i ~ (0 1)分布 P( X i 1) P ( X i 0) 2 1 即 X i ~ B (1, ) 诸Xi独立同分布,
2
设 Y Xi
由题给条件知,诸Xi独立同分布,
E(Xi)=100,
D(Xi)=10000
16 k 1
16只元件的寿命的总和为 Y X k
解: 设第i只元件的寿命为Xi , i=1,2, …,16 诸Xi独立同分布, E(Xi)=100,D(Xi)=10000 16 16只元件的寿命的总和为 Y X
分析: 求的是100个独立且均服从均匀分布的 随机变量和的概率分布问题 解: 设 X i 为第i段的误差 i=1,2,…100 由题给条件知,诸Xi独立同分布, 1 X i ~ U (1,1) 则 EXi 0, DX i
总误差Y X i
i 1 100
100 则 EY 0, DY 3
在概率论中,习惯于把和的分布收敛于正 态分布这一类定理都叫做中心极限定理. 我们只讨论几种简单情形. 下面给出的独立同分布随机变量序列 的中心极限定理, 也称列维一林德伯格 (Levy-Lindberg)定理.
第二节--中心极限定理
四、拉普拉斯中心极限定理
例3 100台车床独立工作,每台实际工作时间占全部 工作时间的80%. 求任一时刻有70至86台车床工作的 概率.
解:设
Xi
0, 1,
第i台床不工作 第i台床工作
i 1, 2,
,100
则 Xi B(1, 0.8)
100
100
依题意, E( X ) E( Xi ) E( Xi ) 80
设随机变量序列{ Xi }(i 1, 2, )独立同分布,
EXi , DXi 2 , i 1, 2, ,则
lim
n
P
n i 1
n
Xi E( Xi )
i 1
n
D( Xi )
i 1
x
lim P n
n i 1
Xi n n 2
x
1
x t2
e 2 dt ( x)
2
设随机变量序列{ Xi }(i 1, 2, )独立同0-1分布,即
n
Xi B(1, p), EXi p, DX i pq, i 1, 2, , X i nA,
i 1
n
n
lim n
P
i 1
Xi E( Xi )
i 1
n
D( Xi )
i 1
x
lim
n
P
nA np npq
x
近似
Xi N (n,n 2 ),
i 1
X
1 n
n
近似
X i N (, 2
i 1
n)
n
近似
~ Xi独立同0 - 1分布 Xi nA N (np,npq)
i 1
大数定律与中心极限定理
概率统计(5)大数定律与中心极限定理
i =1 上一页 下一页
返回
定理2: 定理
上一页
下一页
返回
贝努利大数定律) (贝努利大数定律)设nA是n次独立重复试 次独立重复试 定理3: 定理 验中事件A出现的次数 是事件 出现的次数. 是事件A在每次试验中发生的 验中事件 出现的次数 p是事件 在每次试验中发生的 概率 (0<p<1),则对任意的ε >0有: 则对任意的 有 或 证明:设Xi表示第 i 次试验中事件 出现的次数, 次试验中事件A出现的次数 出现的次数, 证明: i=1,2,…,n,则X1,X2,…,Xn相互独立且均服从参数为 的 相互独立且均服从参数为p的 则 (0-1)分布,故有 E(Xi)=p, D(Xi)=p(1-p) i=1,2,…,n 分布, 分布 由契比雪夫大数定律知, 且 ,由契比雪夫大数定律知,对于任意 的 ,有
定理1: 定理
相互独立, 证 因X1,X2,…相互独立,所以 相互独立
1 n 1 n 1 l D ∑ X i = 2 ∑ D( X i ) < 2 nl = n n n i =1 n i =1
又因
1 n 1 n E ∑ X i = ∑ E ( X i ), n i =1 n i =1
ε
ε2
可见契比雪夫不等式成立. 可见契比雪夫不等式成立
上一页
下一页
返回
设电站供电网有10000盏电灯 夜晚每一盏灯开灯的 盏电灯,夜晚每一盏灯开灯的 例2 设电站供电网有 盏电灯 概率都是0.7,而假定开,关时间彼此独立 估计夜晚同时 而假定开, 概率都是 而假定开 关时间彼此独立,估计夜晚同时 开着的灯数在6800与7200之间的概率 之间的概率. 开着的灯数在 与 之间的概率 表示在夜晚同时开着的灯的数目,它服从参数为 解 设X表示在夜晚同时开着的灯的数目 它服从参数为 表示在夜晚同时开着的灯的数目 n=10000,p=0.7的二项分布 的二项分布. 的二项分布 若要准确计算,应该用贝努利公式 应该用贝努利公式: 若要准确计算 应该用贝努利公式:
中心极限定理(27页PPT)
§5.2 中心极限定理
一. 中心极限定理的定义与意义
定义5.2.1 设随机变量X, X1, X2, …的分布函 数分别为F( x ),F1( x ), F2( x ), …, 若极限式
lim
n
Fn
(
x)
F
(
x
)
在F( x )的每一个连续点上都成立,称随机变 量序列{Xk}, k = 1,2,…依分布收敛于X .
中心极限定理
二. 中心极限定理
定理5.2.1(林德伯格—列维定理、独立
同分布中心极限定理)
设{ Xk }, k =1,2…为相互独立, 具有相同分
布的随机变量序列, 且E( Xk ) = m, D( Xk ) = s2,
则{ Xk }满足中心极限定理,即 有
n
lim
P
k
1
X
k
nm
x
Φ( x)
100
X Xi
i 1
电子科技大学
中心极限定理
并且随机变量 X1, X2, ···, X100 独立同分布,
具有分布律:
P{ X i
k}
1 (2)k1, 33
k 1,2,
因 1
E( X i ) 1 3, 3
2
D( X i )
3
(
1 3
)2
6
i = 1, 2, ···, 100;
根据林德伯格—列维定理, 所求概率
电子科技大学
中心极限定理
100
P{280 Xi 300}
i 1
(0) (0.8165)
0.5 1 (0.8165) 0.293
电子科技大学
中心极限定理
中心极限定理
随机变量
Zn
1 n
n i 1
X
2
i
近似服从
正态分布并指出其分布参数.
证记
Yi
X
2 i
,
(i 1,2, ,n)
E(Yi
)
E(
X
2 i
)
D(
X
i
)
D(Yi
)
E(Yi2 )
[E(Yi
)]2
E
(
X
4 i
)
[E(Yi
)]2
因为
E
(
X
4 i
)
1 1
xi4
1 2
dxi
1 5
,
所以
D(Yi
)
1 5
1 2 3
30500 np(1
np
p)
30500 np
np(1 p) 29500 np
1
t2
e 2 dt
2π
np(1 p)
30500 np 29500 np np(1 p) np(1 p)
n 90000, p 1 , 3
P{29500 X 30500} 5 2 5 2 2 2
(1) 求参加会议的家长数 X 超过 450 的概率; (2) 求有1名家长来参加会议的学生数不多于
340的概率.
解 (1) 以 Xk k=1, 2,…, 400 记 第k个学生来参加会议的家长数.
则Xk的分布律为 Xk 0 1 2
pk 0.05 0.8 0.15
易知 E( Xk ) 1.1, D( Xk ) 0.19, k 1,2, ,400
4, 45
因为X1, X2,…, Xn相互独立, 所以Y1, Y2,…,Yn
中心极限定理
f
g
h
20个0-1分布的和的分布
x
01 2 3 几个(0,1)上均匀分布的和的分布
X1 ~f(x) X1 +X2~g(x) X1 +X2+X3~ h(x)
例1: 一 加 法 器 同 时 收 到 20个 噪 声 电 压 V k(k1,2,Ln),
概率论
设 它 们 是 相 互 独 立 的 随 机 变 量 ,且 都 在 区 间 (0,10)上 服 从 均 匀 分 布 .
其 中 Xk(k1,2,L,n)的 分 布 律 为 :
PXk ipi(1p)1i,i0,1,
由 于 : E ( X k ) p ,D ( X k ) p ( 1 p ) ( k 1 , 2 , L , n ) , 得 :
limP n
fn np np(1 p)
x
lim
n
P
n
k
1
Xk
n
记 :V V k, 求 PV105的 近 似 值 . k1
解: 易 知 :E(V k)5,D (V k)10012(k1,2,L20).
~ 由 定 理 知 :Vk2 01V k近 似 地 N205,1 1 0 2 020,于 是 :
P V 1 0 p 5 V 1 2 1 0 5 0 2 0 2 0 1 1 0 1 0 2 5 2 0 2 5 0 0
p V 102100 25200.38 7
1p V 102 10 0 2520 0.38 71 (0 .3)8 0 7 .34
即 有 : P V 1 0 5 0 .3 4 8 .
例2:某车间有200台车床, 在生产期间由于需要检修, 调换刀具, 变换位置及调换工件等常需停车. 设开工率为0.6, 并设每台车床的工作是独立的, 且在开工时需电力1千瓦.
第二节 中心极限定理
第二节中心极限定理独立同分布序列的中心极限定理定理1设X1,X2,…Xn,…是独立同分布的随机变量序列,且具有相同数学期望和方差E(Xi)=μ,D(Xi)=σ2(i=1,2,…)。
记随机变量的分布函数为F n(x),则对于任意实数x,有(不证)其中φ(x)为标准正态分布函数。
由这一定理知道下列结论:(1)当n充分大时,独立同分布的随机变量之和的分布近似于正态分布N(nμ,nσ2)。
我们知道,n个独立同分布的正态随机变量之和服从正态分布。
中心极限定理进一步告诉我们。
不论X1,X2,…X n,…独立同服从什么分布,当n充分大时,其和Z n近似服从正态分布。
(2)考虑X1,X2,…X n,…的平均值,有它的标准化随机变量为,即为上述Y n。
因此的分布函数即是上述的F n(x),因而有由此可见,当n充分大时,独立同分布随机变量的平均值的分布近似于正态分布[例5-3]对敌人的防御地段进行100次射击,每次射击时命中目标的炮弹数是一个随机变量,其数学期望为2,均方差为1.5,求在100次射击中有180颗到220颗炮弹命中目标的概率。
解设X i为第i次射击时命中目标的炮弹数(i=1,2,…,100),则为100次射击中命中目标的炮弹总数,而且X1,X2,…X100同分布且相互独立。
由定理1可知,随机变量近似服从标准正态分布,故有[例]某种电器元件的寿命服从均值为100(单位:小时)的指数分布。
现随机抽出16只,设它们的寿命是相互独立的,求这16只元件的寿命的总和大于1 920小时的概率。
解设第i只电器元件的寿命为X i=(i=1,2,…16),E(X i)=100,D(X i)=1002=10 000,则是这16只元件的寿命的总和。
E(Y)=100×16=1 600,D(Y)= 160 000,则所求概率为:棣莫弗(De Moivre)-拉普拉斯(Laplace)中心极限定理下面介绍另一个中心极限定理,它是定理1的特殊情况。
中心极限定理
中心极限定理中心极限定理是概率论中的一个重要定理,它描述了一类独立同分布随机变量之和的极限分布特征。
本文将介绍中心极限定理的概念、数学表达式以及应用场景,并探讨其原理和证明过程。
一、中心极限定理的概念中心极限定理是概率论的核心内容之一,它表明在一定条件下,当独立同分布随机变量的数量趋于无穷大时,它们的和的分布趋近于正态分布。
这意味着即使原始随机变量不服从正态分布,其和的分布仍然接近正态分布。
二、中心极限定理的数学表达式中心极限定理可以用数学公式表示为:若X₁, X₂, ..., Xₙ是n个独立同分布的随机变量,且具有相同的数学期望μ和方差σ²,则当n趋于无穷大时,这n个随机变量之和的标准化变量(即减去期望值再除以标准差)Zₙ=(X₁+X₂+...+Xₙ-nμ)/(√(nσ²))的极限分布为标准正态分布,即Zₙ服从N(0,1)分布。
三、中心极限定理的应用场景中心极限定理在实际应用中具有广泛的意义。
例如,在统计学中,当样本容量足够大时,可以利用中心极限定理来近似计算样本均值的抽样分布。
此外,在概率论和数理统计中,中心极限定理也被应用于估计参数的置信区间、假设检验等问题中。
四、中心极限定理的原理和证明过程中心极限定理的原理主要基于独立性和同分布的假设,并借助于大数定律和特征函数的性质进行证明。
具体证明过程较为复杂,可参考相关数学教材和概率论专业资料。
总结:中心极限定理是概率论中一项重要的结果,它描述了独立同分布随机变量和的极限分布接近于正态分布的性质。
中心极限定理在统计学和概率论的研究与应用中具有广泛的意义,并在实际问题中发挥着重要的作用。
理解中心极限定理的概念、数学表达式和应用场景,对于深入研究概率论和统计学具有重要意义。
chap5-2 中心极限定理
Q 比如, 盈利的概率要到95%, 即 1 n 0.95, 500
查表得 Q 1 n 1.645, 500 500 1.645 Q 500 n
例2
某市保险公司开办一年人身保险业务. 被保险人每年需交付保险费160元. 若一年内 发生重大人身事故,其本人或家属可获2万元赔 金. 己知该市人员一年内发生重大人身事故的 概率为0.005.现有5000人参加此项保险. 求:保险公司一年内从此项业务所得到的 总收益在20万元到40万元之间的概率.
i
5000 i 1
20 np np (1 p )
X
i
np
np (1 p )
5000
30 np } np (1 p )
5 5 i 1 P{ } 25 0.995 25 0.995 25 0.995
X
25
(1) (1) 2(1) 1 0.6826
定理1(独立同分布下的中心极限定理)
且E(Xi)= ,Var(Xi)=
Yn
设X1,X2, …是独立同分布的随机变量序列,
X
i 1
n
, i=1,2,…,则
2
i
n
的分布函数 Fn ( x) 收敛到标准正态分布函数即
n
lim Fn ( x) lim P{Yn x} -
第五章 第二节 中心极限定理
中心极限定理的客观背景 在实际问题中,常常需要考虑许多随机 因素所产生总影响.
例如:炮弹射击的落点与目标的偏差,就受 着许多随机因素的影响.
如瞄准时的误差,
空气阻力所产生的误差,
炮弹或炮身结构所引起的误差等等. 对我们来说重要的是这些随机因素的总影响.