概率与统计-中心极限定理
概率论与数理统计第五章 大数定律及中心极限定理
在100次炮击中炮弹命中的总颗数
100
X = ∑ Xk k =1
相互独立地服从同一分布,
E(Xk)=2, D(Xk)=1.52 (k=1,2,…,100)
随机变量
∑ 1
100 × 1.5
100 k =1
(
X
k
−
2)
=
1 15
(
X
−
200)
2. 伯努利定理 事件发生的频率依概率收敛于事件的概率
3. 辛钦定理 (随机变量序列独立同分布且数学期望存在)
n个随机变量的算术平均值以概率收敛于算术 平均值的数学期望。
给出了“频率稳定性”的严格数学解释. 提供了通过试验来确定事件概率的方法. 是数理统计中参数估计的重要理论依据之一.
§5.2 中心极限定理
望 E( Xk ) = µ (k = 1,2,"),则对于任意ε > 0,有
∑ lim
n→∞
P {|
1 n
n k =1
Xk
−
µ
|<
ε
}
=
1
说明
伯努利大数定理是辛钦定理的特殊情
况。n个随机变量的算术平均值以概率收敛于算
术平均值的数学期望。
三 小结
1、切比雪夫(Chebyshev)定理的特殊情况 算术平均值依概率收敛于数学期望
= 1 − P { V − 100 ≤ 0.387 } (10 12 ) 20
∫ 0.387
≈ 1−
1
e − t 2 dt
−∞ 2π
= 1 −Φ (0.387) = 0.348
所以 P{V > 105} ≈ 0.348
14级--GZ《概率与统计》_第12讲_5.1大数定律_5.2中心极限定理
§2 中心极限定理
5.2 中心极限定理
简介
中心极限定理是研究在什么条件下,独立随机变 量序列部分和的极限分布为正态分布的一系列定理 的总称。 在自然界与生产中,一些现象受到许多相互独立 的随机因素的影响,如果每个因素所产生的影响都 很微小时,总的影响可以看作是服从正态分布的。 中心极限定理就是从数学上证明了这一现象 。 它是近两个世纪概率论研究的中心问题,因此这 些定理称为中心极限定理。
P(120000 aX 60000 ) 0.9,即 P( X
由棣莫弗 - 拉普拉斯定理知,
60000 ) 0.9. a
60000 X 60 60000 a 60 P( X ) P( ) 0 . 9. a 60 9.4% 60 9.4%
5.2 中心极限定理
定理1:独立同分布中心极限定理 (变形)
P( k 1
n
X
n
k
n
当n 时 x) ( x)
n
k
X
式中
k 1
n
n
X n n 1 X X
分子分母同时除以n n k 1
k
X 近似 ~ N (0,1) 故: n
或
X ~ N (,
为什么会有这种规律性?这是由于大量试验过程中,随
机因素相互抵消、相互补偿的结果。
用极限方法来研究大量独立(包括微弱相关)随机试验
的规律性的一系列定律称为大数定律。
5.1 大数定律
弱大数定理(辛钦大数定理)
设随机变量序列 X1, X2, … 独立同分布,具有有限的 数学期望 E(Xk)=μ, k=1, 2, …,则对任给 ε >0 ,有
棣莫弗 – 拉普拉斯定理 (针对二项分布)
概率与统计:中心极限定理
案例分析—积分的蒙特卡罗计算
蒙特卡罗方法是一种计算方法,但与一般数值 计算方法有很大区别。它以概率统计理论为基础。 由于蒙特卡罗方法能够比较逼真地描述事物的特点 及物理实验过程,解决一些数值方法难以解决的问 题,因而该方法的应用领域日趋广泛。 其基本思想是:当所求问题的解是某个事件的概 率,或者是某个随机变量的期望,或与概率、数学 期望有关的量时,通过某种试验的方法,得出该事 件发生的频率,或该随机变量若干个观察值的算术 平均值,根据大数定律得到问题的解;
x n p{ X i x} ( ) n i 1
n
例1.将一颗骰子连掷100次,则点数之和不少于 300的概率是多少? 2.德莫佛-拉普拉斯中心极限定理 (De Moivre-Laplace)(p105) 设随机变量n(n=1, 2, ...)服从参数为n, p(0<p<1) 的二项分布,则
概率与统计
中心极限定理
5.2. 中心极限定理 一.依分布收敛*
设{Xn}为随机变量序列,X为随机变量,其 对应的分布函数分别为Fn(x), F(x). 若在F(x)的 连续点,有 lim F ( x ) F( x ),
则称{Xn}依分布收敛于X. 可记为
n n
Xn X.
w 现 令Yn X k , 若Yn的 标 准 化 r .v .Yn* ~ N (0, 1), k 1 n
检验员逐个检查某种产品,每查一件花10秒 时间,有的产品可能要复查一次而再花10秒时间. 假定每一件产品需复查的概率为1/2,求在8小时 内检验员能够至少检查1900件的概率. 解法一: 设Xi 为检查第i件产品所花时间,则
10 此件不需复查 Xi E ( X i ) 15, D( X i ) 25 20 此件需复查
概率与数理统计 5.3 中心极限定理.ppt
X ~ N (120, 48) (近似)
问题转化为求 a , 使
P(0 rX a) 99.9%
P(0 rX a) a / r 120 0 120 48 48
a / r 120 (17.32) 48 0
P(Xi k) p1 p k1 , p1/3 k 1,2,
(几何分布)
E( X i )
1 p
p1/ 3
3,
D(Xi )
1
p
p
2
p1/ 3
6
100
X1, X 2,, X100 相互独立, X X k
k 1
E( X ) 300, D( X ) 600
根据第二章知识若 X ~ N(, 2) 则X的标准化 随机变量
Y ( X EX ) / DX ( X ) / ~ N (0,1)
若X1, X2, …Xn为独立同分布的随机变量,
n
X i ~ N (, 2 ) ,则 X i ~ N (n, n 2 ) i 1
其标准化随机变量
X n X n1 Yn (n 1)
其中Xn是第n天该商品的价格.如果今天 的价格为100,求18天后该商品的价格 在 96 与 104 之间的概率.
解 设 X 0 表示今天该商品的价格, X 18为18
天后该商品的价格, 则
18
X18 X17 Y18 X16 Y17 Y18 X 0 Yi
0! 1!
3°用正态分布近似计算
PX 2 1 PX 2 1 PX 1
1 (1 np ) npq
概率论与数理统计 中心极限定理
每个部件的称量误差相互独立,试求机床重量的总误差的
绝对值不超过 10 kg 的概率。
作业: 第115页,习题5-2,A组:2.
则
n
近似
Xi ~ N (n, n 2 ) 或
i 1
即对任意的 x,有
n
X i n 近似
i 1
~ N (0,1)
n
Hale Waihona Puke nlimP
i 1
n
X i n n
x ( x)
例 5.2.1 为了测定一台机床的质量,把它分解成 75 个部件来称量。
第五章 中心极限定理
中心极限定理解决的问题:
n
大量的随机变量的和 X i 的近似分布是什么? i 1
结论
n
一定条件下, X i 近似服从正态分布。 i 1
一 独立同分布中心极限定理(列维-林德贝格)
设随机变量序列 X1, X 2, , X n , 独立同分布,且数学
期望和方差存在:E(Xi ) , D(Xi ) 2 (i 1,2, , n)
概率论与数理统计:中心极限定理
中心极限定理无论随机变量12,,,,n X X X 服从什么分布,当n 充分大时,其和的极限分布是正态分布,这就是我们今天要讲的中心极限定理。
定理 5.5(独立同分布中心极限定理)设随机变量12,,,,n X X X 相互独立,服从同一分布,且具有数学期望和方差2(),()0,i i E X D X μσ==>1,2,i =,则随机变量之和1ni i X =∑的标准化变量nin Xn Y μ-=∑的分布函数()n F x 对于任意X 满足2/2lim ()lim d ()n i x t n n n X n F x P x t x μΦ-→∞→∞⎧⎫-⎪⎪⎪=≤==⎬⎪⎪⎩⎭∑⎰定理 5.5表明,对于均值为,μ方差为20σ>的独立同分布的随机变量的和1ni i X =∑的标准化随机变量,不论12,,,,n X X X 服从什么分布,当n 充分大时,都有~(0,1)nin Xn Y N μ-=∑近似,从而,当n 充分大时21~(,)nii XN n n μσ=∑近似.定理5.5′ 设随机变量列12,,,,n X X X 相互独立,服从同一分布,且具有数学期望和方差2(),()0,i i E X D X μσ==>1,2,i =,令11nn i i X X n ==∑,则当n 充分大时~(0,1)N 近似,即2~(,/)n X N n μσ近似.例5.3 一盒同型号螺丝钉共有100个,已知该型号的螺丝钉的重量是一个随机变量,期望值是100 g,标准差是10 g,求一盒螺丝钉的重量超过10.2 kg 的概率.解 设i X 为第i 个螺丝钉的重量,,100,,2,1 =i Y 为一盒螺丝钉的重量,则1001,i i Y X ==∑12100,,,X X X 相互独立,由()100,i E X=10,σ= 100n =知()100()10 000,i E X E X =⨯=()100()10 000,i D X D X =⨯=由独立同分布中心极限定理,~(10000,10000)Y N 近似,{}{10 200}110 200P Y P Y >=-≤10 00010 20010 0001100100Y P --⎧⎫=-≤⎨⎬⎩⎭1(2)10.977 20.022 8.Φ≈-=-=定理5.6(李雅普诺夫定理)设随机变量 ,,,,21n X X X 相互独立,它们具有数学期望和方差2(),()0,1,2,k k k kE X D X k μσ==>=,记.122∑==nk k nB σ若存在正数δ,使得当∞→n 时,,0}|{|1122→-∑=++nk k knXE B δδμ则随机变量之和∑=n k k X 1的标准化变量nnk kn k kn k k n k k nk k n B X X D X E X Z ∑∑∑∑∑=====-=⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛-=11111μ的分布函数)(x F n 对于任意x ,满足2/211lim ()lim d ().n nk k x t k k n n n n X F x P x t x B μΦ-==→∞→∞⎧⎫-⎪⎪⎪⎪=≤==⎨⎬⎪⎪⎪⎪⎩⎭∑∑⎰ 定理5.7(棣莫佛—拉普拉斯定理)设随机变量(1,2,)~(,)(01),n n b n p p η=<<则对任意x ,有22lim d ().t x n P x t x Φ--∞→∞⎧⎫⎪≤==⎬⎪⎭⎰证明 由于n η可视为n 个相互独立、服从同一参数p 的(01)-分布的随机变量12,,,n X X X 的和,即有1nn i i X η==∑,其中(),()(1),i i E X p D X p p ==-1,2,i =,故由独立同分布中心极限定理可得22lim lim d ().n i n n t xX np P x P x t x Φ→∞→∞-⎧⎫-⎪⎪⎧⎫⎪⎪≤=≤⎬⎬⎪⎪⎭⎪⎭==∑⎰, 定理5.7表明:若随机变量n η服从二项分布,即~(,)n b n p η,则当n 充分大时,有~(0,1)npN η-近似,从而,当n 充分大时~(,(1))n N np np p η-近似例5.4 假如某保险公司开设人寿保险业务,该保险有1万人购买(每人一份),每人每年付100元保险费,若被保险人在年度内死亡, 保险公司赔付其家属1万元.设一年内一个人死亡的概率为0.005试问:在此项业务中保险公司亏本的概率有多大?保险公司每年利润不少于10万的概率是多少?解 设X 表示一年内被保险人的死亡人数,则,~(10000,0.005)X b ,于是()100000.00550,()100000.0050.99549.75E X D X =⨯==⨯⨯=由棣莫佛—拉普拉斯定理,~(50,49.75)X N 近似.保险公司亏本,也就是赔偿金额大于10 000100100⨯=万元,即死亡人数大于100人的概率所以保险公司亏本的概率为(){100}1{100}117.050P X P X P Φ>=-≤=-≈-= 这说明,保险公司亏本的概率几乎是零.如果保险公司每年的利润不少于10万元,即赔偿人数不超过90人,则保险公司每年利润不少于10万的概率为(){90} 5.671P X ≤≈Φ≈Φ=.可见,保险公司每年利润不少于10万元的概率几乎是100%.。
概率论与数理统计:中心极限定理
k 1
E(X ) 300, D(X ) 600
X ~ N (300,600) (近似)
P(280
X
320)
320 300 600
280603000
2
20 600
1
2 0.8165 1 0.5878
中心极限定理的意义
在实际问题中,若某随机变量可以看 作是有相互独立的大量随机变量综合作用 的结果,每一个因素在总的影响中的作用 都很微小,则综合作用的结果服从正态分 布.
1
x t2
e 2 dt
2
即对任意的 a < b,
lim P a Yn np b
n
np(1 p)
1
b t2
e 2 dt
2 a
Y n ~ N (np , np(1-p)) (近似)
正态分布的概率密度的图形
x
二项分布的随机变量可看作许多相互独立的0-1
分布的随机变量之和, 下面是当x-B(20,0.5)时, x的
k 1
定理2 李雅普诺夫(Liapunov)定理
设随机变量序列 X1, X 2,, X n , 相互 独立,且有有限的期望和方差:
E(Xk ) k ,
D(X k
)
2 k
0
,
k 1,2,
记
n
n
Bn2
D(X k )
2 k
k 1
k 1
若 0,
1
B 2 n
n
E(| X k
k 1
k
|2 ) n0
n
lim P k1
x
n
n
1
x t2
e 2 dt
中心极限定理
中心极限定理
这是概率与统计的一个基本定理,阐明当样本数量较大时,不管总体分布的形状如何,分布(来自具有有限方差的总体的随机样本的均值)将近似服从正态分布。
许多常用统计过程都要求数据近似为正态,但中心极限定理使您能够将这些有用的过程应用于呈强烈非正态的总体。
样本数量必须为多大取决于原始分布的形状。
如果总体分布是对称的,则样本数量为 5 即可获得较好的近似;如果总体分布非常不对称,则需要较大的样本数量– 50 或更多–。
例如,假设一个总体服从均匀分布。
左侧的均匀概率分布图表明总体是对称的,但呈强烈非正态。
但是,根据中心极限定理,此总体的样本均值的分布 (n=5) 则近似为正态,如第二个直方图所示。
此样本均值直方图包含一个叠加的正态曲线,揭示了其正态性。
均匀总体的分布来自均匀总体的 1000 个样本均值的分布 (n=5)
以下图形揭示了中心极限定理在服从指数分布的总体上的体现。
此分布既不对称也非正态,如左侧的概率分布图所示。
但是,根据中心极限定理,来自此总体的1000 个大小为 50 的样本的样本均值的分布则近似为正态,如第二个直方图所示。
此样本均值直方图包含一个叠加的正态曲线,揭示了其正态性。
指数总体的分布来自指数总体的 1000 个样本均值的分布 (n=50)。
概率论与数理统计_20_中心极限定理
练习2解答(续)
方法二:把二项分布看成多个独立 同分布的1-0分布之和,再根据中心 极限定理用标准正态分布近似计算
练习2解答(续2)
方法二续
小结:当n很大时,二项分布 B(n,p)可看成是很多独立同分布 的1-0分布之和,从而可以用正 态分布的CDF连续函数来近似原 来二项分布的CDF(离散值)。 用Mathematica作图来对比,这 个近似很优秀。
k 1 n
练习1解答
练习2
某车间有200台车床,它们独立地工作着,开工 率为0.6,开工时耗电各为1千瓦,问供电所至少要 供给这个车间多少电力才能以99.9%的概率保证 这个车间不会因供电不足而影响生产?
练习2求。
……
用Mathematica可求得 r_min = 141
n
讨论Yn的极限分布是否为标准 正态分布
独立同分布的中心极限定理 设 X1,, X n , 是独立同分布的随机变量序 列,且 EX k ,DX k 2 0, (k 1,2,) 则 { X n } 服从中心极限定理,即:
lim P{
X
k 1
n
k
n x}
n
n
则 { X n } 服从中心极限定理,即:
lim P{
X
k 1 k k 1
n
n
k
n
DX k
k 1
n
1 x} 2
e
x
t2 2
dt
中心极限定理是概率论中最著名的结果之一, 它不仅提供了计算独立随机变量之和的近似概率的 简单方法,而且有助于解释为什么很多自然群体的 经验频率呈现出钟形曲线这一值得注意的事实.
概率论与数理统计
概率论与数理统计----第五章大数定律及中心极限定理
= 1 − Φ(3.54)
=0.0002
一箱味精净重大于20500的概率为 的概率为0.0002. 一箱味精净重大于 的概率为
推论:
特别,若X~B(n,p),则当n充分大时, 特别, ~B(n 则当n充分大时,
X~N(np,npq) X~N(np,npq) np
若随机变量X~B( X~B(n, ),则对任意实数x有 ),则对任意实数 即 若随机变量X~B( ,p),则对任意实数 有
不等式证明 P{-1<X<2n+1}≥(2n+1)/(n+1)(n+1)
3. 设P{|X-E(X)|<ε}不小于 不小于0.9,D(X)=0.009.则用 不小于 则用
切比绍夫不等式估计ε的 最小值是( 切比绍夫不等式估计 的 最小值是
0.3 ).
4.(894) 设随机变量 的数学期望为 设随机变量X的数学期望为 的数学期望为µ, 标准差为σ,则由切比绍夫不等式 标准差为 则由切比绍夫不等式 P{|X-µ|≥3σ}≤( ). 1/9 5. 设随机变量X的分布律为 设随机变量 的分布律为 P{X=0.3}=0.2, P{X=0.6}=0.8, 用切比绍夫不等式估计 |X-E(X)|<0.2的概率 的概率. 的概率
1 n lim P ∑ Xi − µ < ε = 1 n→∞ n i =1
定理(贝努里利大数定律) 设每次实验中事件A发生的概率 定理(贝努里利大数定律) 设每次实验中事件A 为p,n次重复独立实验中事件A发生的次数为nA,则对任 次重复独立实验中事件A发生的次数为n 意的ε>0 意的ε>0 ,事件的频率 nA ,有 ε>
∫
+∞
−∞
概率与统计中的抽样分布与中心极限定理
概率与统计中的抽样分布与中心极限定理概率与统计学是数学中的一个重要分支,它研究的是随机事件出现的规律性。
在概率与统计学中,抽样分布与中心极限定理是两个核心概念,对于理解和应用统计学非常重要。
一、抽样分布在统计学中,我们通常不能对整个总体进行完全的数据收集和分析,因此我们需要利用样本来推断总体的信息,并作出相应的概率判断。
为了进行有关样本的概率推断,我们需要研究抽样分布。
抽样分布是指从总体中抽取多个样本,并计算各个样本所具有的某种统计量的分布。
常见的统计量有样本均值、样本比例、样本方差等。
根据中心极限定理,当样本量足够大时,这些抽样分布会呈现出一些特定的形态,如正态分布或近似正态分布。
二、中心极限定理中心极限定理是概率与统计学中的一个重要理论。
它表明,当从总体中取得足够大的样本量时,样本均值的抽样分布将近似于正态分布。
具体而言,无论总体分布如何,只要样本量足够大,样本均值的分布就会接近正态分布。
中心极限定理的重要性在于,它使得我们可以利用正态分布的性质进行统计推断。
例如,我们可以使用正态分布的性质来计算置信区间、进行假设检验等。
这为统计学的应用提供了便利。
三、应用示例下面通过一个示例来说明抽样分布与中心极限定理的应用。
假设我们关注某个国家的成年人的身高分布。
为了研究这个问题,我们在该国随机抽取了1000个成年人,并测量了他们的身高。
我们想要推断该国成年人平均身高的范围。
根据中心极限定理,由于我们的样本量足够大,样本均值的分布将近似于正态分布。
假设样本均值为μ,标准差为σ,那么根据正态分布的性质,我们可以计算样本均值的置信区间。
假设我们希望以95%的置信水平推断平均身高的范围,那么根据正态分布的性质,我们可以计算一个包含95%的置信区间,公式为:样本均值 ± 1.96 * (标准差/ √样本量)在这个例子中,我们可以根据样本的身高数据计算出样本均值和标准差,然后带入上述公式,得到一个包含95%置信水平的平均身高范围。
中心极限定理和概率统计
若{}n X 的分布函数序列{()}n F x 与X 的分布函数()F x 有,在任意连续点x ,lim ()()n n F x F x →∞=。
依概率收敛若0ε∀>,有()0n n P X X ε→∞->−−−→。
准确的表述是,0ε∀>,0δ∀>,,N n N ∃>,有()n P X X εδ-><成立(3)几乎必然收敛如果有(lim )1n n P X X →∞==。
准确的表述是,除掉一个0概率集A ,对所有的\A ω∈Ω,有lim ()()n n X X ωω→∞=成立。
这是概率空间上的点收敛。
定理1。
(切贝雪夫大数律){}n X 相互独立,且有相同的期望和方差,(不一定同分布)()n E X u =2()n D X σ=,,n ∀ 记11n n i i Y X n ==∑,则P n Y u −−→。
统计发生——事物某方面的定量记录事前是不确定的,发生后的数据由真值和误差两部分构成,εμ+=X。
X 是数据,μ是真值,ε是误差。
导致误差的原因有:1. 系统性误差:偏离真值的本质性错误,有内在原因所致;2. 随机性误差:偏离真值的偶然性错误,没有内在原因,是纯偶然因素所致。
总体就是一个特定的随机变量通过抽样,获得样本,构造样本统计量,由此推断总体中某些未知的信息从总体中抽样是自由的,且当总体数量足够大,有放回与无放回抽样区别不大,有理由认为,取得的抽样观察值是没有关系的。
所以,样本在未抽取前它们是与总体X 同分布的随机变量,且是相互独立的,称此为随机样本。
定义2。
设1,,n x x 是取自总体X 的一组样本值, 1(,,)n g x x 是Borel 可测函数,则称随机变量1(,,)n g X X 是一个样本统计量。
如果总体X 中分布函数有某些参数信息是未知的,我们用统计量1(,,)n g X X 去推断这些信息,称此问题为统计推断问题。
给样本值11(,,),(,,)N N x x x y y y ''== ,定义: (1)样本均值1(/)ni i x x n ==∑(2)样本方差2211ˆˆvar()()1ni i x x x n σ===--∑ 样本标准差ˆ..)s e e σ==(3)样本协方差 111ˆ(,)()()1ni i c o v x y xx y y n ==---∑ 样本相关系数1/2ˆ(,)ˆˆ[()()]xy covx y varx var y γ=(4)样本k 阶矩 11n kk i i A x n ==∑ 1,2,k =(5)样本k 阶中心矩 11()nk k i i B x x n ==-∑1,2,k =X 的左侧分位点F α,()()F P X F dF x ααα∞<==⎰。
概率论与数理统计§中心极限定理
• 引言 • 中心极限定理的基本概念 • 中心极限定理的证明 • 中心极限定理的应用 • 中心极限定理的扩展与推广 • 案例分析与实践应用 • 总结与展望
01
引言
主题简介
中心极限定理是概率论与数理统计中的重要概念,它描述了在独立同分布的随机 变量序列下,无论这些随机变量的分布是什么,它们的平均值的分布将趋近于正 态分布。
03
中心极限定理的证明
证明方法概述
方法一:基于特征函数的 证明
方法二:基于概率密度函 数的证明
ABCD
通过对特征函数的性质进 行分析,利用泰勒展开和 收敛性质,证明中心极限 定理。
通过分析概率密度函数的 性质,利用大数定律和收 敛定理,证明中心极限定 理。
重要极限公式
公式一: $lim_{{n to infty}} frac{S_n}{sqrt{n}} = N(0,1)$
中心极限定理的应用范围广泛,不仅限于金融、保险、医学等领域,还涉来研究的展望
01
随着大数据时代的到来,中心极限定理在处理大规模数据和复杂 随机现象方面的应用价值将更加凸显。未来研究可以进一步探索 如何优化中心极限定理的应用,提高其在实际问题中的适用性和 准确性。
02
随着数学和其他学科的交叉融合,中心极限定理与其他理 论或方法的结合应用将成为一个重要的研究方向。例如, 如何将中心极限定理与机器学习、人工智能等新兴技术相 结合,以解决更加复杂和具体的问题。
03
中心极限定理的理论基础和证明方法仍有进一步完善的空 间。未来研究可以深入探讨中心极限定理的数学原理,发 现新的证明方法和技巧,推动概率论与数理统计理论的进 一步发展。
07
总结与展望
概率论中心极限定理
如果X 是连续型随机变量.=≥-}|)X (E X {|P ε()dx x |)X (E x |⎰≥-εϕ()()dx x )X (E x |)X (E x |⎰≥--≤εϕε22()()⎰∞+∞--≤dx x )X (E x ϕε222εDX=思考题解答:本课程的主要内容:中心极限定理:1.李雅普诺夫定理;2.推论:独立同分布定理;3.拉普拉斯定理(独立同分布定理推论);4.拉普拉斯局部极限定理;抽样分布:设ΛΛn X ,X ,X 21是相互独立的随机变量有期望值i i EX α=及方差+∞<=2ii DX σ()Λ21,i =若每个i X 对总和∑=ni iX 1的影响不大.一.定理5.3: (李雅普诺夫定理)11()()n i i n i i E X x D X =→∞=⎫⎪⎪≤=⎬⎪⎪⎭∑∑2212tx e dt π--∞⎰()x Φ=1121lim n n i i i i n n i i X a P x σ===⎧⎫-⎪⎪⎪⎪≤=⎨⎬⎪⎪⎪⎪⎩⎭∑∑∑}{lim 1x nn XP ni in ≤-∑=∞→σμ⎰∞=x-2t -dt e 212π设X 1,X 2, …是独立同分布的随机变量序列,且E (X i )= ,D (X i )= ,i =1,2,…,则2σμ列维一林德伯格(Levy -Lindberg )定理.推论(独立同分布下的中心极限定理)请看演示中心极限定理的直观演示说明:在定理条件下:()()11~0,1nii Xn N nμσ=-∑()12~ni i X =∑()2,N n n μσ和函数的正态性;()11~0,1/ni i X n N nμσ=-∑算术均值的正态性;或()113~ni i X n =∑2,N n σμ⎛⎫⎪⎝⎭n 较大的情况下,一般n>30;例3在一个罐子中,装有10个编号为0-9的同样的球,从罐中有放回地抽取若干次,每次抽一个,并记下号码.问对序列{X k },能否应用大数定律?诸X k 独立同分布,且期望存在,故能使用大数定律.解: ,9.01.001~⎭⎬⎫⎩⎨⎧k X k =1,2, …E (X k )=0.1,⎩⎨⎧=否则次取到号码第001k X k (1) 设,k =1,2, …∑=∞→=<-nk k n X n P 11}|1.01{|lim ε即对任意的ε>0,解: ,9.01.001~⎭⎬⎫⎩⎨⎧k X k =1,2, …E (X k )=0.1,诸X k 独立同分布,且期望存在,故能使用大数定律.(2) 至少应取球多少次才能使“0”出现的频率在0.09-0.11之间的概率至少是0.95?解:设应取球n 次,0出现频率为∑=nk k X n 11,n .)X (E nk k 101=∑=n.)X (D nk k 0901=∑=由题可知:95011010901.}.X n .{P nk k ≥≤≤∑=由中心极限定理近似N (0,1)nnX nk k 3.01.01-∑=nX n nk k 3.01.011-=∑=}11.0109.0{1≤≤∑=nk k X n P 1)30(2-≈n ΦnX n nk k 3.01.011-∑=近似N (0,1)}n/...n /..X n n /...{P n k k 30101103010130100901-≤-≤-=∑=}n n/..X n n {P nk k 3030101301≤-≤-=∑=95.01)30(2≥-n Φ欲使975.0)30(≥n Φ即96.130≥n 查表得从中解得3458≥n 即至少应取球3458次才能使“0”出现的频率在0.09-0.11之间的概率至少是0.95.(3) 用中心极限定理计算在100次抽取中,数码“0”出现次数在7和13之间的概率.解:在100次抽取中, 数码“0”出现次数为∑=1001k k X 3101001-∑=k k X 即近似N (0,1)由题:所求概率为:∑=≤≤1001)137(k k X P =⎪⎪⎭⎫ ⎝⎛∑=1001k k X E 1010100=⨯.=⎪⎪⎭⎫ ⎝⎛∑=1001k k X D 9090100=⨯.即在100次抽取中,数码“0”出现次数在7和13之间的概率为0.6826.∑=≤≤1001)137(k k XP =0.68263101001-∑=k k X近似N (0,1))13101(1001≤-≤-=∑=k k X P )1()1(-Φ-Φ≈1)1(2-Φ=例1 根据以往经验,某种电器元件的寿命服从均值为100小时的指数分布. 现随机地取16只,设它们的寿命是相互独立的. 求这16只元件的寿命的总和大于1920小时的概率.由题给条件知,诸X i 独立,同分布.16只元件的寿命的总和为∑==161k kX Y 解: 设第i 只元件的寿命为X i , i =1,2, …,16E (X i )=100, D (X i )=10000依题意,所求为P (Y >1920)由于E (Y )=1600,D (Y )=160000由中心极限定理,近似N (0,1)4001600-Y P (Y >1920)=1-P (Y ≤1920)).(801Φ-≈=1-0.7881=0.2119⎪⎭⎫ ⎝⎛-≤--=4001600192040016001Y P ⎪⎭⎫ ⎝⎛≤--=8040016001.Y P})1({lim x p np np Y P n n ≤--∞→设随机变量服从参数n, p (0<p <1)的二项分布,则对任意x ,有n Y dte xt ⎰∞--=2221π定理表明,当n 很大,0<p <1是一个定值时(或者说,np (1-p )也不太小时),二项变量的分布近似正态分布N (np ,np (1-p )).n Y 二.定理(棣莫佛-拉普拉斯定理)例:一复杂的系统由100个相互独立起作用的部件组成,在整个运行期间每个部件损坏的概率为0.1,为使整个系统起作用,至少必须有85个部件正常工作求整个系统起作用的概率一复杂的系统由n 个相互独立起作用的部件所组成,每个部件的可靠性为0.9,且必须至少有80%的部件工作才能使整个的系统正常工作,问n 至少为多大才能使系统的可靠性不低于0.95?解:设100中个正常工作数为X,()~100,0.9X B ()85P X ≥=()185P X -<851000.911000.90.1-⨯⎛⎫=-Φ ⎪⨯⨯⎝⎭()1 1.67=-Φ-=0.95252) X~B(n, 0.9)()0.80.95P X n ≥≥()10.80.95P X n -<≥0.80.90.050.90.1n n n -⨯⎛⎫Φ≤ ⎪⨯⨯⎝⎭21.640.0924.20.01n ⨯=≈由题意可知即:()0.80.05P X n <≤0.90.8 1.960.90.1n n n -⨯≈⨯⨯查表得:解方程:至少25件.例2. (供电问题)某车间有200台车床,在生产期间由于需要检修、调换刀具、变换位置及调换工件等常需停车. 设开工率为0.6, 并设每台车床的工作是独立的,且在开工时需电力1千瓦.问应供应多少瓦电力就能以99.9%的概率保证该车间不会因供电不足而影响生产?设需要x千瓦电力.由题意得:()999≤0.P≥Xx用X 表示在某时刻工作着的车床数,解:对每台车床的观察作为一次试验,每次试验观察该台车床在某时刻是否工作,工作的概率为0.6,共进行200次试验.依题意,X ~B (200,0.6),现在的问题是:P (X ≤x )≥0.999的最小的x .求满足设需x 千瓦电力,(由于每台车床在开工时需电力1千瓦,x 台工作所需电力即x 千瓦.)由德莫佛-拉普拉斯极限定理)1(p np npX --近似N (0,1),于是P (X ≤x )= P (0≤X ≤x )这里np =120,np (1-p )=48)()x (4812048120---≈ΦΦ)x (48120-≈Φ查正态分布函数表得由≥0.999,)x (48120-Φ从中解得x ≥141.5,即所求x =142.(千瓦)也就是说, 应供应142 千瓦电力就能以99.9%的概率保证该车间不会因供电不足而影响生产.999.0)1.3(=Φ48120-x ≥3.1,故三.定理5.4(拉普拉斯局部极限定理)当时,n →∞()P X k =≈()2212k n p n p qen p qπ--01()k np npqnpqϕ-=例:10部机器独立工作,每部停机得概率为0.2,求3部机器同时停机的概率?解:设10部中同时停机的数为X,()~10,0.2X B ()3P X ==013100.2()100.20.8100.20.8ϕ-⨯⨯⨯⨯⨯01(0.79)1.265ϕ==0.2308统计量既然是依赖于样本的,而后者又是随机变量,故统计量也是随机变量,因而就有一定的分布,这个分布叫做统计量的“抽样分布”.§7.4几个常用统计量的分布主要介绍正态总体下的统计量的分布.设总体X ()2σμ,N ~()n X ,X ,X Λ21是总体X 的一个样本.由此构成的样本函数:∑==ni iX n X 11()∑=--=ni i X X n S 12211它们服从什么分布?()n,,i ,N ~X i Λ212=σμ一.关于样本均值的分布的定理设X 1,X 2,…,X n 是取自正态总体),(2σμN 的样本,则有),(~2nN X σμ)1,0(~N nX σμ-(1)(2)令U=)1,0(~N nX σμ-U-分布的临界值:它是指在一定的概率之下,随机变量取值落入某一区间内的区间上限或下限.例:P{ξ≤λ}=α,λ称为U 分布的临界值λα已知α的值可查表求临界值λ.即:由左边面积求U 的临界值二.关于样本方差S 2的分布定理(一)()2n χ分布()2n χ分布的密度函数为()1222102(2)00n x n x e x f x n x --⎧≥⎪=Γ⎨⎪<⎩来定义.1>=⎰∞--r ,dx e x )r (x r Γ其中伽玛函数通过积分)r (ΓE (X )=n , D (X )=2n演示χ2 分布()2n χ分布的上分位点:α2()n αχ例如:0.1,25n α==20.1(25)χ=34.4 当n 充分大时,有费歇(R.A.Fisher)公式:()221()212n z n ααχ≈+-例如:20.05(50)χ≈()21 1.65992+=67.28定理2.1: 设相互独立, 都服从标准正态分布N (0,1), 则随机变量:服从的分布为自由度为n 的分布.n X X X ,,,21Λ222212nX X X +++=Λχ2χ(0,1)N 定理2.2:设相互独立, 都服从标准正态分布n X X X ,,,21Λ则(二)标准正态分布下平方和分布定理∑==n i i X n X 11(1) 与()∑=-ni i X X 12相互独立.(2) ()21~ni i X X=-∑()21n χ-作业:1.预习:抽样分布2. 练习P116 7---163思考题:A组:甲乙两个戏院在竞争1000名观众,假定每个观众完全随机地选择一个戏院,且观众之间选择是彼此独立的,问每个戏院应该设有多少个座位才能保证因缺少座位而使观众离去的概率小于1%?B组:总结算术平均的分布.X。
《概率论与数理统计》5-1 中心极限定理
例5. 为了测定一台机床的质量, 将其分解成若干个部件 来称量. 假定每个部件的称量误差(单位: kg )服从区 间 1,1 上的均匀分布, 且每个部件的称量是独立的, 试 问至多分成多少个部件才能以不低于99%的概率保证 机床的称量总误差的绝对值不超过10.
1.55 1.55
2 1.55 1 0.8788.
例3. 有一批钢材, 其中80%的长度不小于3m, 现从钢材 中随机取出100根, 试利用中心极限定理求小于3m的钢 不超过30根的概率. 解 以Yn 为100根钢材中小于3m的钢材根数, 由题意知:
1 E X p, D X p 1 p n
定理5.3 独立同分布情形下大数定律
设
X1 , X 2 ,
是一个独立同分布的随机变量序列. 且
P E X , D X 2 . 则 X
证明关键步骤:
1 2 E X , D X n
Yn
B 200,0.15 .
Y np N 30 0.95, P Yn N P n np 1 p 25.5 N 30 查表得: 1.645, 即: N 38.3068, 所以可取
25.5
N 39方能以95%的把握保证在该时刻分机可以使用外
在§1.3中, 我们曾经提到频率的稳定性. 设随机事件A的概率P(A)=p, 在n重贝努利试验中事件A 发生的频率为 f n A .当n很大时, 将与p非常接近. 由 于 f n A 本质上是一个随机变量,它随着不同的n次试 验可能取不同的值, 因而需要对随机变量序列引进新 的收敛性定义.
东华大学《概率论与数理统计》课件 第五章 大数定律与中心极限定理
7 8.75E-06 6.2863E-05 7.19381E-05 7.28862E-05 7.2992E-05
8 3.65E-07 7.3817E-06 8.93826E-06 9.1053E-06 9.124E-06
4 0.01116 0.01494171 0.015289955 0.015324478 0.01532831
5 0.001488 0.00289779 0.003048808 0.003063976 0.00306566
6 0.000138 0.00046345 0.0005061 0.000510458 0.00051094
ln n) + 1 ( 2
ln n) = 0
Dn
=
E
2 n
=
1 2
(ln n) +
1 2
(ln n)
=
ln n
→
但 1
n2
n
D( i ) =
i =1
1 n2
n i =1
Di
=
1 n2
n
ln i
i =1
1 n2
n
ln n =
i =1
ln n n
→0
满足马尔可夫条件,{
}服从大数定律
n
注意: 辛钦大数定律只要求一阶矩存在,但是 随机变量序列是独立同分布的. 若所讨论的 随机变量序列是不服从同分布的要求或不独 立可应用切比雪夫大数定律 或者马尔可夫大 数定律 .
(2)设 n 为 n 次独立重复试验中 A 出现的次数, p 是事件 A 在每次试验中出现的概率, 0 ,
则
lim
n→
P{
n
n
−
p
概率论与数理统计 6.2 中心极限定理
则X~B(n,0.005), 近似地,X ~ N(0.005n,0.005 0.995n)
PX 5 1 PX 5
1
P
X 0.005n
5 0.005n
0.005 0.995n 0.005 0.995n
1
5 0.005n 0.005 0.995n
0.005n 5
0.005
近似地,X ~ N(10000 0.005,10000 0.0050.995)
即 X ~ N(50,49.75), 设死亡人数超过k人的概率小于0.003,
PX k 1 PX k
1
P
X
50
49.75
k 50 49.75
1
k 50 49.75
0.003
k 50 49.75
( x)
2
n
Xi n
定理表明,n足够大时,r.v. i1
近似服从N (0,1),
n
注意到E n X i n, D n X i n 2 ,
i1
i1
n
从而 X i近似服从 N (n , n 2 ). i 1
中心极限定理是概率论中最重要的一类极限定理,此定 理告诉我们,在一定条件下,相互独立的随机变量之和在个 数很多时近似服从正态分布,揭示了为什么正态分布是最
P( i1 n/3
3n) 2( 3n ) 1
(2)当n 36, 1时, 所求概率为
6
P(
1 36
36 i 1
Xi
a
1) 2(1.732) 1 0.92 6
(3)要求n, 使得
P(
1 n
n i 1
Xi
a
) 2(
3n ) 1 0.95
概率论与数理统计52中心极限定理
Xi E Xi
i 1
i1
n
i 1
Xi n n
D Xi
i1
的分布函数 Fn ( x) 对于任意 x 满足
lim
n
Fn
(
x
)
lim
n
P
n i 1
Xi n n
x
x
1
t2
e 2 dt ( x).
2π
定理表明
n
Xi n
i 1
~ N (0,1);
n
n
Xi ~ N (n, n 2 )
1
2 4.36 1 0.99999.
注:与切比雪夫不等式估算的结果相比较--精确得多
例2 一船舶在某海区航行, 已知每遭受一次海浪 的冲击, 纵摇角大于 3º的概率为1/3, 若船舶遭受 了90 000次波浪冲击, 问其中有29 500~30 500次 纵摇角大于 3º的概率是多少?
解 将船舶每遭受一次海
解 设 X 为一年中投保老人的死亡数, 则
X ~ b(n, p),
其中 n 10000, p 0.017,
由德莫佛-拉普拉斯中心极限定理知,
保险公司亏本的概率
P{10000X 10000 200} P{X 200}
30 500 np(1
np p)
29 500 np(1
np p)
n 90000, p 1 , 3
P{29 500 X 30 500} 5 2 5 2
2 2 0.9995.
例3 某保险公司的老年人寿保险有1万人参加, 每 人每年交200元. 若老人在该年内死亡, 公司付给家 属1万元. 设老年人死亡率为0.017, 试求保险公司在 一年内的这项保险中亏本的概率.
《概率论与数理统计》课件第五章大数定律及中心极限定理
4.大样本统计推断的理论基础
是什么?
大数定律中心极限定理
随机现象中平均结果的稳定性
大数定律的客观背景
大量抛掷硬币正面出现频率
字母使用频率
生产过程中的废品率
§5.1 大数定律
背景:1. 频率稳定性2. 大量测量结果算术平均值的稳定性
回顾
随机现象的主要研究方法
概率分布
01
证:_x001A__x001B__x001B_,_x001A__x001B__x001B_,⋯, _x001A__x001B__x001B_, ⋯相互独立同分布,则_x001A__x001B__x001B__x001B_,_x001A__x001B__x001B__x001B_, ⋯,_x001A__x001B__x001B__x001B_, ⋯也相互独立同分布,由辛钦大数定律得证.
第五章 大数定律及中心极限定理
§5.1 大数定律§5.2 中心极限定理
要点:用切比雪夫不等式估算概率独立同分布,用中心极限定理计算对于二项分布,当n很大时,计算
本章要解决的问题
1.为何能以某事件发生的频率
作为该事件的概率的估计?
2.为何能以样本均值作为总体
期望的估计?
3.为何正态分布在概率论中占
解:(1)设X表示一年内死亡的人数,则~(, ),其中=,=.%. 设Y表示保险公司一年的利润,=×−.需要求的是_x001A_<_x001B_.
由中心极限定理
_x001A_<_x001B_=_x001A_×−<_x001B_ =_x001A_>_x001B_=−_x001A_≤_x001B_
且,
由中心极限定理
解:设为第i个螺丝钉的重量, 相互独立同分布. 于是,一盒螺丝钉的重量为
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
X
i 1
n
i
n
2
n
n
N 0,1
因此:
X i n i 1 P b b n
定理5.5 独立同分布的中心极限 设 X1, X 2 ,, X n , 是独立同分布的随机变量序列, 且
E X i p, D X i 2 0
则对任意的 x x , 有
i 1, 2, ,
n X i np lim P i 1 x x . n n
应 用 当 n 充 分 大 时
P a Xi b i 1 n a n X i n b n i 1 P n n n 2
之间的概率.
解 以 Yn 表示300件产品中次品的总数, 由题意得
1 Yn B 300, , 6 250 此时, np 50, np 1 p , 由中心极限定理得 6 40 50 Yn np 60 50 P 40 X 60 P 250 / 6 250 / 6 np 1 p
X np P 2.326 0.99. np 1 p X 300 2.326 20 4
即: 只要供应 320Q 瓦的电力, 就能以99%的把握保证该
车间的机器能正常工作.
例5. 为了测定一台机床的质量, 将其分解成若干个部件 来称量. 假定每个部件的称量误差(单位: kg )服从区
则
解
以 Yn 为100根钢材中小于3m的钢材根数, 由题意知:
0 20 Yn np 30 20 P 0 Yn 30 P 4 4 np 1 p 2.5 5 0.9938.
例4. 设一个车间有400台同类型的机床, 每台机床需用 电 Q 瓦, 由于工艺关系, 每台机器并不连续开动, 开动的
p 0.75,
及 Yn B 400,0.75 , 因 n 400, 由中心极限定理知, 对 任意的 x, 有
Y np P n x x, np 1 p
由条件所设, 所求的概率为
x 0.99.
而 x 为标准正态分布的分布函数, 查表得 x 2.326. 即:
间 1,1 上的均匀分布, 且每个部件的称量是独立的, 试
问至多分成多少个部件才能以不低于99%的概率保证 机床的称量总误差的绝对值不超过10. 解 以 X i 表示第 i 个部件的称量误差, 设分成n个部件
从而
X i R 1,1. 1 2 0, , 3
n X i n n 10 0 P X i 10 P i 1 n n3 i 1 10 0 2 1 0.99 n3 2 10 10 0 u0.995 2.576 所以 n 3 45 n3 2.576
时候只占工作总时间的 3/ 4, 问应该供应多少瓦电力能
99%的概率保证该车间的车床能正常工作.(假定在工作 期内每台机器是否处于工作状态是相互独立的) . 解 令Yn 表示在时刻 t 时正在开动的机器数, 则Yn 可以表
A ”发生的 示在400次相互独立的重复实验试验中事件“ 次 数, 由前面所讨论的知:
Y np 1 n lim P x n np 1 p 2
即当 n 充分大时,
np 1 p Yn np
x
e
t2 2
dt ,
近似服从标准正态分布.
例2. 在次品率为1/6的一大批产品中, 任意取出300件产 品, 利用中心极限定理, 计算抽取的产品中次品数在40到60
1200
解
设第i 段的测量误差为 X i , 所以累计误差为
X ,
i 1 i
又 X1, X 2 ,, X1200 为独立同分布的随机变量, 由
X i R 0.5,0.5
得
1 E X i 0, D X i , 12
i 1, 2,,1200 .
由独立同分布情形下的中心极限定理:
2 1 2 0.0456.
定理5.5中限定条件得到如下定理5.6
定理 5.6 设 X1, X 2 ,, X n 是一个独立同分布的 随机变量序列,且 Xi
B 1, p ,
n i 1
令
Yn X i ,
则对任意的 x x , 有
1.55 1.55
2 1.55 1 0.8788.
例3. 有一批钢材, 其中80%的长度不小于3m, 现从钢材 中随机取出100根, 试利用中心极限定理求小于3m的钢
不超过30根的概率.
Yn B 100,0.2 , np 20, np 1 p 16,
n
b n a n n n
例1 某人要测量甲、乙两地的距离, 限于测量工具, 他 分成1200段进行测量, 每段测量误差(单位: 厘米)服从
区间 0.5,0.5上的均匀分布, 试求总距离测量误差的
绝对值超过 20 厘米的概率.
n P X i 20 P i 1
X i n 20 i 1 n 1 1200 12
n
1 P
X i n i 1 2 n
n
1 2 2