概率论与数理统计中心极限定理
第47讲 中心极限定理
概率论与数理统计主讲:四川大学四川大学第47讲中心极限定理1§5.2 中心极限定理四川大学第47讲中心极限定理3第47讲中心极限定理四川大学四川大学第47讲中心极限定理4中心极限定理的概念Central Limit Theorems四川大学第47讲中心极限定理5在客观实际中有许多随机变量,它们是由大量相互独立的随机因素的综合影响所形成,而其中每一个别因素在总的影响中所起的作用是微小的。
这种随机变量往往近似地服从正态分布。
这种现象就是中心极限定理的客观背景。
本节将用中心极限定理来说明这种现象。
四川大学中心极限定理是说:在一定条件下,充分多的相互独立的随机变量的算术平均值将服从正态分布,不管这些随机变量本身服从什么分布。
四川大学四川大学第47讲中心极限定理6本节介绍了三个中心极限定理1. 列维-林德伯格定理(独立同分布的中心极限定理)2. 李雅普诺夫定理(独立不同分布的中心极限定理)自学3. 棣莫弗-拉普拉斯定理(二项分布的极限分布)四川大学四川大学四川大学第47讲中心极限定理7列维-林德伯格定理独立同分布的中心极限定理四川大学第47讲中心极限定理8四川大学第47讲中心极限定理17Jarl Waldemar Lindeberg 1876–1932芬兰数学家Paul Pierre Lévy1886-1971法国数学家Lévy法国数学家。
现代概率论开拓者之一,他在巴黎出生。
第一次世界大战期间,莱维是法国炮兵进行数学分析工作。
1920年,他被任命为在Ecole理工学院,在那里他的学生包括蒙德布罗特分析。
他留在莱维主要研究概率论和泛函分析。
他引入分布律的莱维距离、散布函数和集结函数、鞅、局部时等概念,对极限理论和随机过程理论作出了重要贡献。
概率论中的莱维过程(Lévy processes),莱维测度(Lévy measure),莱维分布(Lévy distribution) 等都是以其命名。
概率论与数理统计第五章大数定律及中心极限定理
概率论与数理统计第五章大数定律及中心极限定理课前导读概率论是研究大量试验后呈现出的统计规律性的一门理论。
数学中研究大量的工具是极限。
因此这一章学习概率论中的极限定理。
第一节大数定律随着试验次数的增大,事件的频率逐步稳定到事件的概率。
意味着随着试验次数的增多,在其中一种收敛意义下,频率的极限是概率。
大数定律解释了这一结论。
首先介绍切比雪夫不等式。
一、切比雪夫(Chebyshev)不等式随机变量X的取值总是围绕着其期望变动,若X的分布已知时,可以计算事件\{,X-E(X),\geq \epsilon \}的概率。
切比雪夫不等式:对切比雪夫不等式的直观理解:方差越小,X在其期望附近取值的密集程度越高,原理期望的区域的概率上加越小。
进一步说明了方差的概率意义,方差时随机变量取值与其中心位置的偏离程度的一种度量指标。
当随机变量X的分布未知时,可由X的观测数据估计得到X的期望和方差,然后使用切比雪夫不等式估计X关于E(X)的偏离程度。
二、依概率收敛随机变量序列即由随机变量构成的一个序列。
不能用类似定义数列极限的方式定义随机变量序列的极限,因为序列中的每一个元素X_n是随机变量,取值不确定,不可能和一个常数c的距离任意小。
只能说一些事件A发生的频率f_n(A)收敛到A的概率P(A)。
依概率收敛的定义:定理2:三、大数定律三个大数定律:切比雪夫大数定律、辛钦大数定律和伯努利大数定律。
注意这三个大数定律的条件有何异同。
定理3 切比雪夫大数定律:若随机变量序列相互不相关,方差存在且一致有上界,当n充分大时,随机序列的前n项的算术平均值和自身的期望充分接近几乎总是发生的。
定理4 相互独立同分布的大数定律(辛钦大数定律):辛钦大数定律为算术平均值法则提供了理论依据。
伯努利大数定律:伯努利大数定律是相互独立同分布大数定律的特例,限定分布为两点分布。
伯努利大数定律体现了:随着试验次数的增大,事件的频率逐步稳定到时间的概率,这里的稳定即为依概率收敛。
概率论与数理统计(浙大版)第五章第六章课件大数定律和中心极限定理
Yn x
lim P i1 n
n
x
x
证明略。
在实用上,n≥30
1
t2
e 2 dt
2
此定理表明,当n充分大时,Yn近似服从N 0,1.
n
即: X(i 近似)~N (n, n 2 ), i=1
从而,P(a
n i 1
Xi
b)
(b n ) ( a n ).
n
n
答案:N (, 2 )
关键词: 总体 个体 样本 统计量
2 分布 t 分布 F 分布
23
引言:数理统计学是一门关于数据收集、整理、分析 和推断的科学。在概率论中已经知道,由于大 量的 随机试验中各种结果的出现必然呈现它的 规律 性,因而从理论上讲只要对随机现象进行 足够多次观察,各种结果的规律性一定能清楚 地呈现,但是实际上所允许的观察永远是有限 的,甚至是 少量的。 例如:若规定灯泡寿命低于1000小时者 为次 品,如何确定次品率?由于灯泡寿命试验是 破坏性试验,不可能把整批灯泡逐一检测,只 能抽取一部分灯泡作为样本进行检验,以样本 的信 息来推断总体的信息,这是数理统计学研 究的问题之一。
24
§1 总体和样本
总体:研究对象的全体。如一批灯泡。 个体:组成总体的每个元素。如某个灯泡。 抽样:从总体X中抽取有限个个体对总体进行观察的取值过程。 随机样本:随机抽取的n个个体的集合(X1,X2,…,Xn), n为样本容量 简单随机样本:满足以下两个条件的随机样本(X1,X2,…,Xn)称
2. 用泊松分布近似计算
np 400 0.02 8 查表得
P X 2 1 P X 0 P X 1 1 0.000335 0.002684 0.9969
中心极限定理
概率论与数理统计第四章正态分布§13 中心极限定理暨南大学电气信息学院苏保河主讲第四章正态分布§13 中心极限定理主要内容一、林德伯格—莱维中心极限定理二、棣莫弗—拉普拉斯中心极限定理三、李雅普诺夫中心极限定理暨南大学电气信息学院苏保河主讲例1炮火轰击敌方防御工事100 次, 每次轰击命中的炮弹数服从同一分布, 其数学期望为2, 均方差为1.5. 若各次轰击命中的炮弹数是相互独立的, 求100 次轰击(1)至少命中180发炮弹的概率;(2)命中的炮弹数不到200发的概率.一、林德伯格—莱维中心极限定理解设X k 表示第k 次轰击命中的炮弹数,2()2,() 1.5,1,,100,k k E X D X k ==="相互独立,12100,,,X X X "苏保河主讲设X 表示100 次轰击命中的炮弹数, 由独立同分布的中心极限定理, 例1 解(续1)2()2,() 1.5,k k E X D X ==苏保河主讲1001,k k X X ==∑则2()200,()15,E X D X ==~(200,225).X N 近似地有{180}P X ≥1((180200)/15)Φ≈−−(1.33)Φ=(1)至少命中180发炮弹的概率;1( 1.33)Φ=−−0.9082.=1{180}P X =−<设X 表示100 次轰击命中的炮弹数, 由独立同分布的中心极限定理,例1 解(续2)2()2,() 1.5,k k E X D X ==苏保河主讲1001,k k X X ==∑则()200,()225,E X D X ==2~(200,15).X N 近似地有(2)命中的炮弹数不到200发的概率.{0200}P X ≤<((200200)/15)((0200)/15)ΦΦ≈−−−(0)(13.33)ΦΦ=−−0.5000.=例2检验员逐个检查某产品, 每查一个需用10秒钟. 但有的产品需重复检查一次,再用去10 秒钟. 若产品需重复检查的概率为0.5, 求检验员在8 小时内检查的产品多于1900 个的概率.解在8 小时内检查的产品多于1900 个,即检查1900 个产品所用时间小于8 小时.设X为检查1900 个产品所用的时间(秒),设Xk 为检查第k个产品所用的时间(单位为秒), k= 1, 2, …, 1900.苏保河主讲例3某车间有200 台车床独立地工作,开工率为0.6, 开工时每台耗电为r 千瓦.问供电所至少要供给这个车间多少电力,才能以99.9% 的概率保证这个车间不会因供电不足而影响生产?解设至少要供给该车间a千瓦的电力, X为开工的车床台数, 则X~ B(200, 0.6),由棣莫弗—拉普拉斯中心极限定理,X~ N(120, 48) (近似),欲求a, 使{0}99.9%.P rX a≤≤=苏保河主讲李雅普诺夫中心极限定理的意义如果随机变量X 可以看成许多相的总和,互独立的起微小作用的因素Xk则X 服从或近似服从正态分布.苏保河主讲苏保河主讲1. 离散型随机变量的数学期望第三章内容小结定义1设X 是离散型随机变量, 其分布律是P {X = x k } = p k (k = 1, 2, …),如果收敛, 定义X 的数学期望1||k k k x p ∞=∑1()k k k E X x p ∞==∑一、数学期望2. 连续型随机变量的数学期望定义2设X 是连续型随机变量,()()d E X x f x x∞−∞=∫收敛, 定义X 的数学期望||()d x f x x ∞−∞∫其密度函数为f (x ), 如果苏保河主讲4. 数学期望的性质1.设C 是常数, 则E (C ) = C .4.设X , Y 独立, 则E (XY ) = E (X )E (Y ).2.若k 是常数, 则E (kX ) = kE (X ).3.E (X 1 + X 2) =E (X 1) + E (X 2).条件: X 1,X 2, …, X n 相互独立.11()().n n i i i i i i E C X C E X ===∑∑推广:11()().n n i i i i E X E X ===∏∏推广:苏保河主讲3. 方差的性质1)设a 是常数, 则D (a ) = 0.2)若a 是常数, 则D (aX ) = a 2D (X ).4)若X 1 与X 2相互独立, 则D (X 1±X 2) = D (X 1) + D (X 2).推广:若X 1, X 2, …, X n 相互独立, 则11[](),n ni i i i D X D X ===∑∑211[]().n n i i i i i i D C X C D X ===∑∑3)若a , b 是常数, 则D (aX + b ) = a 2D (X ).苏保河主讲4. 协方差的定义定义对于二维随机变量(X, Y),称E{[X-E(X)][Y-E(Y)]} 为X与Y 的协方差, 记为Cov(X, Y), 即Cov(X, Y) = E{[X-E(X)][Y-E(Y)]}.5. 协方差的计算公式Cov(X,Y)=E(XY)–E(X)E(Y)推论: 若X 与Y 独立, 则Cov(X,Y) = 0.苏保河主讲6. 协方差的性质(1)Cov(X,Y)=Cov(Y,X)(2)Cov(aX,bY)=ab Cov(X,Y), a,b是常数(3)Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)苏保河主讲若X 1, X 2, …, X n 两两独立, 则D (X +Y ) = D (X )+D (Y )+2Cov(X , Y )7. 随机变量和的方差与协方差的关系11()().n ni i i i D X D X ===∑∑11()()2Cov(,)n ni i i j i i i j D X D X X X ==<=+∑∑∑苏保河主讲9. 相关系数的性质2)|| 1.XY ρ≤0,XY ρ=1) X 和Y 独立时但其逆不真.定义对于随机变量X , 如果E (X k )( k = 1, 2, …) 存在, 则称它为X 的k 阶原点矩或k 阶矩.10. 矩和中心矩如果E {[X -E (X )]k } ( k = 1, 2, …) 存在, 则称它为X 的k 阶中心矩.苏保河主讲三、切比雪夫不等式与大数定理1. 马尔科夫不等式2. 切比雪夫不等式3. 切比雪夫大数定理4. 独立同分布下的大数定理5. 伯努利大数定理苏保河主讲用X 表示n 重伯努利试验中事件A 出现(成功)的次数, 其分布律称r.v. X 服从参数为n 和p 的二项分布, 注当n = 1 时, 称X 服从参数为p 的伯努利分布,或0-1 分布.1. 二项分布{}(1),k k n k n P X k C p p −==−0,1,,k n ="记作X ~ B (n , p ).苏保河主讲四、几个重要的随机变量苏保河主讲(),()(1).E X np D X np p ==−如果X ~ B (n , p ),结论:{}(1),k k n k n P X k C p p −==−0,1,,,k n ="2. 超几何分布定义将N个元素分为2 类, M个属于第一类, N-M个属于第二类, 从中按不放回抽样随机取n个元素. 令X表示这n 个元素中第一类元素的个数, 则称X服从超几何分布, 记为X h n N M~(,,)苏保河主讲。
概率论与数理统计 中心极限定理
每个部件的称量误差相互独立,试求机床重量的总误差的
绝对值不超过 10 kg 的概率。
作业: 第115页,习题5-2,A组:2.
则
n
近似
Xi ~ N (n, n 2 ) 或
i 1
即对任意的 x,有
n
X i n 近似
i 1
~ N (0,1)
n
Hale Waihona Puke nlimP
i 1
n
X i n n
x ( x)
例 5.2.1 为了测定一台机床的质量,把它分解成 75 个部件来称量。
第五章 中心极限定理
中心极限定理解决的问题:
n
大量的随机变量的和 X i 的近似分布是什么? i 1
结论
n
一定条件下, X i 近似服从正态分布。 i 1
一 独立同分布中心极限定理(列维-林德贝格)
设随机变量序列 X1, X 2, , X n , 独立同分布,且数学
期望和方差存在:E(Xi ) , D(Xi ) 2 (i 1,2, , n)
概率论与数理统计:中心极限定理
中心极限定理无论随机变量12,,,,n X X X 服从什么分布,当n 充分大时,其和的极限分布是正态分布,这就是我们今天要讲的中心极限定理。
定理 5.5(独立同分布中心极限定理)设随机变量12,,,,n X X X 相互独立,服从同一分布,且具有数学期望和方差2(),()0,i i E X D X μσ==>1,2,i =,则随机变量之和1ni i X =∑的标准化变量nin Xn Y μ-=∑的分布函数()n F x 对于任意X 满足2/2lim ()lim d ()n i x t n n n X n F x P x t x μΦ-→∞→∞⎧⎫-⎪⎪⎪=≤==⎬⎪⎪⎩⎭∑⎰定理 5.5表明,对于均值为,μ方差为20σ>的独立同分布的随机变量的和1ni i X =∑的标准化随机变量,不论12,,,,n X X X 服从什么分布,当n 充分大时,都有~(0,1)nin Xn Y N μ-=∑近似,从而,当n 充分大时21~(,)nii XN n n μσ=∑近似.定理5.5′ 设随机变量列12,,,,n X X X 相互独立,服从同一分布,且具有数学期望和方差2(),()0,i i E X D X μσ==>1,2,i =,令11nn i i X X n ==∑,则当n 充分大时~(0,1)N 近似,即2~(,/)n X N n μσ近似.例5.3 一盒同型号螺丝钉共有100个,已知该型号的螺丝钉的重量是一个随机变量,期望值是100 g,标准差是10 g,求一盒螺丝钉的重量超过10.2 kg 的概率.解 设i X 为第i 个螺丝钉的重量,,100,,2,1 =i Y 为一盒螺丝钉的重量,则1001,i i Y X ==∑12100,,,X X X 相互独立,由()100,i E X=10,σ= 100n =知()100()10 000,i E X E X =⨯=()100()10 000,i D X D X =⨯=由独立同分布中心极限定理,~(10000,10000)Y N 近似,{}{10 200}110 200P Y P Y >=-≤10 00010 20010 0001100100Y P --⎧⎫=-≤⎨⎬⎩⎭1(2)10.977 20.022 8.Φ≈-=-=定理5.6(李雅普诺夫定理)设随机变量 ,,,,21n X X X 相互独立,它们具有数学期望和方差2(),()0,1,2,k k k kE X D X k μσ==>=,记.122∑==nk k nB σ若存在正数δ,使得当∞→n 时,,0}|{|1122→-∑=++nk k knXE B δδμ则随机变量之和∑=n k k X 1的标准化变量nnk kn k kn k k n k k nk k n B X X D X E X Z ∑∑∑∑∑=====-=⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛-=11111μ的分布函数)(x F n 对于任意x ,满足2/211lim ()lim d ().n nk k x t k k n n n n X F x P x t x B μΦ-==→∞→∞⎧⎫-⎪⎪⎪⎪=≤==⎨⎬⎪⎪⎪⎪⎩⎭∑∑⎰ 定理5.7(棣莫佛—拉普拉斯定理)设随机变量(1,2,)~(,)(01),n n b n p p η=<<则对任意x ,有22lim d ().t x n P x t x Φ--∞→∞⎧⎫⎪≤==⎬⎪⎭⎰证明 由于n η可视为n 个相互独立、服从同一参数p 的(01)-分布的随机变量12,,,n X X X 的和,即有1nn i i X η==∑,其中(),()(1),i i E X p D X p p ==-1,2,i =,故由独立同分布中心极限定理可得22lim lim d ().n i n n t xX np P x P x t x Φ→∞→∞-⎧⎫-⎪⎪⎧⎫⎪⎪≤=≤⎬⎬⎪⎪⎭⎪⎭==∑⎰, 定理5.7表明:若随机变量n η服从二项分布,即~(,)n b n p η,则当n 充分大时,有~(0,1)npN η-近似,从而,当n 充分大时~(,(1))n N np np p η-近似例5.4 假如某保险公司开设人寿保险业务,该保险有1万人购买(每人一份),每人每年付100元保险费,若被保险人在年度内死亡, 保险公司赔付其家属1万元.设一年内一个人死亡的概率为0.005试问:在此项业务中保险公司亏本的概率有多大?保险公司每年利润不少于10万的概率是多少?解 设X 表示一年内被保险人的死亡人数,则,~(10000,0.005)X b ,于是()100000.00550,()100000.0050.99549.75E X D X =⨯==⨯⨯=由棣莫佛—拉普拉斯定理,~(50,49.75)X N 近似.保险公司亏本,也就是赔偿金额大于10 000100100⨯=万元,即死亡人数大于100人的概率所以保险公司亏本的概率为(){100}1{100}117.050P X P X P Φ>=-≤=-≈-= 这说明,保险公司亏本的概率几乎是零.如果保险公司每年的利润不少于10万元,即赔偿人数不超过90人,则保险公司每年利润不少于10万的概率为(){90} 5.671P X ≤≈Φ≈Φ=.可见,保险公司每年利润不少于10万元的概率几乎是100%.。
概率论与数理统计:中心极限定理
k 1
E(X ) 300, D(X ) 600
X ~ N (300,600) (近似)
P(280
X
320)
320 300 600
280603000
2
20 600
1
2 0.8165 1 0.5878
中心极限定理的意义
在实际问题中,若某随机变量可以看 作是有相互独立的大量随机变量综合作用 的结果,每一个因素在总的影响中的作用 都很微小,则综合作用的结果服从正态分 布.
1
x t2
e 2 dt
2
即对任意的 a < b,
lim P a Yn np b
n
np(1 p)
1
b t2
e 2 dt
2 a
Y n ~ N (np , np(1-p)) (近似)
正态分布的概率密度的图形
x
二项分布的随机变量可看作许多相互独立的0-1
分布的随机变量之和, 下面是当x-B(20,0.5)时, x的
k 1
定理2 李雅普诺夫(Liapunov)定理
设随机变量序列 X1, X 2,, X n , 相互 独立,且有有限的期望和方差:
E(Xk ) k ,
D(X k
)
2 k
0
,
k 1,2,
记
n
n
Bn2
D(X k )
2 k
k 1
k 1
若 0,
1
B 2 n
n
E(| X k
k 1
k
|2 ) n0
n
lim P k1
x
n
n
1
x t2
e 2 dt
概率论与数理统计 第五章 大数定律与中心极限定理
的概率很小” ,用数学语言表达,就是要证明: 0 ,有
nA nA lim P p 0 lim P p 1 n ,或 n n . n
另一种提法是:研究随机变量 n A 的分布的极限行为,即讨 论分布函数
nA lim P p 0 lim P n n 或 n
nA p 1 . n
证 引入
1 , 第i次试验中事件A发生 Xi ,i 1 , 2 , , n , 0 , 第i次试验中事件A不发生
下面我们进一步来讨论贝努利试验.若记 n A 为 n 次贝努利试
nA 验中事件 A 发生的次数, 则事件 A 发生的频率为 n . 所谓 “频 率的稳定性” ,无非是指当试验次数 n 无限增大(即 n )时,
nA 频率 n 无限接近于某个固定常数.这个固定的常数就是“事 件 A 在一次试验中发生的的概率 p” . nA 由此可见,讨论频率 n 的极限行为,是理解概率论中最基本
2019年1月14日星期一
11 / 102
§5.1
大数定律
作为预备知识,我们先明确随机变量序列收敛的
相关概念,同时给出一个重要的不等式,它是以下理 论证明所用的主要工具之一.
定 义 1.1 设 a 是常数,对于随机变量序列 ,如果 0 ,有
X1 , X 2 ,
, Xn ,
lim P
n
个常数,即在这个常数的附近摆动,这就是所谓的“频
率稳定性”.但对这一点,至今为止我们尚未给予理论 上的说明.另外,在第二章我们给出了二项分布的泊松 逼近,那么更一般的近似计算方案又是怎样呢?
概率论与数理统计_20_中心极限定理
练习2解答(续)
方法二:把二项分布看成多个独立 同分布的1-0分布之和,再根据中心 极限定理用标准正态分布近似计算
练习2解答(续2)
方法二续
小结:当n很大时,二项分布 B(n,p)可看成是很多独立同分布 的1-0分布之和,从而可以用正 态分布的CDF连续函数来近似原 来二项分布的CDF(离散值)。 用Mathematica作图来对比,这 个近似很优秀。
k 1 n
练习1解答
练习2
某车间有200台车床,它们独立地工作着,开工 率为0.6,开工时耗电各为1千瓦,问供电所至少要 供给这个车间多少电力才能以99.9%的概率保证 这个车间不会因供电不足而影响生产?
练习2求。
……
用Mathematica可求得 r_min = 141
n
讨论Yn的极限分布是否为标准 正态分布
独立同分布的中心极限定理 设 X1,, X n , 是独立同分布的随机变量序 列,且 EX k ,DX k 2 0, (k 1,2,) 则 { X n } 服从中心极限定理,即:
lim P{
X
k 1
n
k
n x}
n
n
则 { X n } 服从中心极限定理,即:
lim P{
X
k 1 k k 1
n
n
k
n
DX k
k 1
n
1 x} 2
e
x
t2 2
dt
中心极限定理是概率论中最著名的结果之一, 它不仅提供了计算独立随机变量之和的近似概率的 简单方法,而且有助于解释为什么很多自然群体的 经验频率呈现出钟形曲线这一值得注意的事实.
概率论与数理统计
概率论与数理统计----第五章大数定律及中心极限定理
= 1 − Φ(3.54)
=0.0002
一箱味精净重大于20500的概率为 的概率为0.0002. 一箱味精净重大于 的概率为
推论:
特别,若X~B(n,p),则当n充分大时, 特别, ~B(n 则当n充分大时,
X~N(np,npq) X~N(np,npq) np
若随机变量X~B( X~B(n, ),则对任意实数x有 ),则对任意实数 即 若随机变量X~B( ,p),则对任意实数 有
不等式证明 P{-1<X<2n+1}≥(2n+1)/(n+1)(n+1)
3. 设P{|X-E(X)|<ε}不小于 不小于0.9,D(X)=0.009.则用 不小于 则用
切比绍夫不等式估计ε的 最小值是( 切比绍夫不等式估计 的 最小值是
0.3 ).
4.(894) 设随机变量 的数学期望为 设随机变量X的数学期望为 的数学期望为µ, 标准差为σ,则由切比绍夫不等式 标准差为 则由切比绍夫不等式 P{|X-µ|≥3σ}≤( ). 1/9 5. 设随机变量X的分布律为 设随机变量 的分布律为 P{X=0.3}=0.2, P{X=0.6}=0.8, 用切比绍夫不等式估计 |X-E(X)|<0.2的概率 的概率. 的概率
1 n lim P ∑ Xi − µ < ε = 1 n→∞ n i =1
定理(贝努里利大数定律) 设每次实验中事件A发生的概率 定理(贝努里利大数定律) 设每次实验中事件A 为p,n次重复独立实验中事件A发生的次数为nA,则对任 次重复独立实验中事件A发生的次数为n 意的ε>0 意的ε>0 ,事件的频率 nA ,有 ε>
∫
+∞
−∞
概率论与数理统计§中心极限定理
• 引言 • 中心极限定理的基本概念 • 中心极限定理的证明 • 中心极限定理的应用 • 中心极限定理的扩展与推广 • 案例分析与实践应用 • 总结与展望
01
引言
主题简介
中心极限定理是概率论与数理统计中的重要概念,它描述了在独立同分布的随机 变量序列下,无论这些随机变量的分布是什么,它们的平均值的分布将趋近于正 态分布。
03
中心极限定理的证明
证明方法概述
方法一:基于特征函数的 证明
方法二:基于概率密度函 数的证明
ABCD
通过对特征函数的性质进 行分析,利用泰勒展开和 收敛性质,证明中心极限 定理。
通过分析概率密度函数的 性质,利用大数定律和收 敛定理,证明中心极限定 理。
重要极限公式
公式一: $lim_{{n to infty}} frac{S_n}{sqrt{n}} = N(0,1)$
中心极限定理的应用范围广泛,不仅限于金融、保险、医学等领域,还涉来研究的展望
01
随着大数据时代的到来,中心极限定理在处理大规模数据和复杂 随机现象方面的应用价值将更加凸显。未来研究可以进一步探索 如何优化中心极限定理的应用,提高其在实际问题中的适用性和 准确性。
02
随着数学和其他学科的交叉融合,中心极限定理与其他理 论或方法的结合应用将成为一个重要的研究方向。例如, 如何将中心极限定理与机器学习、人工智能等新兴技术相 结合,以解决更加复杂和具体的问题。
03
中心极限定理的理论基础和证明方法仍有进一步完善的空 间。未来研究可以深入探讨中心极限定理的数学原理,发 现新的证明方法和技巧,推动概率论与数理统计理论的进 一步发展。
07
总结与展望
西北工业大学《概率论与数理统计》4-2 中心极限定理
(
)
2⎞ ⎛ 1 σ ⎟ ⎜ X = ∑ X i ~ AN ⎜ µ , ⎟ n i =1 n ⎠ ⎝ 3° 定理4.6表明n个相互独立同分布的随机变量
的和近似服从正态分布.
例1 一加法器同时收到20个噪声电压Vk (k=1, 2,…, 20). 设它们是相互独立的随机变量,
且都在区间 (0, 10 )上服从均匀分布 , 记V =
下面的图形表明:正态分布是二项分布的逼近.
例3 某车间有200台机床,它们独立地工作着, 开工 开工率均为0.6, 开工时耗电均为1000W, 问供电所 至少要供给这个车间多少电力才能以99.9%的概率 保证这个车间不会因供电不足而影响生产. 解 设
⎧1, 第i台机床工作 Xi = ⎨ ⎩0, 第i台机床不工作
内容小结
独立同分布情形 独立同分布情形
⎧林德贝格 − 列维中心极限定理 ⎪ 独立不同分布情形 独立不同分布情形 ⎪ ⎪ ⎨李雅普诺夫定理 ⎪ 二项分布的正态近似 二项分布的正态近似 ⎪ ⎪ ⎩棣莫佛 − 拉普拉斯定理
中心极限定理
备用题
例1-1 设随机变量X1, X2,…, Xn相互独立, 且 Xi 在区间(−1, 1) 上服从均匀分布(i=1, 2,…, n), 试证 n 1 当 n充分大时, 随机变量 Z n = ∑ X 2 近似服从 i n i =1 正态分布并指出其分布参数. 证 记 Yi = X i2 , ( i = 1,2, , n) E ( Yi ) = E ( X i2 ) = D( X i )
注 1° 定理4.7是独立不同分布情形的中心极限 定理, 该定理表明: 当n充分大时, 有
∗ Yn ~ AN (0, 1)
而
n ⎛ n ⎞ 2 ⎟ µ , σ ∑ X i ~ AN ⎜ ∑ ∑ i i ⎟ ⎜ ⎝ i =1 i =1 ⎠ i =1 n
《概率论与数理统计》5-1 中心极限定理
例5. 为了测定一台机床的质量, 将其分解成若干个部件 来称量. 假定每个部件的称量误差(单位: kg )服从区 间 1,1 上的均匀分布, 且每个部件的称量是独立的, 试 问至多分成多少个部件才能以不低于99%的概率保证 机床的称量总误差的绝对值不超过10.
1.55 1.55
2 1.55 1 0.8788.
例3. 有一批钢材, 其中80%的长度不小于3m, 现从钢材 中随机取出100根, 试利用中心极限定理求小于3m的钢 不超过30根的概率. 解 以Yn 为100根钢材中小于3m的钢材根数, 由题意知:
1 E X p, D X p 1 p n
定理5.3 独立同分布情形下大数定律
设
X1 , X 2 ,
是一个独立同分布的随机变量序列. 且
P E X , D X 2 . 则 X
证明关键步骤:
1 2 E X , D X n
Yn
B 200,0.15 .
Y np N 30 0.95, P Yn N P n np 1 p 25.5 N 30 查表得: 1.645, 即: N 38.3068, 所以可取
25.5
N 39方能以95%的把握保证在该时刻分机可以使用外
在§1.3中, 我们曾经提到频率的稳定性. 设随机事件A的概率P(A)=p, 在n重贝努利试验中事件A 发生的频率为 f n A .当n很大时, 将与p非常接近. 由 于 f n A 本质上是一个随机变量,它随着不同的n次试 验可能取不同的值, 因而需要对随机变量序列引进新 的收敛性定义.
概率论与数理统计 6.2 中心极限定理
则X~B(n,0.005), 近似地,X ~ N(0.005n,0.005 0.995n)
PX 5 1 PX 5
1
P
X 0.005n
5 0.005n
0.005 0.995n 0.005 0.995n
1
5 0.005n 0.005 0.995n
0.005n 5
0.005
近似地,X ~ N(10000 0.005,10000 0.0050.995)
即 X ~ N(50,49.75), 设死亡人数超过k人的概率小于0.003,
PX k 1 PX k
1
P
X
50
49.75
k 50 49.75
1
k 50 49.75
0.003
k 50 49.75
( x)
2
n
Xi n
定理表明,n足够大时,r.v. i1
近似服从N (0,1),
n
注意到E n X i n, D n X i n 2 ,
i1
i1
n
从而 X i近似服从 N (n , n 2 ). i 1
中心极限定理是概率论中最重要的一类极限定理,此定 理告诉我们,在一定条件下,相互独立的随机变量之和在个 数很多时近似服从正态分布,揭示了为什么正态分布是最
P( i1 n/3
3n) 2( 3n ) 1
(2)当n 36, 1时, 所求概率为
6
P(
1 36
36 i 1
Xi
a
1) 2(1.732) 1 0.92 6
(3)要求n, 使得
P(
1 n
n i 1
Xi
a
) 2(
3n ) 1 0.95
《概率论与数理统计》课件第五章大数定律及中心极限定理
4.大样本统计推断的理论基础
是什么?
大数定律中心极限定理
随机现象中平均结果的稳定性
大数定律的客观背景
大量抛掷硬币正面出现频率
字母使用频率
生产过程中的废品率
§5.1 大数定律
背景:1. 频率稳定性2. 大量测量结果算术平均值的稳定性
回顾
随机现象的主要研究方法
概率分布
01
证:_x001A__x001B__x001B_,_x001A__x001B__x001B_,⋯, _x001A__x001B__x001B_, ⋯相互独立同分布,则_x001A__x001B__x001B__x001B_,_x001A__x001B__x001B__x001B_, ⋯,_x001A__x001B__x001B__x001B_, ⋯也相互独立同分布,由辛钦大数定律得证.
第五章 大数定律及中心极限定理
§5.1 大数定律§5.2 中心极限定理
要点:用切比雪夫不等式估算概率独立同分布,用中心极限定理计算对于二项分布,当n很大时,计算
本章要解决的问题
1.为何能以某事件发生的频率
作为该事件的概率的估计?
2.为何能以样本均值作为总体
期望的估计?
3.为何正态分布在概率论中占
解:(1)设X表示一年内死亡的人数,则~(, ),其中=,=.%. 设Y表示保险公司一年的利润,=×−.需要求的是_x001A_<_x001B_.
由中心极限定理
_x001A_<_x001B_=_x001A_×−<_x001B_ =_x001A_>_x001B_=−_x001A_≤_x001B_
且,
由中心极限定理
解:设为第i个螺丝钉的重量, 相互独立同分布. 于是,一盒螺丝钉的重量为
自考概率论与数理统计大数定律及中心极限定理
则
是这16只元件的寿命的总和.
E(Y)=100×16=1 600,D(Y)= 160 000,
则所求概率为:
定理5.6(李雅普诺夫定理)
设随机变量 X1, X2 ,, Xn ,相互独立, 它 们具有数学期望和方差:
E(Xk ) k ,
D( Xk
)
2 k
0
(k
1,2,),
n
记
Bn2
0.310000k
k 6801
如果用契比雪夫不等式估计:
E( X ) np 10000 0.7 7000 D( X ) npq 10000 0.7 0.3 2100
P(6800<X<7200)=P(|X
7000|<200)
1
2100 2002
0.95
可见,虽然有10000盏灯,但是只要有供应7200盏 灯的电力就能够以相当大的概率保证够用.事实上, 契比雪夫不等式的估计只说明概率大于0.95,后面 将具体求出这个概率约为0.99999.
k1
的分布函数 Fn( x) 对于任意x 满足
lim
n
Fn
(
x
)
lim
n
P
n k 1
X
k Bn
n k 1
k
x
x
1
t2
e 2 dt
( x).
2π
定理5.6表明:
无论各个随机变量 X1, X2 ,, Xn ,服从什么
自从高斯指出测量误差服从正态 分布之后,人们发现,正态分布在 自然界中极为常见.
概率论与数理统计大数定律及中心极限定理
且具有相同的数学期望和方差:E( Xk ) ,
D( X k ) 2 (k 1, 2, ), 作前 n 个随机变量
的算术平均
X
1 n
n k 1
X
k
,
则对于任意正
数 有
lim P{| X
n
|
}
lim
n
P
1 n
n k 1
X
k
1.
表 达
{| X | }是一个随机事件, 等式表
式 明,当n 时这个事件的概率趋于1,
切比雪夫大数定律 伯努利大数定律 辛钦大数定律
一、问题的引入
实例 频率的稳定性
随着试验次数的增加, 事件发生的频率逐渐稳 定于某个常数. 单击图形播放/暂停 ESC键退出
启示:从实践 中人们发现 大量测量值 的算术平均 值有稳定性.
二、基本定理
定理一(切比雪夫大数定律)
切比雪夫
设随机变量 X1, X 2 , , X n , 相互独立,
的 即对于任意正数 ,当n充分大时, 不
意 义
等式 | X | 成立的概率很大.
lim P{| Xn|来自}limn
P
1 n
n k 1
Xk
1.
证明
E
1 n
n k 1
X
k
1 n
n k 1
E(Xk )
1 n
n
,
D
1 n
n k 1
Xk
1 n2
n k 1
D( Xk
)
1 n2
n
2
2
n
,
由切比雪夫不等式可得
P
1 n
n k 1
X
k
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Xi
~ U (0.5,0.5), E( X i )
0
, D(Xi)
1 12
2
由独立同分布中心极限定理
1200
1200
X i ~ N (1200,1200 2 )
X i ~ N (0,100)
i 1
i 1
1200
1200
P Xi 12 1 P Xi 12
n
i 1
X i n L
即Yn
i 1
n
U (设U ~ N (0,1))
例1. 作加法时,对每个加数四舍五入取 整,各个加数的取整误差可以认为 是相互独立的,都服从( -0.5 , 0.5 )上 均匀分布。现在有1200个数相加, 问:取整误差总和的绝对值超过12的 概率是多少?
X i : 各个加数的取整误差,i 1,2,...,1200
独立同分布中心极限定理
设 X1,X2, …,Xn, …独立同分布,具有有限
数学期望和方差:E(Xi) =μ,D(Xi) =σ2,
i=1,2, …,则有
n
Xi n
lim P{ i1
x}
x
n
n
-
1 e-t2 2dt (x)
2
n
即,当n充分大时, Xi ~ N (n, n 2 )
要使1 1875 0.9,即, n 18750 n
(2)用二项分布中心极限定理估计,
nA ~ N(0.75n,0.1875n)
P0.74
nA n
0.76
P(0.74n
nA
0.76n)
0.76n 0.75n 0.1875n
0.74n 0.75n 0.1875n
X : 访问网站的用户数 A : 访问网站, A : 不访问网站, p P( A), q P( A)
那么, p 0.2, q 0.8, X ~ B(10000,0.2)
由二项分布中心极限定理
X ~ N(10000 0.2,10000 0.2 0.8),即X ~ N(2000,1600)
则以下正确的是
n
A. X i服从P()
i 1
n
B. X i近似服从N (n, n)
i 1
n
C. X i近似服从N (0,1)
i 1
n
D.
X i近似服从N (n, n2 )
i 1
补
设X ~ B(n,0.2),则当n充分大时, X近似服从 _________________
,
X
2
,...,
X
相互独立
n
Sn X1 X 2 ... X n ,则根据中心极限定理,
当n充分大时,S
近似服从正态分布,只要
n
随机变量X1, X 2 ,..., X n ( )
A. 有相同的数学期望
B. 有相同的方差
C. 服从同一指数分布
D. 服从同一离散型分布
补
设X1, X 2,..., X n独立同服从于P(), n充分大,
(1)P1900 X 2100 2100 2000 1900 2000
40 40
22.51 2 0.9938 1 0.9876
(2)PX 2100 1 2100 2000 1 0.9938 0.0062
那么, p 0.6, q 0.4, X ~ B(200,0.6)
由二项分布中心极限定理 X ~ N(200 0.6,200 0.6 0.4),即X ~ N(120,48)
设b是供给电的千瓦数
P0 X b b 120 0 120
48 48
2
n 1875
1
要使2
n 1875
1
0.9,即,
n 1875
0.95
查表得, n 1.6449 n 5073.8
1875
用切比雪夫不等式的估计比较粗略,而用 中心极限定理则能得到更为精确的估计。
补
(2002,
数一)设X1
nA : n次独立重复试验中事件A发生的次数
那么, nA ~ B(n,0.75)
(1)用切比雪夫不等式估计,
P 0.74
nA n
0.76
n)
P(| nA
E
(n
A
)
|
0.01n)
1
D(nA ) 0.0001n
2
1 1875 n
1
t2
e 2 dt (x)
n np(1 p)
2
即,当n充分大时, X ~ N (np, np(1 p))
即Yn
X np
L
U (设U ~ N (0,1))
np(1 p)
例2. 某互联网站有10000个相互独立的用 户,已知每个用户在平时任一时刻 访问网站的概率为0.2。求: (1)在任一时刻,有1900~2100个用 户访问该网站的概率; (2)在任一时刻,有2100个以上用户 访问该网站的概率。
i1
i1
1[21.21] 2 2 0.8849 0.2302
二项分布中心极限定理
设随机变量X为n次贝努利试验中事件A出
现的次数,p是每次试验中事件A发生的概率,
即X~B(n, p)(0<p<1),则对任意x,有
lim P{ X np
x
x}
40
例3. 某车间有200台独立工作的车床,各 台车床开工的概率都是0.6,每台车 床开工时要耗电1千瓦。问供电所至 少要供给这车间多少千瓦电力,才能 以99.9%的概率保证这个车间不会因 为供电不足而影响生产。
X : 实际开工的车床数 A : 车床开工, A : 车床不开工, p P( A), q P( A)
b 120 17.32 b 120 0.999
48
48
查表得, b 120 3.0902 48
b 141.4095
例4. 设在独立重复试验序列中,每次试 验时事件A发生的概率为0.75,分别 用切比雪夫不等式和二项分布中心 极限定理估计试验次数n需多大,才 能使事件A发生的频率落在0.74~0.76 之间的概率至少为0.90。