概率论与数理统计(浙大版)第五章第六章课件大数定律和中心极限定理

合集下载

概率论与数理统计第五章 大数定律及中心极限定理

概率论与数理统计第五章 大数定律及中心极限定理
解: 设Xk为第k次炮击炮弹命中的颗数(k=1,2,…,100),
在100次炮击中炮弹命中的总颗数
100
X = ∑ Xk k =1
相互独立地服从同一分布,
E(Xk)=2, D(Xk)=1.52 (k=1,2,…,100)
随机变量
∑ 1
100 × 1.5
100 k =1
(
X
k

2)
=
1 15
(
X

200)
2. 伯努利定理 事件发生的频率依概率收敛于事件的概率
3. 辛钦定理 (随机变量序列独立同分布且数学期望存在)
n个随机变量的算术平均值以概率收敛于算术 平均值的数学期望。
给出了“频率稳定性”的严格数学解释. 提供了通过试验来确定事件概率的方法. 是数理统计中参数估计的重要理论依据之一.
§5.2 中心极限定理
望 E( Xk ) = µ (k = 1,2,"),则对于任意ε > 0,有
∑ lim
n→∞
P {|
1 n
n k =1
Xk

µ
|<
ε
}
=
1
说明
伯努利大数定理是辛钦定理的特殊情
况。n个随机变量的算术平均值以概率收敛于算
术平均值的数学期望。
三 小结
1、切比雪夫(Chebyshev)定理的特殊情况 算术平均值依概率收敛于数学期望
= 1 − P { V − 100 ≤ 0.387 } (10 12 ) 20
∫ 0.387
≈ 1−
1
e − t 2 dt
−∞ 2π
= 1 −Φ (0.387) = 0.348
所以 P{V > 105} ≈ 0.348

概率论与数理统计 第5章 大数定律和中心极限定理

概率论与数理统计 第5章  大数定律和中心极限定理

5.1 大 数 定 律 作为上述定理得特殊情况,可以得到如下重要定 理: 定理 5.3 (伯努利大数定律)设 nA 是 n 重伯努利试 验中事件 A 发生的次数, p 是事件 A 在每次试验中 发生的概率,则对于任意正数,有
nA P nA 即 (5.4) p ( n ) limP p 1 n n n
第五章 大数定律和中心极限定理 【吸烟率调查问题】 某卫生组织为确定某城市成年男子的吸烟率p,将 被调查的成年男子中吸烟的频率作为p的估计,现在 要保证有 90% 以上的把握,使得调查对象吸烟者的
频率与该城市成年男子的吸烟率p之间的差异不大于
5%,问至少要调查多少对象?
5.1
大 数定 律
对某个随机变量 X进行大量的重复观测,所得到 的大批观测数据的算术平均值也具有稳定性,由于 这类稳定性都是在对随机变量进行大量重复试验的 条件下呈现出来的,历史上把这种试验次数很大时 出现的规律统称为大数定律.
即对于任意正数,有
1 n limP X i 1 n n i 1
1 n P X (n ) 也即 (5.3) i n i 1 n n 1 1 1 证:因为 E ( X i ) E ( X i ) n n n i 1 n i 1 1 n 1 D( X i ) 2 n i 1 n
nA p 实际上几乎是必定要发生的,即对于给 n
用事件发生的频率来近似地代替事件发生的概率.
5.1 大 数 定 律 上 述 契 比 谢 夫 大 数 定 律 中 要 求 随 机 变 量 X1 , X2 , … , Xn , … 的方差存在,实际上,在高等概率
论中已经证明了在不要求D(Xi)(i = 1,2,…)存在

大学《概率论与数理统计》课件第五章 大数定律与中心极限定理

大学《概率论与数理统计》课件第五章 大数定律与中心极限定理
n 100, p 0.2, E(X ) np 20, D(X ) npq 16 4,
例5 某单位有200台电话分机,每台分机有5%的时间 要使用外线通话。假定每台分机是否使用外线是相互独 立的,问该单位总机要安装多少条外线,才能以90%以 上的概率保证分机用外线时不等待? 解 设有X 部分机同时使用外线,则有 其中 设有N 条外线.由题意有 由德莫佛-拉普拉斯定理得
第五章 大数定律与中心极限定理
§5.1 大数定律 §5.2 中心极限定理
§5.1 大数定律 一、切比雪夫Chebyshev不等式 二、几个常见的大数定律
定义1 设随机变量序列
在常数 a ,使得对于任意
有:
则称 依概率收敛于a ,记为
,如果存
注意
以概率收敛比高等数学中的普通意义下的收敛弱 一些,它具有某种不确定性.

是独立同分布的随机变量. 且
累计误差即总距离误差为1200 X k 近似 N (0,100) k 1
由定理1可得
下面介绍定理1 的特殊情况.
定理2(棣莫佛-拉普拉斯定理(De Moivre-Laplace)
设随机变量 服从参数为
的二项分布
则对任意的x ,有
即 或
证 因为 所以 其中 相互独立,且都服从(0-1)分布。
定理1(独立同分布的中心极限定理)

为一列独立同分布的随机变量,
且具有相同的期望和方差
则对任意实数x,有

,或
例1 根据以往经验,某种电器元件的寿命服从均值为 100小时的指数分布. 现随机地取16只,设它们的寿命 是相互独立的. 求这16只元件的寿命的总和大于1920小 时的概率. 解 设第i 只元件的寿命为Xi , i=1,2, …,16 由题给条件知,诸Xi 独立,E( Xi ) =100, D( Xi ) =10000 16只元件的寿命的总和为

概率论与数理统计(浙大版)第五章第六章课件资料.

概率论与数理统计(浙大版)第五章第六章课件资料.

5
随机变量序列依概率收敛的定义
定义5.1:设随机变量序列X1, X2, X3, ,若存在某常数,
使得 0,均有:lim P n
Xn
0,
则称随机变量序列 X n 依概率收敛于常数,
记为:Xn p 。
性质:已知Xn p ,并知函数g(x)在x=处连续,
则g Xn p g
6
定理5.2 契比雪夫不等式的特殊情形:
,
, Xn,
相互独立同分布,Xi ~ b(1, p).
由于nA X1 X 2 X n ,
Pa nA b
( b np ) np(1 p)
( a np ) np(1 p)
由定理5.4,
lim
n
P
nA np np(1 p)
x
x
1
t2
e 2 dt
2
即:nA (近似) ~ N (np源自 np(1 p)). 二项分布和正态分布的关14 系
设随机变量序列X 1
,
X
2
,
, Xn,
相互独立,
且具有相同的数学期望和相同的方差 2,
作前n个随机变量的算术平均:Yn
1 n
n k 1
Xk
则 0,有:
lim P
n
Yn
lim
n
P
1 n
n
Xk
k 1
1
证明:由于E
Yn
E
1 n
n k 1
Xk
1 n
n
,
D
Yn
D
1 n
n k 1
则对于任意 0,都有:P
X EX
2 2
定理的等价形式为:P
X

第五章 大数定律与中心极限定理 《概率论》PPT课件

第五章  大数定律与中心极限定理  《概率论》PPT课件

概率论与数理统计
§5.2 中心极限定理
2)中 心极限 定理表明,若 随 机 变 量 序 列
X 1 , X 2 , , X n 独立同分布,且它们的数学期
望及方差存在,则当n充分大时,其和的分布,
n
即 X k 都近似服从正态分布. (注意:不一定是 k 1
标准正态分布)
3)中心定理还表明:无论每一个随机变量 X k ,
概率论与数理统计
§5.1 大数定律
定理1(Chebyshev切比雪夫大数定律)
假设{ Xn}是两两不相关的随机
变量序列,EXn , DXn , n 1,2, 存在,
其方差一致有界,即 D(Xi) ≤L,
i=1,2, …, 则对任意的ε>0,
lim P{|
n
1 n
n i1
Xi
1 n
n i1
E(Xi ) | } 1.
概率论与数理统计
§5.2 中心极限定理
现在我们就来研究独立随机变量之和所 特有的规律性问题.
在概率论中,习惯于把和的分布 收敛于正态分布这一类定理都叫做中心 极限定理.
下面给出的独立同分布随机变量序 列的中心极限定理, 也称列维——林德 伯格(Levy-Lindberg)定理.
概率论与数理统计
§5.2 中心极限定理
大量的随机现象平均结果的稳定性
大量抛掷硬币 正面出现频率
生产过程中的 字母使用频率 废品率
概率论与数理统计
§5.1 大数定律
一、大数定律
阐明大量的随机现象平均结果的稳定性的一系
列定理统称为大数定律。
定义1 如果对于任意 0, 当n趋向无穷时,事件
" Xn X " 的概率收敛到1,即

概率论与数理统计第5章-大数定律与中心极限定理

概率论与数理统计第5章-大数定律与中心极限定理

又设函数 g ( x , y ) 在点 (a , b ) 连续,
P 则 g( X n , Yn ) g(a , b ).
证明
因为 g( x , y ) 在 (a , b) 连续,
0, 0,
g( x , y ) g(a , b) ,
g ( x, y) g (a, b) ,
因此0 P{ g( X n , Yn ) g(a, b) }
n 0, P X n a P Yn b 2 2
P 则 g( X n , Yn ) g(a , b).
[证毕]
定理5.1(贝努里大数定律) 设nA是n重贝努里试验中事件A发生的 次数, p是事件A在一次试验中发生的概率, 则对于任意的 0, 有
P P 注 : 若X n X , Yn Y , 则 P P (1) X n Yn X Y ;(2) X n Yn X Y;
Xn P X (3) X nYn XY ;(4) Yn Y
P
依概率收敛序列的性质
P P 设 Xn a , Yn b, (a , b为常数)
第五章 大数定律与中心极限定理
5.1 大数定律 5.2 中心极限定理
“概率是频率的稳定值”。前面已经提到,当随机 试验的次数无限增大时,频率总在其概率附近摆动, 逼近某一定值。大数定理就是从理论上说明这一结果。 正态分布是概率论中的一个重要分布,它有着非常广 泛的应用。 中心极限定理阐明,原本不是正态分布的一般随机 变量总和的分布,在一定条件下可以渐近服从正态分 布。这两类定理是概率统计中的基本理论,在概率统 计中具有重要地位。
大数定律的客观背景 大量的随机现象中平均结果的稳定性

概率论与数理统计:大数定律与中心极限定理ppt课件

概率论与数理统计:大数定律与中心极限定理ppt课件
ห้องสมุดไป่ตู้
123456 7 14916 25 36 91 2 E x ,E x 6 2 6 6 91 49 182 147 35 2 2 D x E x (E x) 6 4 12 12 D x 35 2 7 1: 2 P (|x |1 ) 12 3 2 D x 35 35 1 7 2: 2 P (|x |2 ) 4 12 48 3 2
X ,X , ,X 1 2 n 相互独立, nA X k
n k 1
1n pq 记Y Xk , E ( Y ) p , D ( Y ) n n n n k1 n
由 Chebyshev 不等式, = 0.01n ,故
0 . 1875 n P |X 0 . 75 n | 0 . 01 n 1 2 ( 0 . 01 n )

0 .1875 n 1 0 .90 2 (0 .01 n )
解得 n 18750
若 E(X ) = , D(X ) = 2, 类似于正态分布的3 原理,由 Chebyshev 不等式可估计 1 P |X | 3 0 . 1111 9 1 P |X | 2 0 . 25 4 由 Chebyshev 不等式,可看出 D (X) 反映了 X 偏离 E(X ) 的程度. 固定 , 较小者,
实际精确计算:
X 1 P 0 . 01 P 940 X 1060 6 6000
1 5 C 6 6
k 1059 k 6000 k 941
6000 k
0 . 959036
用Poisson 分布近似计算:
5.1
大数定律

概率论与数理统计图文课件最新版-第5章-大数定律及中心极限定理

概率论与数理统计图文课件最新版-第5章-大数定律及中心极限定理

0
p 是事件 A 在每次试验 中发生的概率
其中: nA X1 X2 L Xn
概率统计
其中: nA X1 X2 L Xn
p 是事件 A 在每次试验中 发生的概率。
证明: Q Xk 服从 (0 1 ) 分布
n 次独立 重复试验 中事件A 发生的次

E(Xk ) p n
令:
Xk
k 1
指的是:对任意正数 , P
lim
n
P(
Yn
a
)1
记为:Yn a
由此,定理2 的结论可叙述为:序列
依概率收敛于常数
Xn
1 n
n k 1
Xk
▲ 依概率收敛的序列具有如下性质:
P
P
设 Xn a , Yn b, 又设函数 g ( x, y ) 在点
( a, b ) 处连续,则有:
P
g( Xn , Yn ) g(a, b)
概率统计
第一节 大数定律
大数定律的客观背景 大量的随机现象中平均结果的稳定性:
大量抛掷硬币 正面出现频率
概率统计
生产过程中 的废品率
……
字母使用频率
一. 切比雪夫大数定律
定理1(切比雪夫大数定律)
设 X1 , X2, … 是相互独立的随机变 量序列,它们都有有限的方差,并且方
差有共同的上界,即 D( Xi ) ≤ K, i=1,
k 1, 2,L , 作前 n 个随机变量的算术平均值:
概率统计
1 n
Xn n k1 Xk ,
1 n
Xn n k1 Xk ,
则对任意的 0有:
lim P
n
Xn
lim P
n

第五章大数定律及中心极限定理概率论课件(共31张PPT)

第五章大数定律及中心极限定理概率论课件(共31张PPT)

例3在加法运 ,对算每时个加数都取 四到 舍百 五 ,分 其各加数的舍认 入为 误服 [差 0从 .5可 102,0.5102] 上的均匀分布立 且的 相随 互机 ,独 现变有 1量 0个 0 加数 相加 ,试以 99.7%的概率断定其的 误范 差 . 围 所在
解Xi:第 i个 加 数 的 i1 舍 ,2, ,1 入 00 误 差
100
X :100个加数的舍入误差之和X X i
i 1
EX i 0,
DXi
104 , 12
EX 0, DX 1102, 12
设误差范围 [为 ,] P(X)0.99 , 7
第三十页,共31页。
P(X)P( D XX(203)1)
2 (20 3)10.997
(203)0.99,852032.9,7
大数定律以数学的形式表达并证明了,在一定 条件下,大量重复出现的随机(suí jī)现象的统计规律性.
第十页,共31页。
定 理 (Bern大 ou数 ll)i定 设 n律 为 n重 Bernou
试 验 中 A的 事发 件生 的 P(A)次 p(数 0p, 1),
则 对 任 0意 ,有的 nl i m P nnp 1
i1
P (X 20 ) 1 5 P ( 0 X 0 20 ) 500
120520020000000 01(3.5)4 0.000
第二十八页,共31页。
例 2某保险公司经多年计的资统料表明在索,赔户中, 被盗户2占 0%,在随意抽10查 家 0的 索赔户中 求被盗户户数 不少 1户 4于且不 3户 0超的 过概
第七页,共31页。
极限定理— 研究(yánjiū)“大量〞的随机现象(随机事 件)
并用极限的形式表现的一大类定理.

浙江大学概率论与数理统计(免费)ppt课件

浙江大学概率论与数理统计(免费)ppt课件
12
(三) 事件的关系及运算 事件的关系(包含、相等)
1 A B : 事 件 A 发 生 一 定 导 致 B 发 生
AB 2A = B BA
B A
S
例: BA 记A={明天天晴},B={明天无雨}
BA 记A={至少有10人候车},B={至少有5人候车}
一枚硬币抛两次,A={第一次是正面},B={至少有一次正面}
15
§3 频率与概率
(一)频率 n A; f ( A ) 定义:记 n n 其中 n A —A发生的次数(频数);n—总试验次 数。称f n ( A ) 为A在这n次试验中发生的频率。 例:
中国国家足球队,“冲击亚洲”共进行了n次,其中成功了
一次,则在这n次试验中“冲击亚洲”这事件发生的频率为 1 n;
不确定性现象
确定性现象:结果确定 不确定性现象:结果不确定

例:
向上抛出的物体会掉落到地上 ——确定 ——不确定 明天天气状况 ——不确定 买了彩票会中奖
9
概率统计中研究的对象:随机现象的数量规律
对随机现象的观察、记录、试验统称为随机试验。 它具有以下特性: 1. 可以在相同条件下重复进行 2. 事先知道可能出现的结果 3. 进行试验前并不知道哪个试验结果会发生
BA
13


事件的运算
A与B的和事件,记为 AB
A与B的积事件,记为 A B ,A B ,A B
A B A B { x | x A 且 x B } : A 与 B 同 时 发 生 。
n i 1 n i 1
S A B
A B { x | x A 或 x B } : A 与 B 至 少 有 一 发 生 。

概率统计浙大版第五章大数定律与中心极限定理

概率统计浙大版第五章大数定律与中心极限定理
解: 设一箱味精净重为X, 箱中第i袋味精净重为Xi,(i=1,2,…,200)
则 且 X1,X2,…,X200独立同分布, EXi=100, DXi=102=100,
X Xi
i 1
200
由独立同分布的中心极限定理得: EX=200EXi=20000, DX=200DXi=20000,
X近似服从正态分布,且
Yn
X
k 1
n
k
E ( X k )
k 1 n
n

X
k 1
n
k
n
D(任意x,满足
limF ( x ) limP{Y
n n n
n
x}
1 2

x
e
t2 2
dt ( x )
中心极限定理阐明了这样一个道理:
所求为P(X>20500)= 1-P(X≤20500)
1 (

20500 20000 20000
)
1 ( 3.54)
=0.0002
一箱味精净重大于20500的概率为0.0002.
• 例:一加法器同时收到20个噪声电压Vk(k=1,2,…,20), 它们相互独立且都在区间[0,10]上服从均匀分布,噪声 电压总和V=V1+V2+…+V20,求P{V>105}的近似值. • 解:易知E(Vk)=5,D(Vk)=100/12,由独立同分布的中心 20 极限定理知
设随机变量X具有数学期望E(X)=μ,方差D(X)=σ2 , 则对于任意正数ε,有
2 P | X | 2 或者
2 P X 1 2
辛钦大数定律的证明:

《概率论与数理统计》课件第五章大数定律及中心极限定理

《概率论与数理统计》课件第五章大数定律及中心极限定理
有极其重要的地位?
4.大样本统计推断的理论基础
是什么?
大数定律中心极限定理
随机现象中平均结果的稳定性
大数定律的客观背景
大量抛掷硬币正面出现频率
字母使用频率
生产过程中的废品率
§5.1 大数定律
背景:1. 频率稳定性2. 大量测量结果算术平均值的稳定性
回顾
随机现象的主要研究方法
概率分布
01
证:_x001A__x001B__x001B_,_x001A__x001B__x001B_,⋯, _x001A__x001B__x001B_, ⋯相互独立同分布,则_x001A__x001B__x001B__x001B_,_x001A__x001B__x001B__x001B_, ⋯,_x001A__x001B__x001B__x001B_, ⋯也相互独立同分布,由辛钦大数定律得证.
第五章 大数定律及中心极限定理
§5.1 大数定律§5.2 中心极限定理
要点:用切比雪夫不等式估算概率独立同分布,用中心极限定理计算对于二项分布,当n很大时,计算
本章要解决的问题
1.为何能以某事件发生的频率
作为该事件的概率的估计?
2.为何能以样本均值作为总体
期望的估计?
3.为何正态分布在概率论中占
解:(1)设X表示一年内死亡的人数,则~(, ),其中=,=.%. 设Y表示保险公司一年的利润,=×−.需要求的是_x001A_<_x001B_.
由中心极限定理
_x001A_<_x001B_=_x001A_×−<_x001B_ =_x001A_>_x001B_=−_x001A_≤_x001B_
且,
由中心极限定理
解:设为第i个螺丝钉的重量, 相互独立同分布. 于是,一盒螺丝钉的重量为

概率论与数理统计第五章大数定律与中心极限定理

概率论与数理统计第五章大数定律与中心极限定理

第五章 大数定律与中心极限定理第一节 大数定律在第一章中我们已经指出,人们经过长期实践认识到,虽然个别随机事件在某次试验中可能发生也可能不发生,但是在大量重复试验中却呈现明显的规律性,即随着试验次数的增大,一个随机事件发生的频率在某一固定值附近摆动.这就是所谓的频率具有稳定性.同时,人们通过实践发现大量测量值的算术平均值也具有稳定性.而这些稳定性如何从理论上给以证明就是本节介绍的大数定律所要回答的问题.在引入大数定律之前,我们先证一个重要的不等式——契比雪夫(Chebyshev )不等式. 设随机变量X 存在有限方差D (X ),则有对任意ε>0,P {|X -E (X )|≥ε}≤2)(εX D . (5.1)证 如果X 是连续型随机变量,设X 的概率密度为f (x ),则有P {|X -E (X )|≥ε}=⎰⎰≥-≥--≤εεε)(22)()()()(X E x X E x x x f X E x x x f d d ≤[].)()()(1222⎰+∞∞-=-εεX D x x f X E x d 请读者自己证明X 是离散型随机变量的情况.契比雪夫不等式也可表示成P {|X -E (X )|<ε}≥1-2)(εX D . (5.2)这个不等式给出了在随机变量X 的分布未知的情况下事件{|X -E (X )|<ε}的概率的下限估计,例如,在契比雪夫不等式中,令ε=3)(X D ,4)(X D 分别可得到P {|X -E (X )|<3)(X D }≥0.8889,P {|X -E (X )|<4)(X D }≥0.9375.例5.1 设X 是掷一颗骰子所出现的点数,若给定ε=1,2,实际计算P {|X -E (X )|≥ε},并验证契比雪夫不等式成立.解 因为X 的概率函数是P {X =k }=1/6(k =1,2,…,6),所以E (X )=7/2, D (X )=35/12,P {|X -7/2|≥1=P {X =1}+P {X =2}+P {X =5}+P {X =6}=2/3;P {|X -7/2|}≥2}=P {X =1}+P {X =6}=1/3.ε=1:2)(εX D =35/12>2/3, ε=2:2)(εX D =1/4×35/12=35/48>1/3.可见契比雪夫不等式成立.例5.2 设电站供电网有10000盏电灯,夜晚每一盏灯开灯的概率都是0.7,而假定开、关时间彼此独立,估计夜晚同时开着的灯数在6800与7200之间的概率.解 设X 表示在夜晚同时开着的灯的数目,它服从参数为n =10000,p =0.7的二项分布.若要准确计算,应该用贝努里公式:P {6800<X <7200}=∑=-⨯⨯7199680110000100003.07.0k k k k C .如果用契比雪夫不等式估计: E (X )=np =10000×0.7=7000,D (X )=npq =10000×0.7×0.3=2100,P {6800<X <7200}=P {|X -7000|<200}≥1-22002100≈0.95. 可见,虽然有10000盏灯,但是只要有供应7200盏灯的电力就能够以相当大的概率保证够用.事实上,契比雪夫不等式的估计只说明概率大于0.95,后面将具体求出这个概率约为0.99999.契比雪夫不等式在理论上具有重大意义,但估计的精确度不高.契比雪夫不等式作为一个理论工具,在大数定律证明中,可使证明非常简洁.定义5.1 设Y 1,Y 2,…,Y n ,…是一个随机变量序列,a 是一个常数,若对于任意正数ε有{}1lim =<-∞→εa YP n n ,则称序列Y 1,Y 2,…,Y n ,…依概率收敛于a ,记为Y n P a .定理5.1(契比雪夫(Chebyshev )大数定律) 设X 1,X 2,…是相互独立的随机变量序列,各有数学期望E (X1),E (X2),…及方差D (X 1),D (X 2),…,并且对于所有i =1,2,…都有D (X i )<l ,其中l 是与i 无关的常数,则对任给ε>0,有1)(1111lim =⎭⎬⎫⎩⎨⎧<-∑∑==∞→εn i n i i i n X E n X n P . (5.3) 证因X 1,X 2,…相互独立,所以n l nl n X D n X n D n i i n i i =⋅<=⎪⎭⎫ ⎝⎛∑∑==21211)(11. 又因,)(1111∑∑===⎪⎭⎫ ⎝⎛ni i n i i X E n X n E 由(5.2)式,对于任意ε>0,有2111)(11εεn l X E n X n P n i i n i i -≥⎭⎬⎫⎩⎨⎧<-∑∑==, 但是任何事件的概率都不超过1,即1)(111112≤⎭⎬⎫⎩⎨⎧<-≤-∑∑==εεni i n i i X E n X n P n l,因此1)(1111lim =⎭⎬⎫⎩⎨⎧<-∑∑==∞→εn i n i i i n X E n X n P . 契比雪夫大数定律说明:在定理的条件下,当n 充分大时,n 个独立随机变量的平均数这个随机变量的离散程度是很小的.这意味,经过算术平均以后得到的随机变量n Xn i i∑=1将比较密的聚集在它的数学期望n X E ni i ∑=1)(的附近,它与数学期望之差依概率收敛到0.定理5.2(契比雪夫大数定律的特殊情况) 设随机变量X 1,X 2,…,X n ,…相互独立,且具有相同的数学期望和方差:E (X k )=μ,D (X k )=σ2(k =1,2,…).作前n 个随机变量的算术平均∑==nk k n X n Y 11则对于任意正数ε有 {}1lim =<-∞→εμn n Y P . (5.4)定理5.3(贝努里(Bernoulli )大数定律) 设n A 是n 次独立重复试验中事件A 发生的次数.p 是事件A 在每次试验中发生的概率,则对于任意正数ε>0,有1lim =⎭⎬⎫⎩⎨⎧<-∞→εp n n P A n , (5.5) 或 0lim =⎭⎬⎫⎩⎨⎧≥-∞→εp n n P A n . 证 引入随机变量X k =⎩⎨⎧=,,2,1,1,0 k ,A k ,A k 发生次试验中若在第不发生次试验中若在第,显然 n A =∑=n k k X1.由于X k 只依赖于第k 次试验,而各次试验是独立的.于是X 1,X 2,…,是相互独立的;又由于X k 服从(0-1)分布,故有E (X k )=p , D (X k )=p (1-p ), k =1,2,….由定理5.2有111lim n i n k P X p n ε→∞=⎧⎫-<=⎨⎬⎩⎭∑, 即 1lim =⎭⎬⎫⎩⎨⎧<-∞→εp n n P A n .贝努里大数定律告诉我们,事件A 发生的频率nn A 依概率收敛于事件A 发生的概率p ,因此,本定律从理论上证明了大量重复独立试验中,事件A 发生的频率具有稳定性,正因为这种稳定性,概率的概念才有实际意义.贝努里大数定律还提供了通过试验来确定事件的概率的方法,即既然频率nn A 与概率p 有较大偏差的可能性很小,于是我们就可以通过做试验确定某事件发生的频率,并把它作为相应概率的估计.因此,在实际应用中,如果试验的次数很大时,就可以用事件发生的频率代替事件发生的概率.定理5.2中要求随机变量X k (k =1,2,…,n )的方差存在.但在随机变量服从同一分布的场合,并不需要这一要求,我们有以下定理.定理5.4(辛钦(Khinchin )大数定律)设随机变量X 1,X 2,…,X n ,…相互独立,服从同一分布,且具有数学期望E (X k )=μ (k =1,2,…),则对于任意正数ε,有111lim n i n k P X n με→∞=⎧⎫-<=⎨⎬⎩⎭∑. (5.6) 显然,贝努里大数定律是辛钦大数定律的特殊情况,辛钦大数定律在实际中应用很广泛. 这一定律使算术平均值的法则有了理论根据.如要测定某一物理量a ,在不变的条件下重复测量n 次,得观测值X 1,X 2,…,X n ,求得实测值的算术平均值∑=ni i X n 11,根据此定理,当n 足够大时,取∑=ni i X n 11作为a 的近似值,可以认为所发生的误差是很小的,所以实用上往往用某物体的某一指标值的一系列实测值的算术平均值来作为该指标值的近似值.第二节 中心极限定理在客观实际中有许多随机变量,它们是由大量相互独立的偶然因素的综合影响所形成的,而每一个因素在总的影响中所起的作用是很小的,但总起来,却对总和有显著影响,这种随机变量往往近似地服从正态分布,这种现象就是中心极限定理的客观背景.概率论中有关论证独立随机变量的和的极限分布是正态分布的一系列定理称为中心极限定理(Central limit theorem),现介绍几个常用的中心极限定理.定理5.5(独立同分布的中心极限定理) 设随机变量X 1,X 2,…,X n ,…相互独立,服从同一分布,且具有数学期望和方差E (X k )=μ,D (X k )=σ2≠0(k =1,2,…).则随机变量σμn n X X D X E X Y n k k n k k n k k n k k n -=⎪⎭⎫ ⎝⎛-=∑∑∑∑====1111)( 的分布函数F n (x )对于任意x 满足⎰∑∞--=∞→∞→=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧≤-=x t n k k n n n t x n n X P x F .21lim )(lim 212d e πσμ (5.7) 从定理5.5的结论可知,当n 充分大时,近似地有Y n =21σμn n Xn k k -∑=~N (0,1).或者说,当n 充分大时,近似地有 ().,~21σμn n N Xn k k ∑= (5.8) 如果用X 1,X 2,…,X n 表示相互独立的各随机因素.假定它们都服从相同的分布(不论服从什么分布),且都有有限的期望与方差(每个因素的影响有一定限度).则(5.8)式说明,作为总和∑=n k k X1这个随机变量,当n 充分大时,便近似地服从正态分布.例5.3 一个螺丝钉重量是一个随机变量,期望值是1两,标准差是0.1两.求一盒(100个)同型号螺丝钉的重量超过10.2斤的概率.解 设一盒重量为X ,盒中第i 个螺丝钉的重量为X i (i =1,2,…,100).X 1,X 2,…,X 100相互独立,E (X i )=1,)(i X D =0.1,则有X =∑=1001i i X,且E (X )=100·E (X i )=100(两),)(i X D =1(两).根据定理5.5,有P {X >102}=}2100{111001021100≤--=⎭⎬⎫⎩⎨⎧->-X P X P ≈1-Φ(2)=1-0.977250=0.022750.例5.4 对敌人的防御地进行100次轰炸,每次轰炸命中目标的炸弹数目是一个随机变量,其期望值是2,方差是1.69.求在100次轰炸中有180颗到220颗炸弹命中目标的概率. 解令第i 次轰炸命中目标的炸弹数为X i ,100次轰炸中命中目标炸弹数X =∑=1001i i X,应用定理5.5,X 渐近服从正态分布,期望值为200,方差为169,标准差为13.所以P {180≤X ≤220}=P {|X -200|≤20}=⎭⎬⎫⎩⎨⎧≤-132013200X P ≈2Φ(1.54)-1=0.87644.定理5.6(李雅普诺夫(Liapunov )定理) 设随机变量X 1,X 2,…相互独立,它们具有数学期望和方差:E (X k )=μk , D (X k )=σk 2≠0 (k =1,2,…).记∑==n k k n B 122σ,若存在正数δ,使得当n →∞时, {}∑=++→-n k k k nX E B 12201δδμ, 则随机变量Z n =n nk k nk k n k k n k n k k k B X X D X E X∑∑∑∑∑=====-=-11111)()(μ的分布函数F n (x )对于任意x ,满足⎰∑∑∞--==∞←∞→=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧≤-=x t n n k k n k k n n n t x B X P x F d e π211221lim )(lim μ. (5.9) 这个定理说明,随机变量Z n =n n k kn k k B X ∑∑==-11μ当n 很大时,近似地服从正态分布N (0,1).因此,当n 很大时,∑∑==+=nk k n n n k k Z B X11μ 近似地服从正态分布⎪⎭⎫ ⎝⎛∑=21,n n k k B N μ.这表明无论随机变量X k (k =1,2,…)具有怎样的分布,只要满足定理条件,则它们的和∑=n k k X1当n 很大时,就近似地服从正态分布.而在许多实际问题中,所考虑的随机变量往往可以表示为多个独立的随机变量之和,因而它们常常近似服从正态分布.这就是为什么正态随机变量在概率论与数理统计中占有重要地位的主要原因.在数理统计中我们将看到,中心极限定理是大样本统计推断的理论基础.下面介绍另一个中心极限定理.定理5.7 设随机变量X 服从参数为n ,p (0<p <1)的二项分布,则(1) (拉普拉斯(Laplace)定理) 局部极限定理:当n →∞时P {X =k }≈⎪⎪⎭⎫ ⎝⎛-=--npq np k npq npq npq np k ϕ1212)(2e π, (5.10)其中p +q =1,k =0,1,2,…,n ,2221)(x x -=e πϕ. (2) (德莫佛-拉普拉斯(De MoivreLaplace)定理) 积分极限定理:对于任意的x ,恒有 ⎰∞--∞→=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤--x t n t x p np np X P d e π2221)1(lim . (5.11) 这个定理表明,二项分布以正态分布为极限.当n 充分大时,我们可以利用上两式来计算二项分布的概率.例5.5 10部机器独立工作,每部停机的概率为0.2,求3部机器同时停机的概率. 解 10部机器中同时停机的数目X 服从二项分布,n =10,p =0.2,np =2,npq ≈1.265.(1) 直接计算:P {X =3}=310C ×0.23×0.87≈0.2013; (2) 若用局部极限定理近似计算:P {X =3}=)79.0(265.11265.123265.111ϕϕϕ=⎪⎭⎫ ⎝⎛-=⎪⎪⎭⎫ ⎝⎛-npq np k npq =0.2308. (2)的计算结果与(1)相差较大,这是由于n 不够大.例5.6 应用定理5.7计算§5.1中例5.2的概率.解 np =7000,npq ≈45.83.P {6800<X <7200}=P {|X -7000|<200}=1)36.4(236.483.457000-=⎭⎬⎫⎩⎨⎧<-ΦX P =0.99999.例5.7 产品为废品的概率为p =0.005,求10000件产品中废品数不大于70的概率. 解 10000件产品中的废品数X 服从二项分布,n =10000,p =0.005,np =50,npq ≈7.053.P {X ≤70}=)84.2(053.75070ΦΦ=⎪⎭⎫ ⎝⎛- =0.9977. 正态分布和泊松分布虽然都是二项分布的极限分布,但后者以n →∞,同时p →0,np →λ为条件,而前者则只要求n →∞这一条件.一般说来,对于n 很大,p (或q )很小的二项分布(n p ≤5)用正态分布来近似计算不如用泊松分布计算精确.例5.8 每颗炮弹命中飞机的概率为0.01,求500发炮弹中命中5发的概率.解 500发炮弹中命中飞机的炮弹数目X 服从二项分布,n =500,p =0.01,np =5,npq ≈2.2.下面用三种方法计算并加以比较:(1) 用二项分布公式计算:P {X =5}=5500C ×0.015×0.99495=0.17635.(2) 用泊松公式计算,直接查表可得:np =λ=5,k =5,P 5(5)≈0.175467.(3) 用拉普拉斯局部极限定理计算:P {X =5}=⎪⎪⎭⎫ ⎝⎛-npq np npq 51ϕ≈0.1793. 可见后者不如前者精确.小 结本章介绍了契比雪夫不等式、四个大数定律和三个中心极限定理.契比雪夫不等式给出了随机变量X 的分布未知,只知道E (X )和D (X )的情况下,对事件{|X -E (X )|≤ε}概率的下限估计.人们在长期实践中认识到频率具有稳定性,即当试验次数增大时,频率稳定在一个数的附近.这一事实显示了可以用一个数来表征事件发生的可能性的大小.这使人们认识到概率是客观存在的,进而由频率的三条性质的启发和抽象给出了概率的定义,因而频率的稳定性是概率定义的客观基础.贝努里大数定律则以严密的数学形式论证了频率的稳定性.中心极限定理表明,在相当一般的条件下,当独立随机变量的个数增加时,其和的分布趋于正态分布.这一事实阐明了正态分布的重要性.中心极限定理也揭示了为什么在实际应用中会经常遇到正态分布,也就是揭示了产生正态分布变量的源泉.另一方面,它提供了独立同分布随机变量之和∑=n k k X1(其中X k 的方差存在)的近似分布,只要和式中加项的个数充分大,就可以不必考虑和式中的随机变量服从什么分布,都可以用正态分布来近似,这在应用上是有效和重要的.中心极限定理的内容包含极限,因而称它为极限定理是很自然的.又由于它在统计中的重要性,称它为中心极限定理,这是Polya 在1920年取的名字.本章要求读者理解大数定律和中心极限定理的概率意义,并要求会使用中心极限定理估算有关事件的概率.重要术语及主题契比雪夫不等式 依概率收敛契比雪夫大数定律及特殊情况 贝努里大数定律辛钦大数定律 独立同分布中心极限定律李雅普诺夫中心极限定理 德莫佛拉普拉斯中心极限定理.习 题 五1. 一颗骰子连续掷4次,点数总和记为X .估计P {10<X <18}.2. 假设一条生产线生产的产品合格率是0.8.要使一批产品的合格率达到在76%与84%之间的概率不小于90%,问这批产品至少要生产多少件?3. 某车间有同型号机床200部,每部机床开动的概率为0.7,假定各机床开动与否互不影响,开动时每部机床消耗电能15个单位.问至少供应多少单位电能才可以95%的概率保证不致因供电不足而影响生产.4. 一加法器同时收到20个噪声电压V k (k =1,2,…,20),设它们是相互独立的随机变量,且都在区间(0,10)上服从均匀分布.记V =∑=201k k V,求P {V >105}的近似值.5. 有一批建筑房屋用的木柱,其中80%的长度不小于3m.现从这批木柱中随机地取出100根,问其中至少有30根短于3m 的概率是多少?6. 某药厂断言,该厂生产的某种药品对于医治一种疑难的血液病的治愈率为0.8.医院检验员任意抽查100个服用此药品的病人,如果其中多于75人治愈,就接受这一断言,否则就拒绝这一断言.(1) 若实际上此药品对这种疾病的治愈率是0.8,问接受这一断言的概率是多少?(2) 若实际上此药品对这种疾病的治愈率是0.7,问接受这一断言的概率是多少?7. 用Laplace 中心极限定理近似计算从一批废品率为0.05的产品中,任取1000件,其中有20件废品的概率.8. 设有30个电子器件.它们的使用寿命T 1,…,T 30服从参数λ=0.1[单位:(小时)-1]的指数分布,其使用情况是第一个损坏第二个立即使用,以此类推.令T 为30个器件使用的总计时间,求T 超过350小时的概率.9. 上题中的电子器件若每件为a 元,那么在年计划中一年至少需多少元才能以95%的概率保证够用(假定一年有306个工作日,每个工作日为8小时).10. 对于一个学生而言,来参加家长会的家长人数是一个随机变量,设一个学生无家长、1名家长、2名家长来参加会议的概率分别为0.05,0.8,0.15.若学校共有400名学生,设各学生参加会议的家长数相与独立,且服从同一分布.(1) 求参加会议的家长数X 超过450的概率?(2) 求有1名家长来参加会议的学生数不多于340的概率.11. 设男孩出生率为0.515,求在10000个新生婴儿中女孩不少于男孩的概率?12. 设有1000个人独立行动,每个人能够按时进入掩蔽体的概率为0.9.以95%概率估计,在一次行动中:(1)至少有多少个人能够进入?(2)至多有多少人能够进入?13. 在一定保险公司里有10000人参加保险,每人每年付12元保险费,在一年内一个人死亡的概率为0.006,死亡者其家属可向保险公司领得1000元赔偿费.求:(1) 保险公司没有利润的概率为多大;(2) 保险公司一年的利润不少于60000元的概率为多大?14. 设随机变量X 和Y 的数学期望都是2,方差分别为1和4,而相关系数为0.5试根据契比雪夫不等式给出P {|X -Y |≥6}的估计. (2001研考)15. 某保险公司多年统计资料表明,在索赔户中,被盗索赔户占20%,以X 表示在随机抽查的100个索赔户中,因被盗向保险公司索赔的户数.(1) 写出X 的概率分布;(2) 利用中心极限定理,求被盗索赔户不少于14户且不多于30户的概率近似值.(1988研考)16. 一生产线生产的产品成箱包装,每箱的重量是随机的.假设每箱平均重50千克,标准差为h5千克,若用最大载重量为5吨的汽车承运,试利用中心极限定理说明每辆车最多可以装多少箱,才能保障不超载的概率大于0.977. (2001研考)资料仅供参考!!!资料仅供参考!!!h。

概率论与数理统计大数定律及中心极限定理

概率论与数理统计大数定律及中心极限定理

且具有相同的数学期望和方差:E( Xk ) ,
D( X k ) 2 (k 1, 2, ), 作前 n 个随机变量
的算术平均
X
1 n
n k 1
X
k
,
则对于任意正
数 有
lim P{| X
n
|
}
lim
n
P
1 n
n k 1
X
k
1.
表 达
{| X | }是一个随机事件, 等式表
式 明,当n 时这个事件的概率趋于1,
切比雪夫大数定律 伯努利大数定律 辛钦大数定律
一、问题的引入
实例 频率的稳定性
随着试验次数的增加, 事件发生的频率逐渐稳 定于某个常数. 单击图形播放/暂停 ESC键退出
启示:从实践 中人们发现 大量测量值 的算术平均 值有稳定性.
二、基本定理
定理一(切比雪夫大数定律)
切比雪夫
设随机变量 X1, X 2 , , X n , 相互独立,
的 即对于任意正数 ,当n充分大时, 不
意 义
等式 | X | 成立的概率很大.
lim P{| Xn|来自}limn
P
1 n
n k 1
Xk
1.
证明
E
1 n
n k 1
X
k
1 n
n k 1
E(Xk )
1 n
n
,
D
1 n
n k 1
Xk
1 n2
n k 1
D( Xk
)
1 n2
n
2
2
n
,
由切比雪夫不等式可得
P
1 n
n k 1
X
k

概率论与数理统计第5章

概率论与数理统计第5章

i 1
22
例1 设有30个电子元件,它们的寿命均服从参数为 0.1的指数分布(单位:小时),每个元件工作相互 独立,求他们的寿命之和超过350小时的概率.
解 设Ti为第i个元件的寿命, i 1,2,,30,T为寿命之和
显 然T1 ,T2 ,,T30相 互 独 立
30
且 Ti ~ E(0.1), i 1,2,.30 T Ti
且EX i , DXi 2 0,则x R,有
n
lim
P
i 1
Xi
n
x
x
n
n
1
t2
e 2 dt ( x)
2
莱 维n 中心 极 限 定 理表 明
记量 即Y的Yn n分当~•i布1NnX 函(ni 0数,1n,)收随敛机则于n变YX标量准ni为~序正 • Ni列 态 n1(inXn分1iX,的 布ni 的的标2标)分准准布化化函随随数. 机 机 变变 量
1
t2
e 2 dt ( x)
n np(1 p) 2
n
证明 由于 X n ~ B(n, p) 则X n X k , k 1
其中 X1, X2 ,, Xn 是相互独立的、服从同一
(0-1) 分布的随机变量, 分布律为
P{ Xk i} pi (1 p)1i , i 0, 1.
30
分nll设布ii其 (mm0X,随-P中Pn1则机)Xin分对X变k11n,nX1布任X量Xni 2n的意k,Xpn, n随x服,,X机从xn有x变是参量相数x,x互分n,1独布21p(立e律0et2的2为t2d2 dtp、t服1()从 x的) 同二一项
20
服从均匀分布。记 V Vk 求P{V>105}的近似值 k 1

概率论与数理统计第五章_大数定律和中心极限定理精品教案

概率论与数理统计第五章_大数定律和中心极限定理精品教案

第五章 大数定律和中心极限定理本章介绍概率论中最基本也是最重要的两类定理:大数定律和中心极限定理,它们都是使用极限方法研究大量随机现象统计规律性的。

概括讲来,阐明大量重复试验的平均结果具有稳定性的定律称为大数定律;论证随机变量(试验结果)之和渐进服从某一分布的定理称为中心极限定理.5.1 大数定律在第一章我们曾指出,当试验次数很大时,随机事件发生的频率将与其概率非常接近。

本节将从理论上讨论这个问题。

为此,先介绍一个重要的不等式—切比雪夫(Chebyshev)不等式:若随机变量X 的数学期望E (X )和方差D (X )都存在,则对于任意0ε>,都有{}2()()D X P X E X εε-≤≥, (5.1)证明 仅证X 是连续型随机变量的情况.设()f x 是X 的概率密度,则{}22|()||()|222[()]|()|()d ()d 1()[()]()d x E X x E X x E X P X E X f x x f x x D X x E X f x x εεεεεε--+∞-∞--=-=⎰⎰⎰.≥≥≥≤≤ 若取3()D X ε=,由切比雪夫不等式可知{}()()3()0.119()D X P X E X D X D X -≈≥≤. 也就是说,X 落在区间(()3()()3()E X D X E X D X --以外的可能性很小,而落在此区间中的概率很大。

当D (X )较小时,X 的取值便集中在E (X )附近。

D (X )越小,X 的取值越集中在E (X )附近,这正是方差的意义所在。

显然,切比雪夫不等式可以表示成如下的等价形式:{}2()|()|1D X P X E X εε-<≥-. (5.2)当D (X )已知时,(5.2)式给出了X 与E (X )的偏差小于ε的概率的估计值.例1 设某供电网有10000盏电灯,夜晚每盏灯开灯的概率均为0.7,假定灯的开、关是相互独立的,使用切比雪夫不等式估计夜晚同时开灯的盏数在6800至7200之间的概率.解 令X 表示在夜晚同时开灯的盏数,则X 服从n =10000,p =0.7的二项分布,这时()7000E X np ==,()2100D X npq ==,由切比雪夫不等式可得22100{68007200}{|7000|200}10.95200P X P X <<=-<-≈.≥ 可见,虽然有10000盏灯,但是只要供应7200盏灯的电力就能够以相当大的概率保证够用.事实上,这个概率的近似值表明,在10000盏灯中,开着的灯数在6800到7200的概率大于0.95,而由二项概率公式算出此概率的精确值为0.99999.由此可知,切比雪夫不等式虽可用来估计概率,但精度不够高.1866年,俄国数学家切比雪夫证明了一个相当普遍的结论−−大量观察结果的平均值具有稳定性,这就是切比雪夫大数定律.定理1 切比雪夫大数定律 设随机变量12,,,,n X X X L L 相互独立,每一随机变量都有数学期望12(),(),,(),n E X E X E X L L 和有限的方差1()D X ,2()D X ,L ,()n D X ,L ,并且它们有公共上界c ,即(),1,2,k D X c k ≤=L ,则对任意ε >0,皆有1111lim ()1n nk k n k k P X E X n n ε→∞==⎧⎫-<=⎨⎬⎩⎭∑∑. (5.3)证 因12,,,,n X X X L L 相互独立,所以2211111()n nk k k k c D X D X nc n n n n ==⎛⎫== ⎪⎝⎭∑∑≤. 又因 1111()()n n k k k k E X E X n n ===∑∑,由切比雪夫不等式可得 2211111111()11n n n k k k k k k c P X E X D X n n n n εεε===⎧⎫⎛⎫≥-<--⎨⎬ ⎪⎝⎭⎩⎭∑∑∑≥≥, 所以1111lim ()1n nk k n k k P X E X n n ε→∞==⎧⎫-<=⎨⎬⎩⎭∑∑. 切比雪夫大数定律表明,相互独立的随机变量的算术平均值11n n i i X X n ==∑与其数学期望的差,在n 充分大时以概率1是一个无穷小量.这意味着在n 充分大时,n X 的值将比较紧密地聚集在它的数学期望()n E X 附近.由切比雪夫大数定律可以得到如下推论:推论1 设随机变量12,,,,n X X X L L 独立同分布,并且有数学期望μ及方差2σ,则对任意正数ε,都有11lim 1n i n k P X n με→∞=⎧⎫-<=⎨⎬⎩⎭∑. (5.4) 推论1是我们利用重复观测值的算术平均来近似真实值的理论依据.例如,要测量某一物理量a ,进行n 次重复测量,得到n 个测量值12,,,n X X X L ,显然可以视它们为n 个独立同分布的随机变量,并且有数学期望a .由大数定律可知,当n 充分大时,n 次测量的平均值可作为a 的近似值,即121(....)n a X X X n ≈+++ (5.5) 且当n 充分大时,近似计算的误差很小.定理2 贝努里大数定律 设n μ是n 重贝努里试验中事件A 出现的次数,p 是事件A 在每次试验中出现的概率,则对任意0ε>,都有lim 1n n P p n με→∞⎧⎫-<=⎨⎬⎩⎭. (5.6) 证 设i X 是第i 次试验中事件A 发生的次数,则i X 服从参数为p 的0-1分布,(),()i i E X p D X pq ==,其中1,1,2,3,,q p i n =-=L .又12,,,n X X X L 相互独立,且1nn i i X μ==∑,从而有1111(),n n n i i i i E E X E X p n n n μ==⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭∑∑ 21111()n n n i i i i pq D D X D X n n n n μ==⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭∑∑. 由切比雪夫不等式得221n n pq P p D n n n μμεεε⎧⎫⎛⎫-=⎨⎬ ⎪⎝⎭⎩⎭≥≤, 因此lim 0n n P p n με→∞⎧⎫-=⎨⎬⎩⎭≥, 亦即lim 1n n P p n με→∞⎧⎫-<=⎨⎬⎩⎭. 历史上,贝努里大数定律是概率论中极限定理方面的第一个重要结论。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
n
Yn x
lim P i1 n
n
x
x
证明略。
在实用上,n≥30
1
t2
e 2 dt
2
此定理表明,当n充分大时,Yn近似服从N 0,1.
n
即: X(i 近似)~N (n, n 2 ), i=1
从而,P(a
n i 1
Xi
b)
(b n ) ( a n ).
n
n
答案:N (, 2 )
关键词: 总体 个体 样本 统计量
2 分布 t 分布 F 分布
23
引言:数理统计学是一门关于数据收集、整理、分析 和推断的科学。在概率论中已经知道,由于大 量的 随机试验中各种结果的出现必然呈现它的 规律 性,因而从理论上讲只要对随机现象进行 足够多次观察,各种结果的规律性一定能清楚 地呈现,但是实际上所允许的观察永远是有限 的,甚至是 少量的。 例如:若规定灯泡寿命低于1000小时者 为次 品,如何确定次品率?由于灯泡寿命试验是 破坏性试验,不可能把整批灯泡逐一检测,只 能抽取一部分灯泡作为样本进行检验,以样本 的信 息来推断总体的信息,这是数理统计学研 究的问题之一。
24
§1 总体和样本
总体:研究对象的全体。如一批灯泡。 个体:组成总体的每个元素。如某个灯泡。 抽样:从总体X中抽取有限个个体对总体进行观察的取值过程。 随机样本:随机抽取的n个个体的集合(X1,X2,…,Xn), n为样本容量 简单随机样本:满足以下两个条件的随机样本(X1,X2,…,Xn)称
2. 用泊松分布近似计算
np 400 0.02 8 查表得
P X 2 1 P X 0 P X 1 1 0.000335 0.002684 0.9969
3. 用正态分布近似计算
npq 400 0.02 0.98 2.8
P
X
2
1
P( X
1)
1
1 np npq
贝努里大数定律建立了在大量重复独立试验中事件出现频 率的稳定性,正因为这种稳定性,概率的概念才有客观意 义,贝努里大数定律还提供了通过试验来确定事件概率的 方 们法便,可既以然通频过率做试nA/验n与确概定率某p事有件较发大生偏的差频的率可并能把性它很作小为,相我 应的概率估计,这种方法即是在第7章将要介绍的参数估 计法,参数估计的重要理论基础之一就是大数定理。
n
定理5.5 德莫佛--拉普拉斯定理
设nA为n次贝努里试验中A发生的次数,P A p 0 p 1,
则对任意x,有:lim n
P
nA np np(1 p)
x
x
1
e
t2 2
dt
(x),
2
证明:令X i
1 0
第i次试验时A发生 第i次试验时A未发生
则X 1
,
X
2
,
, Xn,
相互独立同分布,Xi ~ b(1, p).
1
lim
n
P
n
n i 1
Xi
1
或者,
序列
X
1 n
n i=1
Xi
以概率收敛于
即 X P
03,3,4分
7
定理5.3 贝努里大数定理
设事件A在每次试验中发生的概率为p,记nA为n次独立重复试验
中A发生的次数, 则
0, 有:lim
P
式,因nA bn, p,故:
3
随机变量序列依概率收敛的定义
定义5.1:设随机变量序列X1, X2, X3, ,若存在某常数,
使得 0,均有:lim P n
Xn
0,
则称随机变量序列 X n 依概率收敛于常数,
记为:Xn p 。
性质:已知Xn p ,并知函数g(x)在x=处连续,
则g Xn p g
4
定理5.2 契比雪夫不等式的特殊情形:
解:设X为一年中投保老人的死亡数,则X bn, p,n 10000, p 0.017
由德莫佛--拉普拉斯中心极限定理,保险公司亏本的概率为:
P10000X 10000200 P X 200
1
200 np
np 1 p
思考题: 求保险公司至少 盈利10万元的概率。
12.321 0.01 答案:0.937
由于nA X1 X 2 X n ,
Pa nA b
( b np ) np(1 p)
( a np ) np(1 p)
由定理5.4,
lim
n
P
nA np np(1 p)
x
x
1
t2
e 2 dt
2
即:nA (近似) ~ N (np, np(1 p)). 二项分布和正态分布的关系
第六章 样本及抽样分布
x 2
x
2
f x dx
1
2
x 2 f x dx
DX
2
2 2
17
定理5.2 契比雪夫不等式的特殊情形:
设随机变量序列X 1
,
X
2
,
, Xn,
相互独立,
且具有相同的数学期望和相同的方差 2,
作前n个随机变量的算术平均:Yn
1 n
n k 1
Xk
则 0,有:
lim P
设随机变量序列X 1
,
X
2
,
, Xn,
相互独立,
且具有相同的数学期望和相同的方差 2,
作前n个随机变量的算术平均:Yn
1 n
n k 1
Xk
则 0,有:
lim P
n
Yn
lim
n
P
1 n
n
Xk
k 1
1
证明:由于E
Yn
E
1 n
n k 1
Xk
1 n
n
,
D
Yn
D
1 n
n k 1
定理5.4 独立同分布的中心极限定理
设随机变量X 1
,
X
2
,
, Xn,
相互独立同分布,
E Xi , D Xi 2 0,i 1, 2,
n
Xi n
则前n个变量的和的标准化变量为:Yn i1 n
思考题:
X
1 n
n
Xi的近似
i=1
分布是什么?
x R,有:
n
Xi n
lim P
相互独立同分布,Xi ~ b(1, p).
由于nA X1 X 2 X n ,
Pa nA b
( b np ) np(1 p)
( a np ) np(1 p)
由定理5.4,
lim
n
P
nA np np(1 p)
x
x
1
t2
e 2 dt
2
即:nA (近似) ~ N (np, np(1 p)). 二项分布和正态分布的关12 系
证明:仅就X为连续型时证之 设X的概率密度为f x,
则 P X f x dx x
f (x)
x 2
x
2
f x dx
1
2
x 2 f x dx
DX
2
2 2
例1:在n重贝努里试验中,若已知每次试验事件A 出现的概率为0.75,试利用契比雪夫不等式估 计n,使A出现的频率在0.74至0.76之间的概率不 小于0.90。
根据独立同分布的中心极限定理:
16
Y
i 1
Xi 16100 4 100
X
1600 400
近似服从N
0,1
P X 1920 1 P X 1920
1
1920 1600 400
1 0.8 0.2119
14
例3:某保险公司的老年人寿保险有1万人参加,每人每年交200元, 若老人在该年内死亡,公司付给受益人1万元。设老年人死亡 率为0.017,试求保险公司在一年内这项保险亏本的概率。
§1 大数定律
背景 本章的大数定律,对第一章中提出的 “频率稳定性”,给出理论上的论证
为了证明大数定理,先介绍一个重要不等式
1
定理5.1 契比雪夫不等式:
设随机变量X具有数学期望E X ,方差D X 2
则对于任意 0,都有:P
X EX
2 2
定理的等价形式为:P
X
E
X
1
2 2
n
Yn
lim
n
P
1 n
n
Xk
k 1
1
证明:由于E
Yn
E
1 n
n k 1
Xk
1 n
n
,
D
Yn
D
1 n
n k 1
Xk
1 n2
n
D Xk
k 1
1 n2
n 2
2
n
由契比雪夫不等式得:P
1 n
n k 1
Xk
1
2
2
n
lim P n
1 n
n k 1
Xk
1
18
定理5.4 独立同分布的中心极限定理
设随机变量X 1
,
X
2
,
, Xn,
相互独立同分布,
E Xi , D Xi 2 0,i 1, 2,
n
Xi n
则前n个变量的和的标准化变量为:Yn i1 n
思考题:
X
1 n
n
Xi的近似
i=1
分布是什么?
x R,有:
n
Xi n
lim P
E
nA n
1 n
E
nA
1 n
np
p,
D
nA n
相关文档
最新文档