大数定理与中心极限定理5
第五章 大数定律和中心极限定理
一、大数定律切比雪夫大数定律:设随机变量X1,X2,…,X n,…相互独立,且具有相同的数学期望且方差有界,那么对辛钦大数定律:设X1,X2,…,X n,…为独立同分布的随机变量序列,且数学期望E(X i)=μ存在,则对任意【例87·填空题】设X1,X2,…,X n,…相互独立,且都服从P(λ),那么依概率收敛到_____[答疑编号986305101:针对该题提问]答案:【例88·填空题】设X1,X2,…,X n,…相互独立,且都服从参数为0.5的指数分布,则。
[答疑编号986305102:针对该题提问]【例89·选择题】设随机变量列X1,X2,…,X n,…相互独立,则根据辛钦大数定律,当n充分大时依概率收敛于共同的数学期望,只要X1,X2,…,X n,…()A.有相同的数学期望B.服从同一离散型分布C.服从同一泊松分布D.服从同一连续型分布[答疑编号986305103:针对该题提问]答案:C【例90·选择题】设随机变量,X1,X2,…,X n,…是独立同分布,且分布函数为则辛钦大数定律对此序列()A.适用B.当常数a,b取适当的数值时适用C.不适用D.无法判别[答疑编号986305104:针对该题提问]答案C二、中心极限定理独立同分布的中心极限定理:设随机变量X1,X2,…,X n,…相互独立,服从同一分布,【例91·选择题】(05-4-4)设X1,X2,…,X n,…为独立同分布的随机变量列,且均服从参数为λ(λ>0)的指数分布,记为标准正态分布函数,则()[答疑编号986305105:针对该题提问]答案:C。
第五章 大数定律和中心极限定理
第三节 中心极限定理
所谓中心极限定理,就是关于大量微小的随机变量之和的极限分布在什么条件下是正态分布的定理. 定义 1 设 { X n } 为一随机变量序列, DX n , n 1,2, ,若
2
83
n a n lim P(a X i b) P n i 1 n
X
i 1
n
i
n
n
b n b n a n ) ( ). ( n n n
例 1 一加法器同时收到 50 个噪声电压 Vi (i 1,2, ,50 ) , 设 V i (单位: 微伏)相互独立且均在 [0,10] 上 服从均匀分布,求该加法器上总电压 V
i 1
n
1 n2
c n 0(n ) ,
i 1
n
c
推论 2 (贝努里大数定律) 设 S n 为 n 重贝努里试验中事件 A 出现的次数, p 为 A 在每次 n
证 明 :令 Xi
1 在第i 次试验中A出现 , 则 X i ~ B(1, p ) , i 1,2,, n 且 相 互 独 立 , 0 在第 i 次试验中 A 不出现
c 0 ,使得 DX n c , n 1,2, ,则
P 1 n ( X i EX i ) 0 . n i 1
证明:只须验证马尔可夫条件成立即可.由于 { X n } 两两互不相关,故
0
因此马尔可夫条件成立.
n 1 1 D ( Xi) 2 2 n n i 1
DX i
05大数定律及中心极限定理
概率论
定 1 得 由 理即 nA limP{| − p |< ε } n→∞ n 1 = limP{| ( X1 + X2 +L+ Xn ) − p |< ε } = 1 n→∞ n nA 或 limP{| − p |≥ ε } = 0 证毕
n→ ∞
n
注 贝努里大数定律表明,当重复试验次数n充分 贝努里大数定律表明,当重复试验次数 充分 大时,事件A发生的频率 发生的频率n 与事件 的概率p有较 与事件A的概率 大时,事件 发生的频率 A/n与事件 的概率 有较 大偏差的概率很小. 大偏差的概率很小
概率论
说明
1n 1 定 中 ∑ Xi −µ |< ε }是 一 随 事 , 、 理 {| 指 个 机 件 ni=1 n 当 →∞时 这 事 的 率 于 . , 个 件 概 趋 1
2 定 以 学 式 明 随 变 X1,LXn 、理 数 形 证 了 机 量 1n 的 术 均 = ∑ Xi 接 数 期 E( k = µ 算 平 X 近 学 望 X) ni=1 k , ( = 1,2L n) 这 接 说 其 有 稳 性. , 种 近 明 具 的 定
n→∞ np(1− p) t2 1 − 2 = Φ(x) e dt 2π
≤ x} = limP{ k=1
∑ Xk − np np(1 − p)
n
≤ x}
ηn ~ N(np, np(1− p))
近似地
limP{
n→∞
ηn − np
np(1− p)
≤ x} = ∫−∞
x
1 e dt = Φ(x) 2π
t2 − 2
η 证 由第四章知识知可将 n分解成为n个相互独立、
从 一 服 同 (0 − 1)分 的 随 变 X1, X2,LXn之 , 布 诸 机 量 和
第五章 大数定律与中心极限定理
中心极限定理
独立随机变量和
设 {Xn} 为独立随机变量序列,记其和为
Yn = ∑Xi
i=1 n
讨论独立随机变量和的极限分布, 指出极限分布为正态分布.
13 July 2011
湖南大学
第五章 大数定律与中心极限定理
第18页 18页
独立同分布下的中心极限定理
林德贝格—勒维中心极限定理 设 {Xn} 为独立同分布随机变量序列,数学期 望为µ, 方差为 σ2>0,则当 n 充分大时,有
解: 设 X 表示命中的炮弹数, 则 X ~ b(500, 0.01)
(1) P( X = 5) = C ×0.015 ×0.99495 =0.17635
5 500
(2) 应用正态逼近: P(X=5) = P(4.5 < X < 5.5) = 0.1742
13 July 2011
5.5 − 5 4.5 − 5 ≈ Φ −Φ 4.95 4.95
第五章 大数定律与中心极限定理
第25页 25页
三、给定 y 和概率,求 n
例7 用调查对象中的收看比例 k/n 作为某电视节
目的收视率 p 的估计。 要有 90% 的把握,使k/n与p 的差异不大于0.05,问至少要调查多少对象?
解:用 Yn表示n 个调查对象中收看此节目的人数,则
P ( Yn / n − p < 0.05) ≈ 2Φ 0.05 n / p(1 − p) − 1 ≥ 0.90
湖南大学
湖南大学
第五章 大数定律与中心极限定理
第16页 16页
X 例 设 1, X2 ,L, Xn是独 立同 布 分 的随 变量 它们 机 , 都服 从 [a, b]上的 [ 均匀 布 f (x)是 a, b]上 连 函 , 分 , 的 续 数 证明 :
(完整版)大数定律和中心极限定理
第五章 大数定律和中心极限定理一、内容提要(一)切贝谢夫不等式 1. 切贝谢夫不等式的内容设随机变量X 具有有限的数学期望E (X )和方差D (X ),则对任何正数ε,下列不等式成立。
(){}()(){}().1,22εεεεX D X E X P X D X E X P -≤-≤≥-2. 切贝谢夫不等式的意义(1)只要知道随机变量X 的数学期望和方差(不须知道分布律),利用切贝谢夫不等式,就能够对事件(){}ε≥-X E X 的概率做出估计,这是它的最大优点,今后在理论推导及实际应用中都常用到切贝谢夫不等式。
(2)不足之处为要计算(){}ε≥-X E X P 的值时,切贝谢夫不等式就无能为力,只有知道分布密度或分布函数才能解决。
另外,利用本不等式估值时精确性也不够。
(3)当X 的方差D (X )越小时,(){}ε≥-X E X P 的值也越小,表明X 与E (X )有较大“偏差”的可能性也较小,显示出D (X )确是刻画X 与E (X )偏差程度的一个量。
(二)依概率收敛如果对于任何ε>0,事件{}ε a X n -的概率当n →∞时,趋于1,即{}1lim =-∞→ε a X P n n ,则称随机变量序列X 1,X 2,…,X n ,…当n →∞时依概率收敛于α。
(三)大数定律 1. 大数定律的内容(1)大数定律的一般提法若X 1,X 2,…,X n ,…是随机变量序列,如果存在一个常数序列α1,…,αn ,…,对任意ε>0,恒有11lim 1=⎭⎬⎫⎩⎨⎧-∑=∞→ε n i n i n a X n P , 则称序列{X n }服从大数定律(或大数法则)。
(2)切贝谢夫大数定律设随机变量X 1,X 2,…,X n ,…相互独立,分别有数学期望E(X i )和方差D(X i ),且它们的方差有公共上界C ,即()().,,,2,1, n i C X D i =≤则对于任意的ε>0,恒有()111lim 11=⎭⎬⎫⎩⎨⎧-∑∑==∞→ε n i ni i i n X E n X n P 。
第五章大数定律及中心极限定理
k 1
其中 X1, X2 ,, Xn是相互独立的、服从同一
均值为μ,方差为σ2>0的独立同分布的随机变量
n
X1,X2,…,Xn之和 X k 的标准化变量,当n充分
大时,有
k 1
n
k 1
Xk
nm
~近似N(0,1)
ns
n
这样可以用(标准)正态分布来对 X k 作
k 1
理论分析或实际计算,不必求分布函数
19/41
§5.2 中心极限定理
将上式改写为
即对任意的正数ε,当n充分
lim P n
1 n
n k 1
Xk
m
1.
大时,不等式 立的概率很大
|
X
m | 成
3/41
证 由随机变量X1,X2,…,Xn,…相互独立,且具有 相同的数学期望和方差,有
E
1 n
n k 1
Xk
lim
n
P
1 n
(X1
X2
Xn)
p
1,
即
lim
n
P
nA n
p
1.
伯努利大数定理表明,事件发生的频率nA/n依概率收敛
于事件的概率p,以严格的数学形式表达了频率的稳定性和概
率的合理性
近似:当n很大时,事件发生的频率nA/n与概率有较大偏差的 可能性很小,因此由实际推断原理,由于小概率事件几乎不
辛钦定 理
X P m
第五章 大数定律与中心极限定理 《概率论》PPT课件
概率论与数理统计
§5.2 中心极限定理
2)中 心极限 定理表明,若 随 机 变 量 序 列
X 1 , X 2 , , X n 独立同分布,且它们的数学期
望及方差存在,则当n充分大时,其和的分布,
n
即 X k 都近似服从正态分布. (注意:不一定是 k 1
标准正态分布)
3)中心定理还表明:无论每一个随机变量 X k ,
概率论与数理统计
§5.1 大数定律
定理1(Chebyshev切比雪夫大数定律)
假设{ Xn}是两两不相关的随机
变量序列,EXn , DXn , n 1,2, 存在,
其方差一致有界,即 D(Xi) ≤L,
i=1,2, …, 则对任意的ε>0,
lim P{|
n
1 n
n i1
Xi
1 n
n i1
E(Xi ) | } 1.
概率论与数理统计
§5.2 中心极限定理
现在我们就来研究独立随机变量之和所 特有的规律性问题.
在概率论中,习惯于把和的分布 收敛于正态分布这一类定理都叫做中心 极限定理.
下面给出的独立同分布随机变量序 列的中心极限定理, 也称列维——林德 伯格(Levy-Lindberg)定理.
概率论与数理统计
§5.2 中心极限定理
大量的随机现象平均结果的稳定性
大量抛掷硬币 正面出现频率
生产过程中的 字母使用频率 废品率
概率论与数理统计
§5.1 大数定律
一、大数定律
阐明大量的随机现象平均结果的稳定性的一系
列定理统称为大数定律。
定义1 如果对于任意 0, 当n趋向无穷时,事件
" Xn X " 的概率收敛到1,即
第五章 大数定律与中心极限定理
【解】 设 X i 表示“该射手第 i 次射击的得分”,则 Y = X i 表示射手所得总分,
i=1
Xi (i =1, 2, , 200) 独立同分布,分布表如下:
Xi
0
2
3
4
5
p
由于
0.1
0.1
0.2
0.2
0.4
E( Xi ) = 0×0.1+ 2×0.1+ 3×0.2 + 4×0.2 + 5×0.4 = 3.6 ;
试验中发生的概率,这个定律以严格的数学形式刻画了频率的稳定性,在实际应用中,当试 验次数很大时,便可以用事件发生的频率来替代事件的概率.
3、辛钦大数定律
设随机变量序列 X , X , 12
,Xn,
相互独立且服从相同的分布,具有相同的数学期望
E(X i
)
=
μ
,(
i
=
1,
2,
) ,则对任意给定的正数 ε ,有
) ,则对任意实数 x ,有
∑ ⎧
⎪
n
X − nμ i
⎫ ⎪
⎨ lim P i=1
≤ x⎬ =
⎪ n→∞
nσ
⎪
⎩
⎭
∫ 1
2π
x −t2
e
−∞
2 dt = Φ(x) .
154
第五章 大数定律与中心极限定理
n
∑ 【评注】 n 个相互独立同分布、方差存在的随机变量之和 Xi ,当 n 充分大时,近似 i =1
第五章 大数定律与中心极限定理
本章学习要点
① 了解切比雪夫不等式; ② 了解切比雪夫大数定律、伯努利大数定律和辛钦大数定律(独立同分布随机变量的大
第五章 大数定理与中心极限定理
说明
1 n 1、定理中{| X i | }是指一个随机事件, n i 1 当n 时,这个事件的概率趋于1.
2、 定理以数学形式证明了随机变量X 1 , X n 1 n 的算术平均X X i 接近数学期望E(X k) n i 1 (k 1,2, n),这种接近说明其具有的稳定性 .
第五章 大数定律与中心极限定理
第五章 大数定律与中心极限定理
§1 大数定律
1.1 切比雪夫不等式 1.2 依概率收敛 1.3 大数定律
§2 中心极限定理
HaiNan University
1
第五章 大数定律与中心极限定理
大数定律的客观背景
事件发生的频率稳定于某一常数 大量随机试验中 测量值的算术平均值具有稳定性
证明 取连续型随机变量的情况来证明.
设 X 的概率密度为 f ( x ), 则有
HaiNan University3第五章 大数定律 Nhomakorabea中心极限定理
P{ X μ ε }
2 x μ ε
x μ ε
f ( x)d x
x μ f ( x)d x 2 ε
1 1 2 2 2 ( x μ) f ( x ) d x 2 σ . ε ε
定理2 (契比雪夫大数定律)
1 nM M 1 D( X i ) 2 D( X i ) 2 . n i 1 n n n i 1 由契比雪夫不等式得: M 1 n 1 n P{ X i E ( X i ) } 1 n n i 1 n i 1 2
HaiNan University
10
第五章 大数定律与中心极限定理
1.3 大数定律
问题 : 设nA是n重贝努利试验中事件A发生 的次数,p是事件A发生的概率,
第5章大数定律和中心极限定理资料
第5章 大数定律和中心极限定理本章教学基本要求1.了解切比雪夫不等式,会用该不等式估算某些事件的概率.2.了解相关大数定律.3.了解相关中心极限定理,会用定理近似计算事件的概率.5.1大数定律一、主要知识归纳1.切比雪夫不等式:设随机变量X 具有均值u X E =)(,方差2)(σ=X D ,则对于任意正数ε,有不等式 22}{εσε≤≥-u X P 成立.2. 切比雪夫大数定理:设随机变量⋅⋅⋅,,21X X 相互独立,均具有有限方差,且有公共上界,即C X D i <)( )2,1( =i ,则对于任意0>ε,有1})(11{lim 11=<-∑∑==∞→εni i n i i n X E n X n P 成立.3.辛钦大数定理:设⋅⋅⋅,,21X X 相互独立,服从同一分布的随机变量序列,且具有数学期望u X E k =)(),2,1(⋅⋅⋅=k .作前n 个变量的算术平均值∑=ni i X n 11,则对于任意0>ε,有1}1{lim 1=<-∑=∞→εu X n P ni i n 成立 4.伯努利大数定理:设X 是n 次重复独立试验中事件A 发生的次数,)10(<<p p 是在一次试验中事件A 发生的概率,则对于任意正数ε,有0}{lim =≥-∞→εp nXP n 成立.二、基础练习1.设随机变量X 的数学期望u X E =)(,方差2)(σ=X D ,试利用切比雪夫不等式估计下列概率值:(1)}{σ≥-u X P (2)}3{σ≥-u X P .2.用切比雪夫不等式估计200个新生儿中,男孩多于80个且少于120个的概率(假定生男孩和女孩的概率均为0.5)3.设随机变量n X X X ,,,21⋅⋅⋅是独立同分布的随机变量,其分布函数为)0(arctan 1)(≠+=b bxa x F π,则辛钦大数定理对此序列( ) A 适用 B 当常数a 、b 取适当数值时适用 C 不适用 D 无法判断5.2中心极限定理一、主要知识归纳:1.独立同分布中心极限定理:设随机变量n X X X ,,,21⋅⋅⋅相互独立服从同一分布,且具有有限的均值与方差,则对任意实数x 有⎰∑∑∑∞--===∞→=<-xt ni i ni i ni in dt ex X D X E XP 2111221})()({lim π成立.2.棣莫佛-拉普拉斯(De Moivre-Laplace )定理:设X ~),(p n B ,则对任意实数x ,有)(21})1({lim 22x dt ex p np np X P t xn Φ==<---∞-∞→⎰π成立.二、基础练习1.一加法器同时收到20个噪声电压k V )20,,2,1(⋅⋅⋅=k ,设它们是相互独立的随机变量,且都在区间)10,0(上服从均匀分布.记∑==201k kVV ,求}105{>V P 的近似值.2.对于一个学生而言,来参加家长会的家人是一个随机变量,设一个学生无家长、1名家长、2名家长来参加会议的概率分别为0.05、0.8、0.15.若学校共有400名学生,设各学生参加会议的家长人数相互独立,且服从同一分布. (1)求参加会议的家长人数X 超过450的概率;(2)求有1名家长来参加会议的学生人数不多于340的概率.本章小结一 本章知识结构图二、综合练习1. 设随机变量X 的数学期望100)(=X E ,方差10)(=X D ,则由切比雪夫不等式有______}12080{≥<<X P .2.一颗骰子连续掷4次,点数总和为X .估计}1810{<<X P .3.生产灯泡的合格率为0.6,求10000个灯泡中合格数在5800~6200的概率.4.一大批种蛋中,良种蛋占80%.从中任取500枚,求其中良种蛋率未超过81%的概率.5.某商店负责供应某地区1000人商品,某种商品在一段时间内每人需用一件的概率为0.6,假定在这一段时间个人购买与否彼此无关,问商店应预备多少件这种商品,才能以99.7%的概率保证不会脱销(假定该商品在某一段时间内每人最多可以买一件).6.对敌人的防御阵地进行100次轰炸,每次轰炸命中目标的炸弹数目是一个随机变量,其数学期望是2,方差是1.69,求在100次轰炸中有180颗到220颗炸弹命中目标的概率.7.设)50,,2,1( =i X i 是相互独立的随机变量,且它们都服从参数为03.0=λ的泊松分布.记5021X X X Z +++= ,利用中心极限定理计算}3{≥Z P8.设某种器件使用寿命(单位:小时)服从指数分布,其平均使用寿命为20小时,具体使用时是当以器件损坏后立即更换另一新器件,如此继续,已知每个器件进价为a 元,试求在年计划中应为此器件作多少元预算,才可以有95%的把握一年够用(假定一年有2000个工作小时).三、单元测试一、 填空题:(每小题5分,共20分)1.设随机变量X 与Y 相互独立,且1)(-=X E ,1)(=Y E ,2)(2=X E ,3)(2=Y E ,则由切比雪夫不等式有______}6{≥<+Y X P .2.设n X X X ,,,21⋅⋅⋅是n 个相互独立同分布的随机变量,u X E i =)(,8)(=i X D ,),,2,1(n i ⋅⋅⋅=,对于∑==ni inX X 1,则______}{≤≥-εu X P ,______}4{≥<-u X P . 3.设X ~)6.0,200(B ,当999.0}{≥≤k X P 时,则______≥k . 4.设随机变量10021,,,X X X ⋅⋅⋅相互独立同分布,且1!1}{-==e k k X P i ,⋅⋅⋅=,2,1k ,则______}120{1001=<∑=i i X P .二、选择题:(每小题5分,共20分)1.设随机变量X ~),(2σu N ,则随σ的增大,概率}{σ<-u X P 是( ) A 单调增大 B 单调减少 C 保持不变 D 增减不定2.设⋅⋅⋅,,21X X 为独立同分布序列,且i X ),2,1(⋅⋅⋅=i 服从参数为λ的指数分布,则( )其中dt ex Y t x2221)(-∞-⎰=π.A )(}{lim 1x Y x nnX p ni i n =≤-∑=+∞→λ B )(}{lim 1x Y x nnXp ni in =≤-∑=+∞→C )(}{lim 1x Y x nXp ni in =≤-∑=+∞→λλD )(}{lim 1x Y x n Xp ni in =≤-∑=+∞→λλ3.设随机变量921,,,X X X ⋅⋅⋅相互独立同分布,1)(=i X E ,1)(=i X D ,)9,,2,1(⋅⋅⋅=i ,令∑==919i iXS ,则对任意0>ε,从切比雪夫不等式直接可得( )A 2911}1{εε-><-S P B 2991}9{εε-≥<-S PC 2911}9{εε-><-S P D 2911}191{εε-≥<-S P4.假设随机变量⋅⋅⋅,,21X X 相互独立且服从同参数λ的泊松分布,则下面随机变量序列中不满足切比雪夫大数定律的是( )A ⋅⋅⋅⋅⋅⋅,,,,21n X X XB ⋅⋅⋅+⋅⋅⋅++,,,2,121n X X X nC ⋅⋅⋅⋅⋅⋅,1,,21,21n X nX X D ⋅⋅⋅⋅⋅⋅,,,2,21n nX X X 三、计算题:(每小题12分,共60分)1.已知正常成人男性血液中,每一毫升含白细胞数平均为7300,均方差为700,试利用切比雪夫不等式估计每毫升含白细胞数在5200至9400之间的概率.2.设各零件的重要都是随机变量,它们相互独立,且服从相同的分布,其数学期望为0.5公斤,均方差为0.1公斤.问5000只零件的总重量超过2510公斤的概率是多少?3.一部件包括10个部分,每部分的长度是一个随机变量,它们相互独立,且服从同一分布,其数学期望为2毫米,均方差为0.05毫米.规定总长度为20±0.1毫米时产品合格,试求产品合格的概率.4.某工厂生产炭末电阻,在正常生产情况下,废品的概率为0.01,今取500个装成一盒,问废品不超过5个的概率是多少?5.有一批建筑房屋用的木柱,其中80%的长度不小于3米,现从木柱中随机取出100根,问其中至少有30根短于3米的概率是多少?第6章 数理统计基础知识本章教学基本要求1.理解总体、样本、统计量等基本概念,了解经验分布函数。
第五章大数定律与中心极限定理
Xi
1 n
n i 1
E(Xi)
1,
则称{Xn}服从大数定律.
(2)伯努利大数定律是切比雪夫大数定律的特例
(3) 伯努利大数定律和切比雪夫大数定律的证明 都用到切比雪夫不等式,而且需要方差存在。
定理 5.1.4. 辛钦大数定律
设X1, X 2 ,..., X n,...是独立同分布的随机变量序列,
意义:只要试验次数够大,发生事件的频率无限接近于 概率,频率稳定性,频率代替概率。
定理 5.1.3. 切比雪夫大数定律
设X1 , X 2 ,, X n ,是一相互独立的随机变 量序列,
它们的数学期望和方差 均存在,且方差有共同 的上界,
即存在常数 K 0,使得 D ( X i ) K , i 1,2, ,
不等式给出了X 与它的期望的偏差不小于的概率
的估计式.
例 1 E( ) 4, D( ) 0.2, 则由切比雪夫不等式知
P{| 4 | 2} P{| 4 | 1}
,
P{ X
}
2 2
,
P{1 7}
定义 5.1.1设{X n}是一个随机变量序列,a是常数,
若对于任意的 0,有
已知整个系统中至少有84个部件正常工作,系统
工作才正常.试求系统正常工作的概率.
解: 记Y为100个部件中正常工作的部件数,则
Y 近似服从 N(100 0.9,100 0.9 (1 0.9))
即Y 近似服从N (90, 9)
因此,所求概率为
P{Y 84}=1-P{Y<84}=1-P{ Y-90 < 84-90 }
解: 设Xi为第i个螺丝钉的重量,i 1, 2,...,100.
且设X 为一盒螺丝钉的重量.
第五章大数定律与中心极限定理
• 例:一加法器同时收到 个噪声电压 k(k=1,2,…,20), 一加法器同时收到20个噪声电压 一加法器同时收到 个噪声电压V 它们相互独立且都在区间[0,10]上服从均匀分布 噪声 上服从均匀分布,噪声 它们相互独立且都在区间 上服从均匀分布 的近似值. 电压总和V=V1+V2+…+V20,求P{V>105}的近似值 电压总和 求 的近似值 • 解:易知 易知E(Vk)=5,D(Vk)=100/12,由独立同分布的中心 易知 由独立同分布的中心 20 极限定理知
∑ D( X
k =1
n
k
)=
σ2
n
1 n 所以 P{| ∑ X k − µ |< ε } = P {| X n − E ( X n ) |< ε } n k =1 D( X n ) σ2 ≥ 1− = 1− 2 2 nε ε
设随机变量序列{Y 如果存在一个常数a 定义 设随机变量序列{Yn},如果存在一个常数a,使得 ε>0 对任意的 ε>0,有
1 故 n
X k 1 . ∑ 2 P→ 3 k =1
§2
中心极限定理
定理(林德贝尔格 勒维 定理):设 定理 林德贝尔格-勒维 林德贝尔格 勒维(Lindeberg-Levy)定理 设 定理 {Xk}为相互独立的随机变量序列 服从同一分布 且 为相互独立的随机变量序列,服从同一分布 为相互独立的随机变量序列 服从同一分布,且 具有数学期望E(Xk)=µ和方差 和方差D(Xk)=σ2 ,则随机变 具有数学期望 和方差 则随机变 量
X 1 ~ U ( −1, 1). 则 1 (1) n X k,(2)1 ∑ n k =1
n 2 X k 分别 依概 率收 敛吗 ? ∑ k =1 n
第五章大数定理与中心极限定理
2. 随机事件的频率
lim P p =1 n n
p f n p
n
作业
P112
1、3、6、7
§5.4中心极限定理
在客观实际中有许多随机变量,它们是由大 量的相互独立的随机因素的综合影响所形成的。 而其中每一个别因素在总的影响中所起的作用 都是微小的。这种随机变量往往近似地服从正 态分布,这种现象就是中心极限定理的客观背 景。
设{ξn}为随机变量序列,ξ为随机变量,其对 应的分布函数分别为Fn(x), F(x). 若在F(x)的连 续点,有
第五章
大数定律与中心极限定理
5.1大数定律的概念 5.2切贝谢夫不等式 5.3切贝谢夫定理 5.4中心极限定理
“概率是频率的稳定值”。前面已经提到, 当随机试验的次数无限增大时,频率总在其概 率附近摆动,逼近某一定值。大数定理就是从 理论上说明这一结果。正态分布是概率论中的 一个重要分布,它有着非常广泛的应用。中心 极限定理阐明,原本不是正态分布的一般随机 变量总和的分布,在一定条件下可以渐近服从 正态分布。这两类定理是概率统计中的基本理 论,在概率统计中具有重要地位。
பைடு நூலகம்
大数定律以确切的数学形式表达了这种规 律性,并论证了它成立的条件,即从理论上阐述 了这种大量的、在一定条件下的、重复的随机 现象呈现的规律性即稳定性.由于大数定律的作 用,大量随机因素的总体作用必然导致某种不依 赖于个别随机事件的结果.
§5.2 切贝谢夫不等式
一个随机变量离差平方的数学期望就是它的
f n p
n
证明:设
则
1 第i次试验事件A发生 i 0 第i次试验事件A不发生
E (i ) p, D(i ) p(1 p)
5第五章大数定律与中心极限定理资料
例1
某人要测量甲、乙两地之间的距离。限于测量
工具,他分成 1200 段来测量。 每段测量误差(单位:
厘米)服从于(-0.5, 0.5)上的均匀分布。求总距离误 差的绝对值超过20厘米的概率。
解
设第k 段的测量误差为 X k
k 1,2,,1200.
,1200.
且 X 1 , X 2 ,, X 1200 是独立同分布的随机变量。且
定理1(独立同分布的中心及限定理)
设 X1, X 2 ,
, Xn,
相互独立, 且服从同一分布,
即独立同分布,且具有相同的期望和方差
E X k , D X k 2 0, k 1,2, , n.
则
n X i n i 1 lim P x ( x) n n
X
i 1
n
i
在什么条件下趋于什么分布。
§5.1 大数定律
大数定律的客观背景
大量抛掷硬币 正面出现频率
生产过程中的 字母使用频率 废品率
大量的随机现象中平均结果的稳定性
几个常见的大数定律
定理1(切比雪夫大数定律) 设 X1 , X2 , … 是一列相互独立的随机变量序列,
2 它们都有相同的数学期望 E ( X i ) 和方差D (X ) i
P70 X 86
npq 16 4
1.5 2.5 1 0.9332 0.9938 1 0.927
86 80 70 80 4 4
P X 80 1 P X 80 1 0 0.5
第五章 大数定律与中心极限定理
§5.1 大数定律
§5.2 中心极限定理
第五章 大数定律和中心极限定理
第五章 大数定律和中心极限定理内 容 提 要1、切贝雪夫不等式设随机变量X 的数学期望μ=)(X E ,方差2)(σ=X D ,则对任意正数ε,有不等式22}{εσεμ≤≥-X P 或221}{εσεμ-><-X P 成立.2、大数定律(1)切贝雪夫大数定理:设 ,,,,21n X X X 是相互独立的随机变量序列,数学期望)(i X E 和方差)(i X D 都存在,且C X D i <)(),2,1( =i ,则对任意给定的0>ε,有1}|)]([1{|lim 1=<-∑=∞→εni i i n X E X n P . (2)贝努利大数定理:设A n 是n 次重复独立试验中事件A 发生的次数,p 是事件A 在一次试验中发生的概率,则对于任意给定的0>ε,有1}|{|lim =<-∞→εp nn P An . 贝努利大数定理给出了当n 很大时,A 发生的频率A n A /依概率收敛于A 的概率,证明了频率的稳定性.3、中心极限定律(1)独立同分布中心极限定理:设 ,,,,21n X X X 是独立同分布的随机变量序列,有有限的数学期望和方差,μ=)(i X E ,),2,1(0)(2=≠=i X D i σ.则对任意实数x ,随机变量σμσμn n Xn XY ni ini in ∑∑==-=-=11)(的分布函数)(x F n 满足⎰∞--∞→∞→=≤=xtn n n n dt e x Y P x F 2/221}{lim )(lim π.(2)李雅普诺夫定理:设 ,,,,21n X X X 是不同分布且相互独立的随机变量,它们分别有数学期望和方差:i i X E μ=)(,),2,1(0)(2=≠=i X D i i σ .记 ∑==ni inB 122σ,若存在正数δ,,使得当∞→n 时,有0}{1122→-∑=++ni ii nX E Bδδμ, 则随机变量nni ini ini i ni i ni in B X X D X E XZ ∑∑∑∑∑=====-=-=11111)()(μ的分布函数)(x F n 对于任意的x ,满足⎰∑∑∞--==∞→∞→=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧≤-=x t n ni i n i i n n n dt e x B X x F 2/11221lim )(lim πμ.当n 很大时,),(~),1,0(~12.1.∑∑==ni n i ni in B N XN Z μ.(3)德莫佛—拉普拉斯定理:设随机变量),2,1( =n n η服从参数为)10(,<<p p n 的二项分布,则对于任意的x ,恒有⎰∞--∞→=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤--x t n n dt e x p np np P 2/221)1(lim πη.疑 难 分 析1、依概率收敛的意义是什么?依概率收敛即依概率1收敛.随机变量序列}{n x 依概率收敛于a ,说明对于任给的0>ε,当n 很大时,事件“ε<-a x n ”的概率接近于 1.但正因为是概率,所以不排除小概率事件“ε<-a x n ”发生.依概率收敛是不确定现象中关于收敛的一种说法. 2、大数定律在概率论中有何意义?大数定律给出了在试验次数很大时频率和平均值的稳定性.从理论上肯定了用算术平均值代替均值,用频率代替概率的合理性,它既验证了概率论中一些假设的合理性,又为数理统计中用样本推断总体提供了理论依据.所以说,大数定律是概率论中最重要的基本定律. 3、中心极限定理有何实际意义?许多随机变量本身并不属于正态分布,但它们的极限分布是正态分布.中心极限定理阐明了在什么条件下,原来不属于正态分布的一些随机变量其总和分布渐进地服从正态分布.为我们利用正态分布来解决这类随机变量的问题提供了理论依据. 4、大数定律与中心极限定理有何异同?相同点:都是通过极限理论来研究概率问题,研究对象都是随机变量序列,解决的都是概率论中的基本问题,因而在概率论中有重要意义.不同点:大数定律研究当 时,概率或平均值的极限,而中心极限定理则研究随机变量总和的分布的极限.例 题 解 析【例1】设每次试验中某事件A 发生的概率为0.8,请用切贝雪夫不等式估计:n 需要多大,才能使得在n 次重复独立试验中事件A 发生的频率在0.79~0.81之间的概率至少为0.95? 分析:根据切贝雪夫不等式进行估计,须记住不等式.解: 设X 表示n 次重复独立试验中事件A 出现的次数,则)8.0,(~n B X ,A 出现的频率为n n X D n X E nX16.02.08.0)(,8.0)(,=⨯==, 220001.016.01)01.0()(1}01.08.0{81.079.0n n n X D n n X P n X P -=-≥<-=⎭⎬⎫⎩⎨⎧<< n16001-= 由题意得 95.016001≥-n,32000≥n .可见 做32000次重复独立试验中可使事件A 发生的频率在0.79~0.81之间的概率至少为0.95.【例2】证明:(马尔柯夫定理)如果随机变量序列 ,,,,21n X X X ,满足0)(1lim 12=∑=∞→n k k n X D n ,则对任给0>ε,有1)(11lim 11=⎭⎬⎫⎩⎨⎧<-∑∑==∞→εn k k n k k n X E n X n P .证明: )(1)1(),(1)1(12111∑∑∑∑======nk k n k k n k k n k k X D n X n D X E n X n E ,由切贝雪夫不等式,得22111)(1)(11lim εεn X D X E n X n P nk k nk k n k k n ∑∑∑===∞→-≥⎭⎬⎫⎩⎨⎧<-,根据题设条件,当∞→n 时, 1)(11lim 11≥⎭⎬⎫⎩⎨⎧<-∑∑==∞→εnk k n k k n X E n X n P ,但概率小于等于1,故马尔柯夫定理成立.【例3】一本书共有100万个印刷符号.排版时每个符号被排错的概率为0.0001,校对时每个排版错误被改正的概率为0.9,求校对后错误不多于15个的概率.分析:根据题意构造一个独立同分布的随机变量序列,具有有限的数学期望和方差,然后建立一个标准化的随机变量,应用中心极限定理求得结果.解:设随机变量⎩⎨⎧=.,0,1 其它 错个印刷符号校对后仍印 第n X n 则)1(≥n X n 是独立同分布随机变量序列,有5101.00001.0}1{-=⨯===n X P p .作)10(,61==∑=n XY nk Kn ,n Y 为校对后错误总数.按中心极限定理(德—拉定理),有)58.1(]))101(1010/[5(15}15{553Φ≈-Φ=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧-≤-=≤--npq np npq np Y P Y P n n9495.0=.第六章 数理统计的基本概念内 容 提 要1、总体与样本在数理统计中,将研究对象的全体称为总体;组成总体的每个元素称为个体. 从总体中抽取的一部分个体,称为总体的一个样本;样本中个体的个数称为样本的容量. 从分布函数为)(x F 的随机变量X 中随机地抽取的相互独立的n 个随机变量,具有与总体相同的分布,则n X X X ,,,21 称为从总体X 得到的容量为n 的随机样本.一次具体的抽取记录n x x x ,,,21 是随机变量n X X X ,,,21 的一个观察值,也用来表示这些随机变量.2、统计量设n X X X ,,,21 是总体X 的一个样本,则不含未知参数的样本的连续函数),,,(21n X X X f 称为统计量.统计量也是一个随机变量,常见的统计量有(1)样本均值 ∑==ni i X n X 11;(2)样本方差 ][11)(11122122∑∑==--=--=ni i n i i X n X n X X n S ; (3)样本标准差 2S S =;(4)样本k 阶原点矩 ,2,1,11==∑=k X n A n i ki k ;(5)样本k 阶中心矩 ,2,1,)(11=-=∑=k X X n B kn i i k .2、经验分布函数设n x x x ,,,21 是总体X 的一组观察值将它们按大小顺序排列为:**2*1n x x x ≤≤≤ ,称它为顺序统计量.则称⎪⎪⎪⎪⎩⎪⎪⎪⎪⎨⎧≥<≤<≤<=+**1**2*1*1,1,,1,0)(nk k n x x x x x nk x x x n x x x F 为经验分布函数(或样本分布函数).3、一些常用统计量的分布(1)2χ分布设)1,0(~N X ,n X X X ,,,21 是X 的一个样本,则统计量∑==ni iX122χ服从自由度为n 的2χ分布,记作)(~22n χχ.(2)t 分布设)1,0(~N X ,)(~2n Y χ,且Y X ,相互独立,则随机变量nY X t /=服从自由度为n 的t 分布,记作)(~n t t .t 分布又称为学生分布.(3)F 分布设)(~12n X χ,)(~22n Y χ,且Y X ,相互独立,则随机变量21//n Y n X F =服从自由度为),(21n n 的F 分布,记作),(~21n n F F .4、正态总体统计量的分布设),(~2σμN X ,n X X X ,,,21 是X 的一个样本,则 (1)样本均值X 服从正态分布,有),(~2nN X σμ或)1,0(~/2N nX U σμ-=;(2)样本方差)1(~)1(222--n S n χσ;(3)统计量)1(~/--n t nS X μ.设),(~),,(~222211σμσμN Y N X ,1,,,21n X X X 是X 的一个样本, 2,,,21n Y Y Y 是Y 的一个样本,两者相互独立.则(1)统计量)1,0(~//)()(22212121N n n Y X σσμμ+---;(2)当21σσ=时,统计量)2(~/2/1)()(212121-+⋅+---n n t S n n Y X wμμ,其中2)1()1(21222211-+-+-=n n S n S n S w ;(3)统计量 )1,1(~//2122222121--n n F S S σσ; (4)统计量),(~/)(/)(2112221222112121n n F n n yxn j jn i i⋅--∑∑==σμσμ.疑 难 分 析1、为什么要引进统计量?为什么统计量中不能含有未知参数?引进统计量的目的是为了将杂乱无序的样本值归结为一个便于进行统计推断和研究分析的形式,集中样本所含信息,使之更易揭示问题实质.如果统计量中仍含有未知参数,就无法依靠样本观测值求出未知参数的估计值,因而就失去利用统计量估计未知参数的意义. 2、什么是自由度?所谓自由度,通常是指不受任何约束,可以自由变动的变量的个数.在数理统计中,自由度是对随机变量的二次型(或称为二次统计量)而言的.因为一个含有n 个变量的二次型),,2,1,,(11n j i a a X X aji ij n i nj j i ij==∑∑==的秩是指对称矩阵n n ij a A ⨯=)(的秩,它的大小反映n 个变量中能自由变动的无约束变量的多少.我们所说的自由度,就是二次型的秩.例 题 解 析【例1】设)5,2,1)(,(~2=i N X i i σμ,(1)521,,,μμμ 不全等;(2)521μμμ=== .问:521,,,X X X 是否为简单随机样本?分析:相互独立且与总体同分布的样本是简单随机样本,由此进行验证.解:(1) 由于)5,2,1)(,(~2=i N X i i σμ,且521,,,μμμ 不全等,所以521,,,X X X 不是同分布,因此521,,,X X X 不是简单随机样本.(2)由于521μμμ=== ,那么521,,,X X X 服从相同的分布,但不知道521,,,X X X 是否相互独立,因此521,,,X X X 不一定是简单随机样本.【例2】设),(~2σμN X ,n X X X ,,,21 是取自总体的简单随机样本,X 为样本均值,2n S 为样本二阶中心矩,2S 为样本方差,问下列统计量(1)22σn nS ,(2)1/--n S X n μ,(3)212)(σμ∑=-ni i X 各服从什么分布?分析:利用已知统计量的分布进行分析.解:(1)由于)1(~)1(222--n S n χσ,又有21221)(1S nn X X n S n i i n-=-=∑=22)1(S n nS n-=,因此)1(~222-n nS nχσ;(2)由于)1(~/--n t nS X μ,又有1-=n S nS n ,因此)1(~1/---n t n S X n μ;(3)由),,2,1)(,(~2n i N X i =σμ得:),,2,1)(1,0(~n i N X i =-σμ,由2χ分布的定义得:)(~)(2212n Xni iχσμ∑=-.【例3】设总体服从参数为λ的指数分布,分布密度为⎩⎨⎧≤>=-0,00,);(x x e x p x λλλ求X D X E ,和2ES .分析:利用已知指数分布的期望、方差和它们的性质进行计算.解:由于),,2,1(/1,/12n i DX EX i i ===λλ,所以λ1)(1)1(11===∑∑==n i i n i i X E n X n E X E ;21211)(1)1(λn X D nX n D X D ni i n i i ===∑∑==; 221212)1(111)(11])(11[λλ-=⋅-=-=--=∑∑==n n n n X D n X X n E ES n i i n i i .【例4】设总体)4,(~μN X ,n X X X ,,,21 是取自总体的简单随机样本,X 为样本均值.问样本容量n 取多大时有:(1)1.0)(2≤-μX E ;(2)95.0}1.0{≥≤-μX P .解:(1)要使1.0/4/)()()(2≤===-n n X D X D X E μ,即有40≥n ,故取40=n .(2)由中心极限定理,要使)05.0(}4/1.0)(/{}1.0{n n X D X P X P Φ≈≤-=≤-μμ95.01)05.0(2)05.0(≥-Φ=-Φ-n n ,即有64.1536,96.105.0,975.0)05.0(≥≥≥Φn n n ,故取1537=n .。
5大数定律与中心极限定理
分布 P(2) .若随机变量Y100
100
Xi
,求 P190
Y100
210 .
i 1
解 因为 X i 服从 P(2) ,i 1,2,
即 PX i
k
2k k!
e2 , (k
1,2,)
所以 E( X i ) 2, D( X i ) 2 , i 1,2,,100
近似服从 Y100
N 200, 10
k 1
n
D( X k )
n k 1
Xk k
Bn
k 1
若对于一切实数x,有
lim P{Yn x} n
1
t2
e 2 dt
2
则称随机变量序列{Xk}服从中心极限定理.
• 定理(独立同分布的中心极限定理):设{Xk}为相 互独立的随机变量序列,服从同一分布,且具有数学 期望E(Xk)=μ和方差D(Xk)=σ2 ,则随机变量
t2
e 2 dt
lim lim n
np(1 p) n
np(1 p)
2
例: 设某妇产医院出生男孩的概率为 0.515,求在 10000 个新生儿中,出生的女孩不少于男孩的概率.
解法1 设X为10000个新生儿中男孩个数 则X服从B(n,p),其中n=10000,p=0.515
由德莫弗-拉普拉斯中心极限定理,所求概率为
20 100/12 20 100/12
20 100/12
1 1
0.387 t 2
e 2 dt 1 (0.387) 0.348
2
即有
P{V 105} 0.348
例: 在一家保险公司里有10000个人参加寿 命保险,每人每年付12元保险费。在一年内 一个人死亡的概率为0.6%,死亡时其家属 可向保险公司领得1000元,问:
概率论第五章 大数定律及中心极限定理
的标准化变量为
n
X i n
Yn i1 n
则Yn的分布函数Fn(x)对任意的x∈(-∞,+∞)都有
n X i n
lim
n
Fn
(
x)
lim
n
P(Yn
x)
lim
n
P
i 1
n
x
x
1
t2
e 2 dt
2
该定理说明,当n充分大时, Yn近似地服从标准正 态分布,Yn~N(0,1), (n )
P|
X
|
2 2
P X
1
2 2
证明 (1)设X的概率密度为p(x),则有
P{| X | } p(x)dx
| x |2
p(x)dx
|x|
|x|
2
1
2
(x
)2
p(
x)dx
2 2
Xi 2
0
pi
1 4
1 2
2
(i 1,2, , n, )
1 4
解
因为 X1, X 2 , , X n ,
相互独立, EX i 0 , E
X
2 i
1
又
DX i
E
X
2 i
EX i
2
1 0
1, i
1,2,
, n,
所以,满足切比雪夫大数定理的条件,可使用大数定理.
第五章 大数定律及中心极限定理
解:(1)由X~b(300,1/4)知,E(X)=np=75, D(X)= npq =300*1/4*3/4=225/4.所以所求概率为:
225 P{| X − E ( X ) |≤ 50} ≥ 1 − 502 = 0.9975 4
(2)由X~b(1000,1/4)知, E(X)=250, D(X)=375/2.所以
依概率收敛的意义
依概率收敛即依概率1收敛。随机变量序列{ X n }依概率 收敛于a,说明对于任给的ε > 0,当n很大时,事件 “ xn − a < ε”的概率接近于1,但正因为是概率,所以不排 除小概率事件“ xn − a ≥ ε”发生。所以说依概率收敛是不 确定现象中关于收敛的一种说法。
例 设在每次试验中,事件A发生的概率为1/4. (1)300次重复独立试验,以X记A发生的次数.用切 比雪夫不等式估计X与E(X)的偏差不大于50的 概率; ; (2)问是否可用0.925的概率,确信在1000次试验 中, A发生的次数在200到300之间.
数学期望 E ( X i )和方差 D( X i )都存在( i = 1,2, L),且D( X i ) < C ( i = 1,2,L),则对任意给定的 ε > 0,有 1 n lim P ∑ [ X i − E ( X i )] < ε = 1 n→ ∞ n i =1
切比雪夫定理的特殊情况
定理 序列, 设X 1 , X 2 , L , X n , L是相互独立的随机变量 序列,
有相同的数学期望和方 差,E ( X i ) = µ , D( X i ) = σ 2 ( i = 1,2, L)。则对任意给定的 ε > 0,有 1 n lim P ∑ X i − µ < ε = 1 n→ ∞ n i =1 即 X →µ
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
或
1 n lim P X k 1 n n k 1
定理的意义:
具有相同数学期望和方差的独立随机变量序列的
算术平均值依概率收敛于数学期望.即
1 n 1 n X i EX i P 0 (n ) n i 1 n i 1
当 n 足够大时,算术平均值几乎就是一个常数, 可以用算术平均值近似地代替数学期望.
或
P(| X E ( X ) | ) 1
D( X )
2
示意图
j(x)
Dx/2
Ex
Ex
Ex+
x
例1 设x是掷一颗骰子所出现的点数, 若给定e=1,2, 实际计算P(|x-Ex|e), 并验证切贝谢 夫不等式成立. 解 因P(x=k)=1/6, (k=1,2,3,4,5,6)
n
i 1
这便是在n较大情况下反映出的客观规律,故称为“大数” 定 律。 DX i 比推论1条件更宽的一个大数定律是辛钦(Khintchine) 大数定律,它不需要推论1条件中“方差 存在”的限制, 而在其它条件不变的情况下,仍有切比雪夫式的结论。
辛钦大数定律-推论2 设 X 1 , X 2 ,, X n , 相互独立,服从同一
算术平均值, Y n 依概率收敛于其数学期望 p . 结果同样适用于服从其它分布的独立随
机变量序列
Chebyshev 大数定律 设随机变量序列 X 1 , X 2 ,, X n , 相互独立,
(指任意给定 n > 1, X 1 , X 2 ,, X n 相互独立),且 具有相同的数学期望和方差
nA n
nA nA p 是 频率 与 p 有较大偏差 n n
小概率事件, 因而在 n 足够大时, 可以用频率 近似代替 p . 这种稳定称为依概率稳定.
定义 设 Y1 , Y2 ,, Yn , 是一系列随机变量,
a 是一常数, 若 0 有
n
lim P Yn a 0
§5.3 中心极限定理
人们已经知道,在自然界和生产实践中遇到的大量随机 变量都服从或近似服从正态分布,正因如此,正态分布占有 特别重要的地位。那么,如何判断一个随机变量服从正态分 布显得尤为重要。如经过长期的观测,人们已经知道,很多 工程测量中产生的误差X都是服从正态分布的随机变量。分 析起来,造成误差的原因有仪器偏差X1、大气折射偏差X2, 温度变化偏差X3、估读误差造成的偏差X4等等,这些偏差Xi 对总误差 X X i 的影响都很微小,没有一个起到特别突 出的影响,虽然每个Xi的分布并不知道,但 X X i 却服从正态分布。类似的例子不胜枚举。 设 { X n } 为一随机变量序列,其标准化随机变量
0 有
nA lim P p 0 n n
或
nA lim P p 1 n n
贝努里(Bernoulli) 大数定律的意义:
在概率的统计定义中,事件 A 发生的频率 “ 稳定于”事件 A 在一次试验中发生的概率是 指:
lim P{ X n X } 1
n
则称 X n 依概率收敛于X,记为 X n P X 或 X n X P 0 ,n . 下面是一个带普遍性结果的大数定律。
大数定律
贝努里(Bernoulli) 大数定律
设 nA 是 n 次独立重复试验中事件 A 发生的 次数, p 是每次试验中 A 发生的概率,则
第五章
大数定律与中心极限定理
ANSWER
本章要解决的问题 1. 为何能以某事件发生的频率 作为该事件的 概率的估计? 2. 为何能以样本均值作为总体 期望的估计?
大数 定律
中心极 限定理
3. 为何正态分布在概率论中占 有极其重要的地位? 4. 大样本统计推断的理论基础 是什么?
大数定律和中心极限定理是概率论的重要基本理 论,它们揭示了随机现象的重要统计规律,在概率 论与数理统计的理论研究和实际应用中都具有重要 的意义。 迄今为止,人们已发现很多大数定律(laws of large numbers) 所谓大数定律,简单地说,就是大量数目的随机变量所呈现 出的规律,这种规律一般用随机变量序列的某种收敛性来刻 画。 本章仅介绍几个最基本的大数定律。下面,先介绍一个 重要的不等式。
本结果由俄国数学家切比雪夫于1866年证明,是 关于大数定律的普遍结果,许多大数定律的古典 结果都是它的特例。
推论1
设
{X n }
是独立同分布的随机变量序列,且
EX i , DX i 2 , i 1, 2,
则对任意ε>0,有
1 n lim P X i 1 n n i 1
E ( X k ) , D( X k ) 2 , k 1,2,
则 0 有
算术平均值
1 n 1 n lim P X i EX i 1 n n i 1 n i 1
1 n lim P X k 0 n n k 1
例2 设有一大批种子,其中良种占1/6. 试估计 在任选的 6000 粒种子中, 良种所占比例与 1/6 比较上下小于1%的概率. 解 设 X 表示 6000 粒种子中的良种数 , X ~ B (6000,1/6 )
---注:二项分布
5000 E ( X ) 1000, D( X ) 6 1 X P 0.01 5000 6000 6 6 83 0.7685 P(| X 1000 | 60) 1 602 108
1+ 2 + 3 + 4 + 5 + 6 7 1 + 4 + 9 + 16 + 25 + 36 91 2 Ex , Ex 6 2 6 6 91 49 182 147 35 2 2 Dx Ex ( Ex ) 6 4 12 12 Dx 35 2 7 1 : 2 P(| x | 1) 12 3 2 Dx 35 35 1 7 2: 2 P(| x | 2) 4 12 48 3 2
X ~ B(n,0.75)
E ( X ) 0.75 n, D( X ) 0.1875n
事件A发生 的概率
0.74 X 0.76 0.90 要使 P ,求 n n
即 P0.74 n X 0.76 n 0.90
即 P| X 0.75n | 0.01n 0.90 由 Chebyshev 不等式, = 0.01n ,故
Yn
X
i 1
n
i
E ( X i )
i 1 n
n
D ( X i )
i 1
在什么条件下, lim PYn x ( x) , 这是十八世纪以来概率论 n 研究的中心课题,因而,从二十世纪二十年代开始,习惯上把 研究随机变量和的分布收敛到正态分布的这类定理称为中心极 限定理(Central Limit Theorems)。这里仅介绍独立同分 布场合下的中心极限定理。
分布,且具有数学期望 E(X k) = , k= 1,2,…, 则对任意正数 > 0
1 n lim P X k 0 n n k 1
推论2(贝努利大数定律)设事件A发生的概率为p,在n重 贝努利试验中A发生的频率为 f n ,则对任意的ε>0,有
.
推论1使我们关于算术平均值的法则有了理论上的依据。如 我们要测量某段距离,在相同条件下重复进行n次,得n个 测量值 X 1 , X 2 ,, X n ,它们可以看成是n个相互独立的随机 变量,具有相同的分布、相同的数学期望μ和方差 2 , 由推论1的大数定律知,只要n充分大,则以接近于1的概率 1 n 保证 Xi
P{ | X EX | } 的一个上界,该上界并不涉及随机变X
的具体概率分布,而只与其方差DX和ε有关,因此,切比 雪夫不等式在理论和实际中都有相当广泛的应用。需要指 出的是,虽然切比雪夫不等式应用广泛,但在一个具体问 题中,由它给出的概率上界通常比较保守。
5.2 大数定律
在叙述大数定律之前,首先介绍两个基本概念。 定义5.1 设 X 1 , X 2 ,, X n , 为一个随机变量序列,记为 { X n } ,若对任何n≥2,随机变量 X 1 , X 2 ,, X n 都相互独 立,则称 { X n } 是相互独立的随机变量序列。 定义5.2 设 { X n } 为一随机变量序列,X为一随机变 量或常数,若对任意ε>0,有
0.1875n P| X 0.75n | 0.01n 1 (0.01n) 2
令
0.1875n 1 0.90 2 (0.01n)
解得 n 18750
切比雪夫不等式说明,DX越小,则 P{ | X EX | } 越小, P{ | X EX | } 越大,也就是说,随机变量X取值基 本上集中在EX附近,这进一步说明了方差的意义。 同时当EX 和DX 已知时,切比雪夫不等式给出了概率
5.1
切尔谢夫不等式
重要不等式 马尔可夫(Markov) 不等式
设非负随机变量 X 的期望 E( X )存在, 则对于任意实数 > 0,
P( X ) E( X )
推论 2 ——切贝雪夫( chebyshev )不等式
设随机变量 X 的方差 D ( X )存在, 则对于任意实数 > 0, D( X ) P(| X E ( X ) | ) 2
lim P{| f n p | } 1
n
,
f n P p, n 即,
.
这是历史上最早的大数定律,是贝努利在1713年建立 的。概率论的研究到现在约有300多年的历史,最终以事件 的频率稳定值来定义其概率。作为概率这门学科的基础, 其“定义”的合理性这一悬而未决的带根本性的问题,由贝 努 利于1713年发表的这个“大数定律”给予了解决,被称为 概 率论的第一篇论文,为概率论的公理化体系奠定了理论基础。 之所以被成为“定律”,是这一规律表述了一种全人类多年 的