中心极限定理
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
解:设发生故障的机器 台数 ,则 ~ B(n, p), n 400, p 0.02
(1)二项分布 (精确)
P{0 2} P{ 0} P{ 1} P{ 2} 0.0131
(2)泊松分布 (近似) np 400 0.02 8 P{0 2} P{ 0} P{ 1} P{ 2} 0.0137
机 变 量 n 近 似 地 服 从 正 态 分 布
N (np,npq) ;
(2)当抽取比例小于 10%时,超几何分布用二 项分布来近似;
(3)当次品率小于 10%时,二项分布用普松分 布来近似。
例 1.设一批产品共 2000 个,其中 40 个次品,随机抽取 100 个样品,求样品中次品数 X 的概率分布。 (1)不放回抽样;(2)放回抽样。
其中, z1,z2 是任何实数。
例 2 计算机进行加法计算时,把每个加数取为最接近 于它的整数来计算。设所有的取整误差是相互独 立的随机变量,并且都在区间[-0.5,0.5]上服从均 匀分布,求 300 个数相加时误差总和的绝对值小 于 10 的概率。
解:设 i 表示第 i 个加数的取整误差,则 i 在区间 [-0.5,0.5]上服从均匀分布,并且有
600 6 2 0.9057 1 0.8114
600 ) 1 2(1.3145) 1 1 (1 1) 66
D i
2 i
s
2 n
,
i1
i1
再 令 n
n E n D n
1 sn
n
( i i )
i1
E n 0, D n 1
林德贝格-列维(中心极限定理) 设独立随机变量 1 , 2 , , n ,服从相同分布,且
Ei D i 2 , i 1,2,, n ,
则当n 时,有 n
i n
6
6
63
P{|
1
| 0.02} 1
D( )
600
( 1 ) 2 250
1 600
3
0.4213
。
600 6
0.02 2
0.02 2
用中心极限定理计算:
利用公式
P{|
n
n
p
|
}
2(
n p(1
p)
)
1
,
注意到 n 对应于此处的 , 0.02 ,故
P{| 1 | 0.02} 2(0.02
np(1 p)
np(1 p)
说明: 当p值接近0或1时,用Poisso(n 泊松)分布近似较精确。
例2. 某厂有 400台同类机器,每台机器 发生鼓掌的概率都是 0.02,假设各台机器工作是 相互独立的,试分别用 二项 分布、近似的泊松分布 和近似的正态分布计算 最多有 2 台机器发生故障的概率 。
则有
lim P(n np z) 1
z
e
t2 2
dt
n
npq
2
其中 z是任何实数, p q 1 。
(简称 D-L 定理)
D-L定理的应用
(1)设 ~ B(n, p), 当n充分大时,可认为 ~ N (np, np(1 p))
这时,P{a b} ( b np ) ( a np )
解:(1)不放回抽样
次品数 X ~H(100,40,2000)
P(X
m)
C C m 100m 40 1960 C100 2000
,m
0,1,2,,40
批量 N 2000 很大,抽样数 n 100 ,
n 100 5% 0.1 N 2000
所以,可用二项分布来近似超几何分布,即
P(X
m)
C C m 100 m 40 1960 C 100 2000
其中,
p
M N
,q
1
p
N
M N
注意:当
n N
0.1 ,不放回抽样与放回抽样无大
的差别
即: 超几何分布可用二项分布来近似。
若某人做某事的成功率为1%,他重复努力400次, 则至少成功一次的概率为
P{X 1} 1 P{X 0} =1 0.99400 0.9820
成功次数服从二项概率 B(400, 0.01)
lim P( i1
x)
n
n
1
x t2
e 2 dt
2
其中 x 是任意实数。
推论:如果随机变量 1 , 2 , , n , 独立,服从相同 分
布,且 E i , D i 2 , i 1,2,,n,,
则 n充分大时,有下面的近似公式:
n
i n
P(z1 i1 n z2) (z2) (z1)
(3)正态分布 (近似) np 8, np(1 p) 2.8
P{0 2} ( 2 8 ) ( 0 8 ) (2.14) (2.86) 0.0141
2.8
2.8
考虑到 n 是离散分布,正态分布是连续分布,故常作修
正以提高近似精度。即 n 充分大, k 是非负整数时
P{ n
k}
启发: 有百分之一的希望就要做百分之百的努力
定理 2.(用泊松分布近似二项分布)
设 X ~ B(n, p) ,当 n 时, X 近似地
服从 P() ,其中 np . 即
Cnm pmq nm
m
m!
e
,
使用条件: n充分大 , p很小 ( 0.1),而 np适当(可查表)。
说明:(1)当 n充分大时,服从二项分布 B ( n , p ) 的随
n
(3)已知 P{| n p | }, n,求
n
a.已知 p b.未知 p,利用 p(1 p) 1 . 4
n ) 1 p(1 p)
例 4:设一批种子的良种率为 1 ,在其中任选 600 粒,求这 6
600 粒种子中良种所占的比例与1 之差的绝对值不超过 0.02 的 6
概率。
a) 用切比雪夫不等式估计;
解 : 设 n 为 100 名 临 床 试 验 患 者 中 治 愈 的 人 数 ,
n 100 。
(1)由于 p 80% ,故 n ~ B(100, 0.8)
P( n
75)
1
P{ n
75} 1 (75 0.5 np ) npq
1 ( 1.125) (1.1.25)=0.8697 .
(2)此时 p 70% ,故 n ~ B(100, 0.7)
( k
0.5 np ) npq
P{ n
k}
( k
0.5 np ) npq
P{k1 n k2} P{k1 0.5 n k2 0.5}
(
k2
0.5 np ) ( k1 npq
0.5 np ) npq
例 4:某药厂生产某种药品,声称对某疾病的治愈率为 80%, 现为了检验说法的正确性,任意抽取 100 个此种疾病的患者进 行临床试验,如果有多于 75 人治愈,则此药通过检验,试在 以下两种情况下,分别计算此药通过检验的可能性。(1)此 药实际治愈率为 80%;(2)此药实际治愈率为 70%
b) 用中心极限定理计算。
解 : 用 表 示 600 粒 种 子 中 良 种 的 粒 数 , 则 ~ b(n, p) ,
n 600
,
p
1 6
,故问题所求的概率为
P{|
600
1 6
|
0.02} 。
用切比雪夫不等式 进行 估计。 注意到
E np 600 1 100 , D npq 600 1 (1 1 ) 250 ,故
4.1 中心极限定理
问题: 正态分布为何如此广泛,从而在概率 论中占如此重要的地位?
中心极限定理
有关论证随机变量和的极限分布是正态分布的定理。
定理 1.设随机变量 X ~ H(n, M , N ) ,则当 N 时,
X 近似地服从二项分布 B(n, p) ,即
C C m nm M NM CNn
Cnm pmqnm ,
C1m00pmq100m,m 0,1,2,,40.
(2) 放 回 抽 样
次品数 X ~ B(100,0.02)
P( X
m)
Cm 100
pmq100m
,m
0,1,2,,100 .
40 其 中 , p 2000 0.02 .
p 0.02 0.1
np 1000.02 2不是很大
所以可用泊松分布近似二项分布,
P(X
m)
Cm 100
p m q 100m
2m e2 m!
, m 0,1,2,,40.
设独立随机变量 1 , 2 , , n ,期望和方差都存在,
即 Ei i ,
Di
2 i
, i 1,2,, n, ,
标准化
n
令 n i , i1
n
n
则 En Ei i ,
i1
i1
n
n
D n
E i
0.5 0.5 2
0 ,即
0
D i
2
[ 0.5 ( 0.5)]2 1
1
12
1 2 ,i
12 ,由列维定理的推论:
1,2,,n,,即
n
P (| i| 1 0 ) i 1
n
| i 0 |
P(
i 1
300 1
12
10 0 )
300 1 12
n
| i 0 |
P(
i 1
2)
300 1
12
(2) (2) 2 (2) 1
2 0.9772 1 0.9544
300 个数相加时误差总和的绝对值小于 10 的概率 为 0.9544。
德莫威尔-拉普拉斯定理:设在独立试验序列中,事件
A 在各次试验中发生的概率为 p(0 p 1) ,随
机变量 n 表示事件 A 在 n次试验中发生的次数,
n} p(1 p)
(
n ) (
n)
p(1 p)
p(1 p)
2(
n )1
p(1 p)
P{| n p | } 2(1 (
n ))
n
p(1 p)
解决三类问题
(1)已知 , n, p,求 P{| n p | } 2(
n
(2)已知 P{| n p | }, , p,求 n
P( n
75)
1
P{ n
75} 1 ( 75
0.5 70 ) npq
1 (1.2) =1-0.8849 0.1151
从而第一种情况通过检验的可能性较大,而第二种情况
通过的可能性很小。
(2)近似计算用频率估计概率是的误差
P{| n p | } P{| n np |
n
np (1 p)
(1)二项分布 (精确)
P{0 2} P{ 0} P{ 1} P{ 2} 0.0131
(2)泊松分布 (近似) np 400 0.02 8 P{0 2} P{ 0} P{ 1} P{ 2} 0.0137
机 变 量 n 近 似 地 服 从 正 态 分 布
N (np,npq) ;
(2)当抽取比例小于 10%时,超几何分布用二 项分布来近似;
(3)当次品率小于 10%时,二项分布用普松分 布来近似。
例 1.设一批产品共 2000 个,其中 40 个次品,随机抽取 100 个样品,求样品中次品数 X 的概率分布。 (1)不放回抽样;(2)放回抽样。
其中, z1,z2 是任何实数。
例 2 计算机进行加法计算时,把每个加数取为最接近 于它的整数来计算。设所有的取整误差是相互独 立的随机变量,并且都在区间[-0.5,0.5]上服从均 匀分布,求 300 个数相加时误差总和的绝对值小 于 10 的概率。
解:设 i 表示第 i 个加数的取整误差,则 i 在区间 [-0.5,0.5]上服从均匀分布,并且有
600 6 2 0.9057 1 0.8114
600 ) 1 2(1.3145) 1 1 (1 1) 66
D i
2 i
s
2 n
,
i1
i1
再 令 n
n E n D n
1 sn
n
( i i )
i1
E n 0, D n 1
林德贝格-列维(中心极限定理) 设独立随机变量 1 , 2 , , n ,服从相同分布,且
Ei D i 2 , i 1,2,, n ,
则当n 时,有 n
i n
6
6
63
P{|
1
| 0.02} 1
D( )
600
( 1 ) 2 250
1 600
3
0.4213
。
600 6
0.02 2
0.02 2
用中心极限定理计算:
利用公式
P{|
n
n
p
|
}
2(
n p(1
p)
)
1
,
注意到 n 对应于此处的 , 0.02 ,故
P{| 1 | 0.02} 2(0.02
np(1 p)
np(1 p)
说明: 当p值接近0或1时,用Poisso(n 泊松)分布近似较精确。
例2. 某厂有 400台同类机器,每台机器 发生鼓掌的概率都是 0.02,假设各台机器工作是 相互独立的,试分别用 二项 分布、近似的泊松分布 和近似的正态分布计算 最多有 2 台机器发生故障的概率 。
则有
lim P(n np z) 1
z
e
t2 2
dt
n
npq
2
其中 z是任何实数, p q 1 。
(简称 D-L 定理)
D-L定理的应用
(1)设 ~ B(n, p), 当n充分大时,可认为 ~ N (np, np(1 p))
这时,P{a b} ( b np ) ( a np )
解:(1)不放回抽样
次品数 X ~H(100,40,2000)
P(X
m)
C C m 100m 40 1960 C100 2000
,m
0,1,2,,40
批量 N 2000 很大,抽样数 n 100 ,
n 100 5% 0.1 N 2000
所以,可用二项分布来近似超几何分布,即
P(X
m)
C C m 100 m 40 1960 C 100 2000
其中,
p
M N
,q
1
p
N
M N
注意:当
n N
0.1 ,不放回抽样与放回抽样无大
的差别
即: 超几何分布可用二项分布来近似。
若某人做某事的成功率为1%,他重复努力400次, 则至少成功一次的概率为
P{X 1} 1 P{X 0} =1 0.99400 0.9820
成功次数服从二项概率 B(400, 0.01)
lim P( i1
x)
n
n
1
x t2
e 2 dt
2
其中 x 是任意实数。
推论:如果随机变量 1 , 2 , , n , 独立,服从相同 分
布,且 E i , D i 2 , i 1,2,,n,,
则 n充分大时,有下面的近似公式:
n
i n
P(z1 i1 n z2) (z2) (z1)
(3)正态分布 (近似) np 8, np(1 p) 2.8
P{0 2} ( 2 8 ) ( 0 8 ) (2.14) (2.86) 0.0141
2.8
2.8
考虑到 n 是离散分布,正态分布是连续分布,故常作修
正以提高近似精度。即 n 充分大, k 是非负整数时
P{ n
k}
启发: 有百分之一的希望就要做百分之百的努力
定理 2.(用泊松分布近似二项分布)
设 X ~ B(n, p) ,当 n 时, X 近似地
服从 P() ,其中 np . 即
Cnm pmq nm
m
m!
e
,
使用条件: n充分大 , p很小 ( 0.1),而 np适当(可查表)。
说明:(1)当 n充分大时,服从二项分布 B ( n , p ) 的随
n
(3)已知 P{| n p | }, n,求
n
a.已知 p b.未知 p,利用 p(1 p) 1 . 4
n ) 1 p(1 p)
例 4:设一批种子的良种率为 1 ,在其中任选 600 粒,求这 6
600 粒种子中良种所占的比例与1 之差的绝对值不超过 0.02 的 6
概率。
a) 用切比雪夫不等式估计;
解 : 设 n 为 100 名 临 床 试 验 患 者 中 治 愈 的 人 数 ,
n 100 。
(1)由于 p 80% ,故 n ~ B(100, 0.8)
P( n
75)
1
P{ n
75} 1 (75 0.5 np ) npq
1 ( 1.125) (1.1.25)=0.8697 .
(2)此时 p 70% ,故 n ~ B(100, 0.7)
( k
0.5 np ) npq
P{ n
k}
( k
0.5 np ) npq
P{k1 n k2} P{k1 0.5 n k2 0.5}
(
k2
0.5 np ) ( k1 npq
0.5 np ) npq
例 4:某药厂生产某种药品,声称对某疾病的治愈率为 80%, 现为了检验说法的正确性,任意抽取 100 个此种疾病的患者进 行临床试验,如果有多于 75 人治愈,则此药通过检验,试在 以下两种情况下,分别计算此药通过检验的可能性。(1)此 药实际治愈率为 80%;(2)此药实际治愈率为 70%
b) 用中心极限定理计算。
解 : 用 表 示 600 粒 种 子 中 良 种 的 粒 数 , 则 ~ b(n, p) ,
n 600
,
p
1 6
,故问题所求的概率为
P{|
600
1 6
|
0.02} 。
用切比雪夫不等式 进行 估计。 注意到
E np 600 1 100 , D npq 600 1 (1 1 ) 250 ,故
4.1 中心极限定理
问题: 正态分布为何如此广泛,从而在概率 论中占如此重要的地位?
中心极限定理
有关论证随机变量和的极限分布是正态分布的定理。
定理 1.设随机变量 X ~ H(n, M , N ) ,则当 N 时,
X 近似地服从二项分布 B(n, p) ,即
C C m nm M NM CNn
Cnm pmqnm ,
C1m00pmq100m,m 0,1,2,,40.
(2) 放 回 抽 样
次品数 X ~ B(100,0.02)
P( X
m)
Cm 100
pmq100m
,m
0,1,2,,100 .
40 其 中 , p 2000 0.02 .
p 0.02 0.1
np 1000.02 2不是很大
所以可用泊松分布近似二项分布,
P(X
m)
Cm 100
p m q 100m
2m e2 m!
, m 0,1,2,,40.
设独立随机变量 1 , 2 , , n ,期望和方差都存在,
即 Ei i ,
Di
2 i
, i 1,2,, n, ,
标准化
n
令 n i , i1
n
n
则 En Ei i ,
i1
i1
n
n
D n
E i
0.5 0.5 2
0 ,即
0
D i
2
[ 0.5 ( 0.5)]2 1
1
12
1 2 ,i
12 ,由列维定理的推论:
1,2,,n,,即
n
P (| i| 1 0 ) i 1
n
| i 0 |
P(
i 1
300 1
12
10 0 )
300 1 12
n
| i 0 |
P(
i 1
2)
300 1
12
(2) (2) 2 (2) 1
2 0.9772 1 0.9544
300 个数相加时误差总和的绝对值小于 10 的概率 为 0.9544。
德莫威尔-拉普拉斯定理:设在独立试验序列中,事件
A 在各次试验中发生的概率为 p(0 p 1) ,随
机变量 n 表示事件 A 在 n次试验中发生的次数,
n} p(1 p)
(
n ) (
n)
p(1 p)
p(1 p)
2(
n )1
p(1 p)
P{| n p | } 2(1 (
n ))
n
p(1 p)
解决三类问题
(1)已知 , n, p,求 P{| n p | } 2(
n
(2)已知 P{| n p | }, , p,求 n
P( n
75)
1
P{ n
75} 1 ( 75
0.5 70 ) npq
1 (1.2) =1-0.8849 0.1151
从而第一种情况通过检验的可能性较大,而第二种情况
通过的可能性很小。
(2)近似计算用频率估计概率是的误差
P{| n p | } P{| n np |
n
np (1 p)