《概率论与数理统计》5-1 中心极限定理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
即: 只要供应 320Q 瓦的电力, 就能以99%的把握保证该 车间的机器能正常工作.
例5. 为了测定一台机床的质量, 将其分解成若干个部件 来称量. 假定每个部件的称量误差(单位: kg )服从区 间 1,1 上的均匀分布, 且每个部件的称量是独立的, 试 问至多分成多少个部件才能以不低于99%的概率保证 机床的称量总误差的绝对值不超过10.
1.55 1.55
2 1.55 1 0.8788.
例3. 有一批钢材, 其中80%的长度不小于3m, 现从钢材 中随机取出100根, 试利用中心极限定理求小于3m的钢 不超过30根的概率. 解 以Yn 为100根钢材中小于3m的钢材根数, 由题意知:
1 E X p, D X p 1 p n
定理5.3 独立同分布情形下大数定律
设
X1 , X 2 ,
是一个独立同分布的随机变量序列. 且
P E X , D X 2 . 则 X
证明关键步骤:
1 2 E X , D X n
Yn
B 200,0.15 .
Y np N 30 0.95, P Yn N P n np 1 p 25.5 N 30 查表得: 1.645, 即: N 38.3068, 所以可取
25.5
N 39方能以95%的把握保证在该时刻分机可以使用外
在§1.3中, 我们曾经提到频率的稳定性. 设随机事件A的概率P(A)=p, 在n重贝努利试验中事件A 发生的频率为 f n A .当n很大时, 将与p非常接近. 由 于 f n A 本质上是一个随机变量,它随着不同的n次试 验可能取不同的值, 因而需要对随机变量序列引进新 的收敛性定义.
Y np 1 n lim P x n np 1 p 2
即当 n 充分大时,
np 1 p Yn np
x
e
t2 2
dt ,
近似服从标准正态分布.
例2. 在次品率为1/6的一大批产品中, 任意取出300件产 品, 利用中心极限定理, 计算抽取的产品中次品数在40到60 之间的概率. 解 以Yn 表示300件产品中次品的总数, 由题意得
2 1 2 0.0456.
定理5.5中限定条件得到如下定理5.6
定理 5.6 设 X1 , X 2 , 随机变量序列,且 Xi
, X n 是一个独立同分布的
B 1, p , 令
n i 1
Yn X i ,
则对任意的 x x , 有
n
b n a n n n
例1 某人要测量甲、乙两地的距离, 限于测量工具, 他 分成1200段进行测量, 每段测量误差(单位: 厘米)服从 区间 0.5,0.5 上的均匀分布, 试求总距离测量误差的 绝对值超过 20 厘米的概率.
例6. 某单位有200台分机, 每台使用外线通话的概率 为15%, 若每台分机是否使用外线是相互独立的, 问该 单位至少需要装多少多少条外线, 才能以95%的概率保 保证每台分机能随时接通外线电话. 解 以Yn 表示在时刻 t使用的外线数, 则 此时有np 30, np 1 p 25.5. 若以N表示安装的外 线数, 则分机能使用外线意味着此时有 Yn N . 中心极限定理得: 由
A ”发生的 示在400次相互独立的重复实验试验中事件“ 次 数, 由前面所讨论的知:
p 0.75,
及 Yn
B 400,0.75 , 因 n 400, 由中心极限定理知, 对
任意的 x, 有
Y np P n x x, np 1 p
第五章 随机变量序列的极限
概率论的基本任务是研究随机现象的统计规律性. 引进 随机变量之后, 我们集中研究了随机变量取值的统计 规律性. 在一个具体问题中,的常用方法是研究极限.
§5.1 大数定律 law of large numbers
线.
作业: 习题五 6,8,10
1 Yn B 300, , 6 250 此时,np 50, np 1 p , 由中心极限定理得 6 40 50 Yn np 60 50 P 40 X 60 P 250 / 6 250 / 6 np 1 p
则对任意的 x x , 有
i 1, 2, ,
n X i np lim P i 1 x x . n n
应 用 当 n 充 分 大 时
P a Xi b i 1 n a n X i n b n i 1 P 2 n n n
且函数
g x, y 在 a, b 处连续, 则
P g X n , Yn g a, b
下面, 考虑频率的稳定性
定理5.4 贝努里大数定律
设
X1 , X 2 ,
是一个随机变量序列. 且每一个随机变量
P X p
都服从0-1分布B 1, p , 则 证明关键步骤:
由条件所设, 所求的概率为
x 0.99.
而 x 为标准正态分布的分布函数, 查表得x 2.326. 即:
X np P 2.326 0.99. np 1 p
从而
3 300 20 320. X 300 2.326 20 4
i 1
n
i
n
n 2
n
N 0,1
因此:
X i n i 1 P b b n
定理5.5 独立同分布的中心极限 设 X1 , X 2 ,
, Xn,
是独立同分布的随机变量序列, 且
E X i p, D X i 2 0
解 以 X i 表示第i 个部件的称量误差, 设分成n个部件
从而
R 1,1 . 1 2 0, , 3 Xi
n X i n n 10 0 P X i 10 P i 1 n n3 i 1 10 0 2 1 0.99 n3 2 10 10 0 u0.995 2.576 所以 n 3 45 n3 2.576
Yn
则
B 100,0.2 , np 20, np 1 p 16,
0 20 Yn np 30 20 P 0 Yn 30 P 4 4 np 1 p 2.5 5 0.9938.
1 n 1 n D Xi 2 D Xi n i 1 n i 1 n 1 2 D X i cov X , X i j n i 1 i j 1 c 2 nc n n
§5.2 中心极限定理
n
i 1,2,,1200 .
由独立同分布情形下的中心极限定理:
X i n 20 i 1 n 1 1200 12
1 P
X i n i 1 2 n
n
1 2 2
定义5.1 依概率收敛 设
X1 , X 2 ,
是一个随机变量序列. 如果存在一个常数c
使得对任意一个正数 , 总有
n
lim P X n c 1
X1 , X 2 ,
依概率收敛于c
则称随机变量序列 记作:
P X n c
定理5.1 如果
P P X n a, Yn b,
例4. 设一个车间有400台同类型的机床, 每台机床需用 电 Q 瓦, 由于工艺关系, 每台机器并不连续开动, 开动的 时候只占工作总时间的3/ 4, 问应该供应多少瓦电力能 99%的概率保证该车间的车床能正常工作.(假定在工作 期内每台机器是否处于工作状态是相互独立的). 解 令Yn 表示在时刻 t 时正在开动的机器数, 则Yn 可以表
1200
解 设第i 段的测量误差为 X i , 所以累计误差为 又 X1 , X 2 , 得
X ,
i 1 i
, X1200 为独立同分布的随机变量, 由
Xi
R 0.5,0.5
1 E X i 0, D X i , 12
n P X i 20 P i 1
定理5.2 切比雪夫大数定律
设
X1 , X 2 ,
是两两不相关的随机变量序列. 且
方差一致有界. 则
1 n 1 n P X i E Xi n i 1 n i 1
证明关键步骤:
1 n 1 n E Xi E Xi n i 1 n i 1
在数理统计中经常要用到n个独立同分布的随机变量
, X n的和 X i 的分布, 但要给出其精确分布 有 i 1 时很困难. X1 , X 2 ,
正态分布具有可加性,若
n
X1 , X 2 ,
则:
X n iid, X i
i
X
i 1
n
N ,
2
2
N n , n
标准化后得
X
例5. 为了测定一台机床的质量, 将其分解成若干个部件 来称量. 假定每个部件的称量误差(单位: kg )服从区 间 1,1 上的均匀分布, 且每个部件的称量是独立的, 试 问至多分成多少个部件才能以不低于99%的概率保证 机床的称量总误差的绝对值不超过10.
1.55 1.55
2 1.55 1 0.8788.
例3. 有一批钢材, 其中80%的长度不小于3m, 现从钢材 中随机取出100根, 试利用中心极限定理求小于3m的钢 不超过30根的概率. 解 以Yn 为100根钢材中小于3m的钢材根数, 由题意知:
1 E X p, D X p 1 p n
定理5.3 独立同分布情形下大数定律
设
X1 , X 2 ,
是一个独立同分布的随机变量序列. 且
P E X , D X 2 . 则 X
证明关键步骤:
1 2 E X , D X n
Yn
B 200,0.15 .
Y np N 30 0.95, P Yn N P n np 1 p 25.5 N 30 查表得: 1.645, 即: N 38.3068, 所以可取
25.5
N 39方能以95%的把握保证在该时刻分机可以使用外
在§1.3中, 我们曾经提到频率的稳定性. 设随机事件A的概率P(A)=p, 在n重贝努利试验中事件A 发生的频率为 f n A .当n很大时, 将与p非常接近. 由 于 f n A 本质上是一个随机变量,它随着不同的n次试 验可能取不同的值, 因而需要对随机变量序列引进新 的收敛性定义.
Y np 1 n lim P x n np 1 p 2
即当 n 充分大时,
np 1 p Yn np
x
e
t2 2
dt ,
近似服从标准正态分布.
例2. 在次品率为1/6的一大批产品中, 任意取出300件产 品, 利用中心极限定理, 计算抽取的产品中次品数在40到60 之间的概率. 解 以Yn 表示300件产品中次品的总数, 由题意得
2 1 2 0.0456.
定理5.5中限定条件得到如下定理5.6
定理 5.6 设 X1 , X 2 , 随机变量序列,且 Xi
, X n 是一个独立同分布的
B 1, p , 令
n i 1
Yn X i ,
则对任意的 x x , 有
n
b n a n n n
例1 某人要测量甲、乙两地的距离, 限于测量工具, 他 分成1200段进行测量, 每段测量误差(单位: 厘米)服从 区间 0.5,0.5 上的均匀分布, 试求总距离测量误差的 绝对值超过 20 厘米的概率.
例6. 某单位有200台分机, 每台使用外线通话的概率 为15%, 若每台分机是否使用外线是相互独立的, 问该 单位至少需要装多少多少条外线, 才能以95%的概率保 保证每台分机能随时接通外线电话. 解 以Yn 表示在时刻 t使用的外线数, 则 此时有np 30, np 1 p 25.5. 若以N表示安装的外 线数, 则分机能使用外线意味着此时有 Yn N . 中心极限定理得: 由
A ”发生的 示在400次相互独立的重复实验试验中事件“ 次 数, 由前面所讨论的知:
p 0.75,
及 Yn
B 400,0.75 , 因 n 400, 由中心极限定理知, 对
任意的 x, 有
Y np P n x x, np 1 p
第五章 随机变量序列的极限
概率论的基本任务是研究随机现象的统计规律性. 引进 随机变量之后, 我们集中研究了随机变量取值的统计 规律性. 在一个具体问题中,的常用方法是研究极限.
§5.1 大数定律 law of large numbers
线.
作业: 习题五 6,8,10
1 Yn B 300, , 6 250 此时,np 50, np 1 p , 由中心极限定理得 6 40 50 Yn np 60 50 P 40 X 60 P 250 / 6 250 / 6 np 1 p
则对任意的 x x , 有
i 1, 2, ,
n X i np lim P i 1 x x . n n
应 用 当 n 充 分 大 时
P a Xi b i 1 n a n X i n b n i 1 P 2 n n n
且函数
g x, y 在 a, b 处连续, 则
P g X n , Yn g a, b
下面, 考虑频率的稳定性
定理5.4 贝努里大数定律
设
X1 , X 2 ,
是一个随机变量序列. 且每一个随机变量
P X p
都服从0-1分布B 1, p , 则 证明关键步骤:
由条件所设, 所求的概率为
x 0.99.
而 x 为标准正态分布的分布函数, 查表得x 2.326. 即:
X np P 2.326 0.99. np 1 p
从而
3 300 20 320. X 300 2.326 20 4
i 1
n
i
n
n 2
n
N 0,1
因此:
X i n i 1 P b b n
定理5.5 独立同分布的中心极限 设 X1 , X 2 ,
, Xn,
是独立同分布的随机变量序列, 且
E X i p, D X i 2 0
解 以 X i 表示第i 个部件的称量误差, 设分成n个部件
从而
R 1,1 . 1 2 0, , 3 Xi
n X i n n 10 0 P X i 10 P i 1 n n3 i 1 10 0 2 1 0.99 n3 2 10 10 0 u0.995 2.576 所以 n 3 45 n3 2.576
Yn
则
B 100,0.2 , np 20, np 1 p 16,
0 20 Yn np 30 20 P 0 Yn 30 P 4 4 np 1 p 2.5 5 0.9938.
1 n 1 n D Xi 2 D Xi n i 1 n i 1 n 1 2 D X i cov X , X i j n i 1 i j 1 c 2 nc n n
§5.2 中心极限定理
n
i 1,2,,1200 .
由独立同分布情形下的中心极限定理:
X i n 20 i 1 n 1 1200 12
1 P
X i n i 1 2 n
n
1 2 2
定义5.1 依概率收敛 设
X1 , X 2 ,
是一个随机变量序列. 如果存在一个常数c
使得对任意一个正数 , 总有
n
lim P X n c 1
X1 , X 2 ,
依概率收敛于c
则称随机变量序列 记作:
P X n c
定理5.1 如果
P P X n a, Yn b,
例4. 设一个车间有400台同类型的机床, 每台机床需用 电 Q 瓦, 由于工艺关系, 每台机器并不连续开动, 开动的 时候只占工作总时间的3/ 4, 问应该供应多少瓦电力能 99%的概率保证该车间的车床能正常工作.(假定在工作 期内每台机器是否处于工作状态是相互独立的). 解 令Yn 表示在时刻 t 时正在开动的机器数, 则Yn 可以表
1200
解 设第i 段的测量误差为 X i , 所以累计误差为 又 X1 , X 2 , 得
X ,
i 1 i
, X1200 为独立同分布的随机变量, 由
Xi
R 0.5,0.5
1 E X i 0, D X i , 12
n P X i 20 P i 1
定理5.2 切比雪夫大数定律
设
X1 , X 2 ,
是两两不相关的随机变量序列. 且
方差一致有界. 则
1 n 1 n P X i E Xi n i 1 n i 1
证明关键步骤:
1 n 1 n E Xi E Xi n i 1 n i 1
在数理统计中经常要用到n个独立同分布的随机变量
, X n的和 X i 的分布, 但要给出其精确分布 有 i 1 时很困难. X1 , X 2 ,
正态分布具有可加性,若
n
X1 , X 2 ,
则:
X n iid, X i
i
X
i 1
n
N ,
2
2
N n , n
标准化后得
X