016第五章 极限定理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本章要解决的问题 1. 为何能以某事件发生的频率 作为该事件的 概率的估计? 2. 为何能以样本均值作为总体 期望的估计?
3. 为何正态分布在概率论中占 有极其重要的地位? 4. 大样本统计推断的理论基础 是什么?
答复 大数 定律
中心极 限定理
重要不等式
马尔可夫(Markov) 不等式 设非负随机变量 X 的期望 E( X )存在, 则对于任意实数 > 0,
n /(10 pq ) 1.96 n 19.6 pq 现在的问题是如何确定 pq .
2
设 令
f ( p) p(1 p) pq f ( p) 1 2 p 0 当 p 1 / 2 时, f ( p) 1 / 4 达到最大值.
19.6 pq 19.6 (1 / 4) 96.04 n 所以取 n 97 就能满足要求.
某个客观值P(后称概率)的附近。
由频率的这种稳定性人们才确认了概 率的存在性,又由频率的基本性质推断出 概率的基本性质,并且在实际应用中就将
频率值称做为概率的估计值.
例如,常认为生男、生女的可能性大致相同,各为
o.5,实际上,经多个国家和民族的大量统计表明,生男 婴的频率稳定于22/43附近;
又如英文打字机上,字母E安置在最便于使用的位
7.设有1000人独立行动,每个人能够按时进 入掩蔽体的概率为0.9。以95%概率估计,在一 次行动中:(1)至少有多少人能够进入掩蔽体;(2) 至多有多少入能进入掩蔽体.
根据中心极限定理,有
8.(1)一个复杂系统由l00个相互独立的元件 组成,在系统运行期间每个元件损坏的概率为0.10, 又知为使系统正常运行,至少必须有85个元件工 作,求系统的可靠度(即正常运行的概率);
2 2
97 0.7 139 取140. 140 20 7
电视台需安排 7 人作调查.
若使调查误差在1%之内,则
196 pq 38415(1 / 4) 9604 n
2
所以取 n 9605 就能满足要求.
9605 0.7 13721.4 取13722.
13722 20 686.1
显然
定理5.5描述了在一定条件下,标准化的随 机变量列的分布以标准正态分布作为极限分布.
于是,我们就便于把握总用电量
由此定理可知,正态分布是二项分布的极限 分布.
因此,当n很大时,有如下所示的近似计算二 项分布的常用方法.
由独立同分布和中心极限定理有
由中心极限定理
查标准正态分布表得
0.1875n P| X 0.75n | 0.01n 1 2 (0.01n) 令 0.1875n 1 0.90 2 (0.01n) 解得 n 18750
§5.1 大数定律
在我们开始引入“概率”这个概念之前,曾 先引进了关于频率的概念,而且指出过,随着试 验(观测)次数的增多,频率将逐渐稳定于
P( X )
E( X )
证 仅证连续型随机变量的情形
P( X ) f ( x)dx
x
0
1
f ( x)dx
xf ( x)dx E ( X )
推论 1 设随机变量 X 的k阶绝对原点矩 E( |X |k) 存在,则对于任意实数 > 0,
即“频率”或“平均值”在依概率收敛
3.中心极限定理说明什么问题? 答 中心极限定理提出了独立随机变量的和在变量的 项数很大时,如何确定它的渐近分布的问题.
一、复习要求
1.了解切比雪夫不等式; 2.了解大数定律成立的条件及结论; 3. 了解中心极限定理应用的条件及结论;并会 利用相关的定理近似计算有关事件的概率.
PROBABILITY THEORY AND MATHEMATICAL STATISTICS
概率论与数理统计
黔南民族师范学院 数学系 余吉东
第五章 极限定理 重要不等式 §5.1 大数定律 §5.2 中心极限定理 释疑解难 复习要求及复习要点 典型例题分析
第五章 极限定理
这一章我们介绍概率论中最基本的极限 定理——著名的大数定律和中心极限定理. 它们无论在概率论的发展史上,还是近 代概率论的研究中,都占有很重要的地位。 这里我们只给出最基本的结论和应用。
每晚节目A 播出一小时, 调 查需同时进行, 设每小时每人能 调查20户, 每户居民每晚看电视 的概率为70%, 电视台需安排多 少人作调查.
解 设 X 为回答看电视的居民中在收看
节目A 的户数, 则 X ~ B (n , p) , 其中p 为 要估计的收视率, 要求 n , 使
P( X / n p 0.1) P[ ( X np) / npq n /(10 pq )] 2[ n /(10 pq)] 1 0.95
由此引出了各种概率意义下收敛性的概 念,其中较为简单的依概率收敛的定义.
如
(a , a ) 内的概率越来越大. n0 , n n0
Xn
Xn a
P
意思是:当
n 时,Xn落在
a
而
a
a
X n a 意思是: 0, n0 ,当
n n0
| X n a |
前面我们曾多次提到正态分布,实际 上,无论在概率论与数理统计的理论中,还是 实际的应用中,正态分布都是最常见、最重要 的分布.
人们自然要问:
为什么有许多的随机变量都服从(或近似 服从)正态分布? 是一些人的经验猜测,还是有理论依据? 这一节就是来回答这些问题,先看几个例子:
在此我们将不加证明地给出如下定理
P(| X | ) E (| X | )
k
推论 2 ——切贝雪夫( chebyshev)不等式 设随机变量 X 的方差 D ( X )存在, 则对于任意实数 > 0,
P(| X E ( X ) | ) D( X )
k
2
D( X )
当 2 D(X) 无实际意义,
或 P(| X E ( X ) | ) 1
6 83 0.7685 P(| X 1000 | 60) 1 2 108 60
实际精确计算
1 X P940 X 1060 P 0.01 6000 6
1059
k 941
C
k 6000
1 6
k
5 6
6000k
0.959036
用Poisson 分布近似计算 取 = 1000
1 X P 0.01 P940 X 1060 6000 6
1000 e k! k 941
1059
k
1000
0.937934
例 设每次试验中,事件 A 发生的概率为 0.75, 试用 Chebyshev 不等式估计, n 多大 时, 才能在 n 次独立重复试验中, 事件 A 出 现的频率在0.74 ~ 0.76 之间的概率大于 0.90? 解 设 X 表示 n 次独立重复试验中事件 A 发生的次数 , 则 X ~ B(n,0.75)
2
例 设有一大批种子,其中良种占1/6. 试 估计在任选的 6000 粒种子中, 良种所占比 例与1/6 比较上下小于1%的概率. 解 设 X 表示 6000 粒种子中的良种数 , X ~ B (6000,1/6 )
5000 E ( X ) 1000, D( X ) 6 1 X P 0.01 6000 6 5000
3.某工厂有400台同类机器,各台机器发生 故障的概率都是0.02.假设各台机器工作是相互 独立的,试求机器出故障的台数不少于2的概率.
4.某地抽样调查结果表明,考生的外语成绩 (百分制)近似正态分布,平均成绩为72分,96分以 上的占考生总数的2.3%,试求考生的外语成绩 [附表] 在60分至84分之间的概率.
将有关数据代入上式,得
即有99%的把握断言
从而
也就是需使
释疑解难
1.依概率收敛与高等数学中的收敛有何不同?
因此,依概率收敛的条件比高等数学中的收 敛的条件要弱具有某种不确定性.
2.大数定律说明什么问题?
答 在实践中人们发现事件发生的“频率” 具有稳定性. 在讨论数学期望时,也看到在进行大量 独立重复试验时,“平均值”包具有稳定 性. 大数定律正是以严格的数学形式证明了 “频率”和“平均值”的稳定性,同时表达 了这种稳定性的含义.
这就从数学上证明了频率的稳定性 现在,我们就会对第一章中蒲丰等人的投币 试验的试验数据的含义理解得更加透彻.
这里,没有要求Xi,服从什么样的分布,也 就是说,无论x1,x2,```xn服从什么样的分布,只要它 们独立、同分布且数学期望存在,就有它们n 个的平均依概率收敛于其期望值。
显然,伯努利大数定律是辛钦大数定律的特殊情形
5.试利用(1)切比雪夫不等式;(2)中心极限 定理分别确定投掷一枚均匀硬币的次数,使得出 现“正面向上”的频率在0.4到0.6之间的概率不小 于0.9 .
由此得
由此得 查表得 6.某保险公司多年的统计资料表明,在索赔 户中被盗索赔户占20%,以X表示在随意抽查的 l00个索赔户中因被盗向保险公司索赔的户数 (1)写出X的概率分布; (2)利用橡莫弗—拉普拉斯定理,求被盗索赔 户不少于14户且不多于30户的概率的近似值.
置上,因为大量的统计表明,字母E出现的频率约为0.105, 大大超过其它字母,等等.
这些稳定性现象,从直观上可解释为在 大量的随机现象中,个别随机现象所引起的 偏差常常会相互抵消,相互补偿而被平均化, 从而致使大量随机现象的共同作用的总的平 均结果趋于稳定. 大数定律在描述这类现象的过程中,是 以研究某些概率接近于1(或零)的事件的规律 的方式进行的.
电视台需安排 687 人作调查.
§5.2 中心极限定理
在自然科学、工程技术、经济学、生物学、 医学以及社会学等领域,人们经常遇到这样一 类随机现象,该现象是由许多随机因素的叠加 产生的. 将这些现象抽象为概率论的内容,就是要 研究由许多独立随机变量的和所组成的随机变 量的分布规律. 即研究由无穷多个随机变量组成和的极 限分布律,这就是中心极限定理所要讨论的内 容.
E ( X ) 0.75 n, D( X ) 0.1875 n
0.74 X 0.76 0.90 ,求 n 要使 P n
即 P0.74 n X 0.76 n 0.90 即 P| X 0.75n | 0.01n 0.90 由 Chebyshev 不等式, = 0.01n ,故
另外,我们所熟知的二项分布、泊松分布、均匀分 布、指数分布、正态分布等序列,都满足定理5.4的条件, 都具有“n个独立随机变量的平均依概率收敛于期望值” 的性质.
实际上,我们可以根本不管这些随机变量服从什么样的分布, 只要知道它们的期望或方差就可以了。
解 因为
故
例 电视台需作节目A 收视率的 调查. 每天在播电视的同时, 随机地向 当地居民打电话询问是否在看电视. 若在看电视, 再问是否在看节目A. 设回答看电视的居民户数为 n. 若要保证以 95%的概率使节目A 收视率的调查误差在10%之内, n 应 取多大?
二、复习要点
(一)重要概念及性质
若
(二)重要定理及公式
证 因为
证 由题意可知
此定理也称为独立同分布的中心极限定律.
然后根据中心极限定理
三、典型例题分析
1.利用切比雪夫不等式估计随机变量与其数 学期望之差大于3倍标准差的概率. 解 由切比雪夫不等式
2.在每次试验中,事件A发生的概率为0.5, 利Biblioteka Baidu切比雪夫不等式估计:在1000次独立试验中, 事件A发生的次数在400~600之间的概率.
从而有
在实际应用中,当我们知道一串随机变量列 的期望存在,且满足马尔柯夫条件,则可用这个 随机变量列的算术平均作为对其期望平均值的一
种估计.
由大数定律,可得到一些特殊的有趣结果:
即结论成
这就是满足上述条件的n个随机变量的算术平 均,当n无限增大时具有的稳定性的确切解释。
证 令
由于贝努里试验的广泛性,进而我们可以看 出一般所说的“频率”接近于“概率”的数学依 据了.