概率论与数理统计课件第八章假设检验01

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

若抽查结果发现1件次品, 则在H0成立时
P C p (1 p) 0.306 0.3
1 1 12 11
这不是小概率事件, 没理由拒绝原假设。在不准备继续抽样的情况下，作出接受原假设的决定, 即该批产品可以出厂.
5
例2: 一条新建的南北交通干线全长10公里.公路穿过一个隧道(长度忽略不计),隧道南面3.5公里, 北面6.5公里. 在刚刚通车的一个月中, 隧道南发生了3起交通事故, 而隧道北没有发生交通事故,能否认为隧道南的路面更容易发生交通事故? 分析: 用p表示一起交通事故发生在隧道南的概率.则p=0.35表示隧道南北的路面发生交通事故的可能性相同.p>0.35表示隧道南的路面发生交通事故的概率比隧道北的路面发生交通事故的概率大. ------为了作出正确的判断, 先作一个假设
所以我们否定H0, 认为隧道南的路面发生交通事故的概率比隧道北大. 做出以上结论也有可能犯错误。这是因为当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯错误。这一概率正是P=0.043. 于是, 我们判断正确的概率是1-0.043=95.7%
8
假设检验中的基本概念和检验思想 (1) 根据问题的背景, 提出原假设 H0: p=0.35, 及其备择假设 H1: p>0.35.
再作一个备择假设
H1 : p 0.04
在H0成立时
3 3 12 9
p 0.04 代入
4
P C p (1 p) 0.0097 0.01
这是小概率事件, 一般在一次试验中是不会发生的, 现一次试验竟然发生, 故可认为原假设不成立, 即该批产品次品率p>0.04 , 则该批产品不能出厂.
-----犯第一

显著性水平
拒绝还是不能拒绝H0

26
§8.2
正态均值的假设检验
A. 已知时，的正态检验法
例 5: 一台方差是0.8克的自动包装机在流水线上包装净重500克的袋装白糖. 现随机抽取了9 袋白糖, 测得净重如下(单位:克)： 499.12 499.48 499.25 499.53 500.82 499.11 498.52 500.01 498.87. 能否认为包装机在正常工作?
22
例4 ：第一类错误与第二类错误的比较一个有20多年教龄的教师声称他上课从来不 “点名”. 如何判定他讲的话是真实的? 确立原假设H0: 他没有点过名。然后再调查H0是否为真. 当调查了他教过的3个班, 都说他没有点过名, 这时如果承认H0, 犯错误的概率还是较大的. 当调查了他教过的10个班, 都说他没有点过名, 这时承认H0 犯错误的概率会明显减少。
29
在例5中，α称为检验的显著性水平, 简称为显著性水平, 检验水平, 或水平(level); Z称为检验统计量; {|Z|≥ zα/2}称为检验的拒绝域或否定域; ------ 如果事件{|Z|≥ z/2}发生了, 就称检验是显著的. 这时否定H0, 犯第一类错误的概率不超过 α。 ------ 拒绝域是一个事件, 它的发生与否由|Z|, 从而由观测样本X1,X2,….,Xn决定. ------由于这种检验方法是基于正态分布的方法, 所以又称为正态检验法或Z检验法.
第八章
假设检验
假设检验是统计推断的一个主要部分. 在科学研究, 日常工作甚至生活中经常对某一件事情提出疑问. 解决疑问的过程往往是先做一个和疑问相关的假设, 然后在这个假设下去寻找有关的证据.如果得到的证据是和假设相矛盾的, 就要否定这个假设.
1
§8.1
假设检验的概念
何为假设检验?
当总体分布函数完全未知或只知其形式、但不知其参数的情况，为推断总体的性质，提出某些关于总体的假设。为判断所作的假设是否正确, 从总体中抽取样本, 根据样本的取值, 按一定的原则进行检验, 然后, 作出接受或拒绝所作假设的决定.
这说明在不同的检验水平下可以得到不同的检验结果.
(2) 在H0 成立的假设下, 计算观测数据出现的概率P. 如果P很小(一般用0.05衡量), 就应当否定H0, 承认 H1;
9
如果P不是很小, 也不必急于承认H0, 这是因为证据往往还不够充分. 如果继续得到的观测数据还不能使得P降低下来, 再承认H0不迟.
注：为了简便, 我们把以上的原假设和备择假设记作 H0: p=0.35 vs H1: p>0.35.
分析: 9袋白糖中有7袋净重少于500克, 似乎净重 μ0=500不对.
但是, 方差是0.8克, 也可能是由于包装机的随 27 机误差导致了以上的数据.
解：将包装机包装的袋装白糖的净重视为总体 X, 则X ~N ( 2)，其中2 =0.8已知，未知. 用Xj表示第 j 袋白糖的净重, 则X1,X2,…,X9 是来自总体X的n=9个样本. 提出假设 H0: =0 在 H 0下 , 检验统计量
24
假设检验步骤(三部曲) 根据实际问题所关心的内容,建立H0与H1。
在H0为真时,选择合适的统计量T, 并确定
拒绝域。
根据样本值计算,并作出相应的判断.
25
提出假设
根据统计调查的目的, 提出原假设H0 和备择假设H1
作出决策
总结
抽取样本 P(T W)= 检验假设
类错误的概率， W为拒绝域
如果调查了他教过的30个班, 都说他没有点过名, 这时承认H0犯错误的概率就会很小了。 23 可惜调查30个班是很难做到的！
反过来, 在调查中只要有人证实这位老师点过名, 就可以否定H0了(不论调查了几个班), 并且这样做犯错误的概率很小. 例4告诉我们, 要否定原假设H0是比较简单的, 只要观测到了H0下小概率事件就可以。要承认H0就比较费力了: 必须有足够多的证据(样本量), 才能够以较大的概率保证H0的真实. 在这个例子中还有一个现象值得注意: 当调查10个班发现都没有点过名就承认H0时, 即使判断失误, 造成的后果也不严重. 因为数据已经说明这位老师不爱点名.
30
在例5中, 如果取检验水平 =0.04, 则临界值z /2 =2.054 . 这时|z|=1.97<2.054, 不能否定H0. 降低犯第一类错误的概率, 就会使得拒绝域减小，
{| Z | z0.04/ 2} {| Z | z0.05/ 2}.
从而拒绝H0的机会变小，接受H0的机会变大。
其中的vs是versus的缩写.
10
参数检验的一般提法
一般来讲, 设X1, X2,…,Xn是来自总体X的样本, 是总体X的未知参数, 但是已知 Θ0 Θ1, 它们是互不相交的参数集合. 对于假设 H0: Θ0 vs H1: Θ1,
根据样本，构造一个检验统计量T 和检验法则：若与T的取值有关的一个小概率事件W发生，则否定H0，否则接受H0，而且要求
x 68.5
问原假设是否正确?
12
解：构造检验统计量
3.6 若原假设H0正确, 则 X ~ N (68 , ) 36 又因为 X 是的无偏估计。则它偏离68不应该太远, 偏离较远是小概率事件。
由于
2
X 68 ~ N (0,1) 3.6 6
X 68 3.6 6
故
取较大值也是小概率事件。
P (W | H 0 )
此时称W为拒绝域，为检验水平。
11
例 3. 某厂生产的螺钉,按标准强度为68克/mm2, 而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 E ( X ) = = 68, 则认为这批螺钉符合要求,否则认为不符合要求.为此提出如下原假设 H0 : = 68 和备择假设 H1 : 68 现从该厂生产的螺钉中抽取容量为 36 的样本, 其样本均值为
1.96
X 69.18 或 X 66.824
于是检验的拒绝域为
W { X 69.18 or X 66.824}
现根据样本观测值，
x 68.5
现 x 68.5未落入拒绝域, 则接受原假设H0: = 68
15
假设检验的两类错误
解决假设检验的问题时, 无论作出否定还是接受原假设H0的决定, 都有可能犯错误. 我们称否定H0时犯的错误为第一类错误, 接受H0时犯的错误为第二类错误. 具体如下,
13
规定为小概率事件的概率大小,也是显著水平。
通常取
= 0.05, 0.01,…
如 = 0.05。确定一个常数 c , 使得
X 68 P c 3.6 6
则
c z z0.025 1.96
2
14
由
X 68 3.6 6
18
在例3 中 P(拒绝H0|H0为真)
P ( X 66.824 X 69.18)
0.05
19
在假设检验中，我们希望所用的检验方
法尽量少犯错误,但不能全排除犯错误的可
能性.理想的检验方法应使犯两类错误的概率
都很小,但在样本的容量给定的情形下, 不可能使两者都很小,降低一个, 往往使另一个增大.
20
假设检验的指导思想是控制犯第一类错误的概率不超过 ,然后,若有必要,通过增大样本容量的方法来减少 . 因为假设检验一般控制第一类错误的概率在检验水平以下，所以否定H0 时结论比较可靠。
如果承认H0，可能犯第二类错误，错误概率可能会比较大。
21
在正确的统计推断前提下, 犯错误的原因总是随机因素造成的。要有效减少犯错误的概率, 只好增加观测数据，或在可能的情况下提高数据的质量，这相当于降低数据的样本方差.
2
我们主要讨论的假设检验的内容有参数检验总体均值、均值差的检验总体方差、方差比的检验
非参数检验: 分布拟合检验假设检验的理论依据其理论背景为实际推断原理，即“小概率原理”,其想法和前面的最大似然类似：如果实际观测到的数据在某假设下不太可能出现, 则认为该假设错误。 3
例 1: 某产品的出厂检验规定: 次品率 p 不超过 4%才能出厂. 现从一万件产品中任意抽查12件发现3件次品, 问该批产品能否出厂？若抽查结果发现1件次品, 问能否出厂？解: 先作一个假设。 H 0 : p 0.04 我们称H0是原假设或零假设.
vs
H1: ≠ 0.
Z
X 9 0

~ N (0,1)
9
若要求
P (| Z | c )
28
对于标准正态分布，c应为其上α/2分位数zα/2，于是拒绝域为
W {| Z ||
x9 0

| z / 2 }
9
本例中，如果取=0.05, 则 x9 0 W {| Z || | z0.025 1.96} 9 根据抽样数据，得|z| = 1.97时, 不该发生的小概率事件发生了, 于是否定原假设H0.
正确
犯第一类错误的概率通常记为犯第二类错误的概率通常记为
17
如在例2中, 如果第一起交通事故发生后, 就断定隧道南更容易发生交通事故, 犯第一类错误的概率是0.35. 当第二起交通事故发生后, 断定隧道南更容易发生交通事故, 犯第一类错误的概率是0.352=0.1225. 如果第四起交通事故又发生在隧道南, 否定p=0.35时犯第一类错误的概率是0.354=0.015.
6
H0: p=0.35. 我们称H0是原假设或零假设. 再作一个备择假设 H1: p> 0.35. 在本问题中,如果判定H0不对,就应当承认H1. 检验: 三起交通事故的发生是相互独立的, 他们之间没有联系. 如果H0为真, 则每一起事故发生在隧道南的概率都是0.35, 于是这三起交通事故都发生在隧道南的概率是 P= 0.353 ≈ 0.043. 7 这是一个很小的概率, 一般不容易发生.
(1) H0为真, 统计推断的结果否定H0, 犯第一类错误, 犯该错误的概率不超过。 (2) H0为假, 统计推断的结果接受H0, 犯第二类错误，我们记犯该错误的概率为。
16
假设检验的两类错误
所作判断真实情况接受 H0 拒绝 H0
H0 为真
H0 为假
正确第二类错误 (取伪)
第一类错误 (弃真)