概率论与数理统计课件第八章假设检验01
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
若抽查结果发现1件次品, 则在H0成立时
P C p (1 p) 0.306 0.3
1 1 12 11
这不是 小概率事件, 没理由拒绝原假设。在不 准备继续抽样的情况下,作出接受原假设的决 定, 即该批产品可以出厂.
5
例2: 一条新建的南北交通干线全长10公里.公路 穿过一个隧道(长度忽略不计),隧道南面3.5公里, 北面6.5公里. 在刚刚通车的一个月中, 隧道南 发生了3起交通事故, 而隧道北没有发生交通事 故,能否认为隧道南的路面更容易发生交通事故? 分析: 用p表示一起交通事故发生在隧道南的概 率.则p=0.35表示隧道南北的路面发生交通事故 的可能性相同.p>0.35表示隧道南的路面发生交 通事故的概率比隧道北的路面发生交通事故的 概率大. ------为了作出正确的判断, 先作一个假设
所以我们否定H0, 认为隧道南的路面发生交 通事故的概率比隧道北大. 做出以上结论也有可能犯错误。这是因为 当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯 错误。这一概率正是P=0.043. 于是, 我们判断正确的概率是1-0.043=95.7%
8
假设检验中的基本概念和检验思想 (1) 根据问题的背景, 提出原假设 H0: p=0.35, 及其备择假设 H1: p>0.35.
再作一个备择假设
H1 : p 0.04
在H0成立时
3 3 12 9
p 0.04 代入
4
P C p (1 p) 0.0097 0.01
这是 小概率事件, 一般在一次试验中是不会发 生的, 现一次试验竟然发生, 故可认为原假设不 成立, 即该批产品次品率p>0.04 , 则该批产品不 能出厂.
-----犯第一
显著性 水平
拒绝还是不能 拒绝H0
26
§8.2
正态均值的假设检验
A. 已知 时, 的正态检验法
例 5: 一台方差是0.8克的自动包装机在流水线 上包装净重500克的袋装白糖. 现随机抽取了9 袋白糖, 测得净重如下(单位:克): 499.12 499.48 499.25 499.53 500.82 499.11 498.52 500.01 498.87. 能否认为包装机在正常工作?
22
例4 :第一类错误与第二类错误的比较 一个有20多年教龄的教师声称他上课从来不 “点名”. 如何判定他讲的话是真实的? 确立原假设H0: 他没有点过名。 然后再调查H0是否为真. 当调查了他教过的3个班, 都说他没有点过名, 这时如果承认H0, 犯错误的概率还是较大的. 当调查了他教过的10个班, 都说他没有点过名, 这时承认H0 犯错误的概率会明显减少。
29
在例5中,α称为检验的显著性水平, 简称为显著 性水平, 检验水平, 或水平(level); Z称为检验统 计量; {|Z|≥ zα/2}称为检验的拒绝域或否定域; ------ 如果事件{|Z|≥ z/2}发生了, 就称检验是显 著的. 这时否定H0, 犯第一类错误的概率不超过 α。 ------ 拒绝域是一个事件, 它的发生与否由|Z|, 从 而由观测样本X1,X2,….,Xn决定. ------由于这种检验方法是基于正态分布的方法, 所以又称为正态检验法或Z检验法.
第八章
假设检验
假设检验是统计推断的一个主要部分. 在科学研究, 日常工作甚至生活中经常对某一 件事情提出疑问. 解决疑问的过程往往是先做一个和疑问 相关的假设, 然后在这个假设下去寻找有关的 证据.如果得到的证据是和假设相矛盾的, 就要 否定这个假设.
1
§8.1
假设检验的概念
何为假设检验?
当总体分布函数完全未知或只知其形式、 但不知其参数的情况,为推断总体的性质,提 出某些关于总体的假设。 为判断所作的假设是否正确, 从总体中抽 取样本, 根据样本的取值, 按一定的原则进 行检验, 然后, 作出接受或拒绝所作假设的 决定.
这说明在不同的检验水平下可以得到 不同的检验结果.
(2) 在H0 成立的假设下, 计算观测数据出现的概 率P. 如果P很小(一般用0.05衡量), 就应当否定H0, 承认 H1;
9
如果P不是很小, 也不必急于承认H0, 这是因为 证据往往还不够充分. 如果继续得到的观测数据还不能使得P降低下 来, 再承认H0不迟.
注:为了简便, 我们把以上的原假设和备择假 设记作 H0: p=0.35 vs H1: p>0.35.
分析: 9袋白糖中有7袋净重少于500克, 似乎净重 μ0=500不对.
但是, 方差是0.8克, 也可能是由于包装机的随 27 机误差导致了以上的数据.
解: 将包装机包装的袋装白糖的净重视为总体 X, 则X ~N ( 2), 其中2 =0.8已知,未知. 用Xj表示第 j 袋白糖的净重, 则X1,X2,…,X9 是来自总体X的n=9个样本. 提出假设 H0: =0 在 H 0下 , 检验统计量
24
假设检验步骤(三部曲) 根据实际问题所关心的内容,建立H0与H1。
在H0为真时,选择合适的统计量T, 并确定
拒绝域。
根据样本值计算,并作出相应的判断.
25
提出 假设
根据统计调查的目的, 提出 原假设H0 和备择假设H1
作出 决策
总 结
抽取 样本 P(T W)= 检验 假设
类错误的概率, W为拒绝域
如果调查了他教过的30个班, 都说他没有点 过名, 这时承认H0犯错误的概率就会很小了。 23 可惜调查30个班是很难做到的!
反过来, 在调查中只要有人证实这位老师点过 名, 就可以否定H0了(不论调查了几个班), 并且这 样做犯错误的概率很小. 例4告诉我们, 要否定原假设H0是比较简单的, 只要观测到了H0下小概率事件就可以。 要承认H0就比较费力了: 必须有足够多的证 据(样本量), 才能够以较大的概率保证H0的真实. 在这个例子中还有一个现象值得注意: 当调 查10个班发现都没有点过名就承认H0时, 即使判 断失误, 造成的后果也不严重. 因为数据已经说明 这位老师不爱点名.
30
在例5中, 如果取检验水平 =0.04, 则临界 值z /2 =2.054 . 这时|z|=1.97<2.054, 不能否定H0. 降低犯第一类错误的概率, 就会使得拒绝域 减小,
{| Z | z0.04/ 2} {| Z | z0.05/ 2}.
从而拒绝H0的机会变小,接受H0的机会变大。
其中的vs是versus的缩写.
10
参数检验的一般提法
一般来讲, 设X1, X2,…,Xn是来自总体X的样 本, 是总体X的未知参数, 但是已知 Θ0 Θ1, 它们是互不相交的参数集合. 对于假设 H0: Θ0 vs H1: Θ1,
根据样本,构造一个检验统计量T 和检验法则: 若与T的取值有关的一个小概率事件W发生,则 否定H0,否则接受H0,而且要求
x 68.5
问原假设是否正确?
12
解:构造检验统计量
3.6 若原假设H0正确, 则 X ~ N (68 , ) 36 又因为 X 是 的无偏估计。则它偏离68不 应该太远, 偏离较远是小概率事件。
由于
2
X 68 ~ N (0,1) 3.6 6
X 68 3.6 6
故
取较大值也是小概率事件。
P (W | H 0 )
此时称W为拒绝域,为检验水平。
11
例 3. 某厂生产的螺钉,按标准强度为68克/mm2, 而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 E ( X ) = = 68, 则认为这批螺钉符合要求,否 则认为不符合要求.为此提出如下原假设 H0 : = 68 和备择假设 H1 : 68 现从该厂生产的螺钉中抽取容量为 36 的样本, 其样本均值为
1.96
X 69.18 或 X 66.824
于是检验的拒绝域为
W { X 69.18 or X 66.824}
现根据样本观测值,
x 68.5
现 x 68.5未落入拒绝域, 则接受原假设H0: = 68
15
假设检验的两类错误
解决假设检验的问题时, 无论作出否定还 是接受原假设H0的决定, 都有可能犯错误. 我们 称否定H0时犯的错误为第一类错误, 接受H0时 犯的错误为第二类错误. 具体如下,
13
规定为小概率事件的概率大小,也是显著水平。
通常取
= 0.05, 0.01,…
如 = 0.05。确定一个常数 c , 使得
X 68 P c 3.6 6
则
c z z0.025 1.96
2
14
由
X 68 3.6 6
18
在例3 中 P(拒绝H0|H0为真)
P ( X 66.824 X 69.18)
0.05
19
在假设检验中,我们希望所用的检验方
法尽量少犯错误,但不能全排除犯错误的可
能性.理想的检验方法应使犯两类错误的概率
都很小,但在样本的容量给定的情形下, 不可 能使两者都很小,降低一个, 往往使另一个增 大.
20
假设检验的指导思想是控制犯第一类错误 的概率不超过 ,然后,若有必要,通过增大样 本容量的方法来减少 . 因为假设检验一般控制第一类错误的概率在 检验水平以下, 所以否定H0 时结论比较可靠。
如果承认H0,可能犯第二类错误,错误概率 可能会比较大。
21
在正确的统计推断前提下, 犯错误的原因总 是随机因素造成的。 要有效减少犯错误的概率, 只好增加观测数 据,或在可能的情况下提高数据的质量,这相当 于降低数据的样本方差.
2
我们主要讨论的假设检验的内容有 参数检验 总体均值、均值差的检验 总体方差、方差比的检验
非参数检验: 分布拟合检验 假设检验的理论依据 其理论背景为实际推断原理,即“小概率原 理”,其想法和前面的最大似然类似:如果实际 观测到的数据在某假设下不太可能出现, 则认为 该假设错误。 3
例 1: 某产品的出厂检验规定: 次品率 p 不超过 4%才能出厂. 现从一万件产品中任意抽查12件 发现3件次品, 问该批产品能否出厂?若抽查结 果发现1件次品, 问能否出厂? 解: 先作一个假设。 H 0 : p 0.04 我们称H0是原假设或零假设.
vs
H1: ≠ 0.
Z
X 9 0
~ N (0,1)
9
若要求
P (| Z | c )
28
对于标准正态分布,c应为其上α/2分位数zα/2, 于是拒绝域为
W {| Z ||
x9 0
| z / 2 }
9
本例中,如果取=0.05, 则 x9 0 W {| Z || | z0.025 1.96} 9 根据抽样数据,得|z| = 1.97时, 不该发生的小 概率事件发生了, 于是否定原假设H0.
正确
犯第一类错误的概率通常记为 犯第二类错误的概率通常记为
17
如在例2中, 如果第一起交通事故发生后, 就 断定隧道南更容易发生交通事故, 犯第一类错 误的概率是0.35. 当第二起交通事故发生后, 断 定隧道南更容易发生交通事故, 犯第一类错误 的概率是0.352=0.1225. 如果第四起交通事故又 发生在隧道南, 否定p=0.35时犯第一类错误的概 率是0.354=0.015.
6
H0: p=0.35. 我们称H0是原假设或零假设. 再作一个备择假设 H1: p> 0.35. 在本问题中,如果判定H0不对,就应当承认H1. 检验: 三起交通事故的发生是相互独立的, 他们 之间没有联系. 如果H0为真, 则每一起事故发生在隧道南的 概率都是0.35, 于是这三起交通事故都发生在隧 道南的概率是 P= 0.353 ≈ 0.043. 7 这是一个很小的概率, 一般不容易发生.
(1) H0为真, 统计推断的结果否定H0, 犯第一类 错误, 犯该错误的概率不超过。 (2) H0为假, 统计推断的结果接受H0, 犯第二类 错误,我们记犯该错误的概率为。
16
假设检验的两类错误
所作判断 真实情况 接受 H0 拒绝 H0
H0 为真
H0 为假
正确 第二类错误 (取伪)
第一类错误 (弃真)
P C p (1 p) 0.306 0.3
1 1 12 11
这不是 小概率事件, 没理由拒绝原假设。在不 准备继续抽样的情况下,作出接受原假设的决 定, 即该批产品可以出厂.
5
例2: 一条新建的南北交通干线全长10公里.公路 穿过一个隧道(长度忽略不计),隧道南面3.5公里, 北面6.5公里. 在刚刚通车的一个月中, 隧道南 发生了3起交通事故, 而隧道北没有发生交通事 故,能否认为隧道南的路面更容易发生交通事故? 分析: 用p表示一起交通事故发生在隧道南的概 率.则p=0.35表示隧道南北的路面发生交通事故 的可能性相同.p>0.35表示隧道南的路面发生交 通事故的概率比隧道北的路面发生交通事故的 概率大. ------为了作出正确的判断, 先作一个假设
所以我们否定H0, 认为隧道南的路面发生交 通事故的概率比隧道北大. 做出以上结论也有可能犯错误。这是因为 当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯 错误。这一概率正是P=0.043. 于是, 我们判断正确的概率是1-0.043=95.7%
8
假设检验中的基本概念和检验思想 (1) 根据问题的背景, 提出原假设 H0: p=0.35, 及其备择假设 H1: p>0.35.
再作一个备择假设
H1 : p 0.04
在H0成立时
3 3 12 9
p 0.04 代入
4
P C p (1 p) 0.0097 0.01
这是 小概率事件, 一般在一次试验中是不会发 生的, 现一次试验竟然发生, 故可认为原假设不 成立, 即该批产品次品率p>0.04 , 则该批产品不 能出厂.
-----犯第一
显著性 水平
拒绝还是不能 拒绝H0
26
§8.2
正态均值的假设检验
A. 已知 时, 的正态检验法
例 5: 一台方差是0.8克的自动包装机在流水线 上包装净重500克的袋装白糖. 现随机抽取了9 袋白糖, 测得净重如下(单位:克): 499.12 499.48 499.25 499.53 500.82 499.11 498.52 500.01 498.87. 能否认为包装机在正常工作?
22
例4 :第一类错误与第二类错误的比较 一个有20多年教龄的教师声称他上课从来不 “点名”. 如何判定他讲的话是真实的? 确立原假设H0: 他没有点过名。 然后再调查H0是否为真. 当调查了他教过的3个班, 都说他没有点过名, 这时如果承认H0, 犯错误的概率还是较大的. 当调查了他教过的10个班, 都说他没有点过名, 这时承认H0 犯错误的概率会明显减少。
29
在例5中,α称为检验的显著性水平, 简称为显著 性水平, 检验水平, 或水平(level); Z称为检验统 计量; {|Z|≥ zα/2}称为检验的拒绝域或否定域; ------ 如果事件{|Z|≥ z/2}发生了, 就称检验是显 著的. 这时否定H0, 犯第一类错误的概率不超过 α。 ------ 拒绝域是一个事件, 它的发生与否由|Z|, 从 而由观测样本X1,X2,….,Xn决定. ------由于这种检验方法是基于正态分布的方法, 所以又称为正态检验法或Z检验法.
第八章
假设检验
假设检验是统计推断的一个主要部分. 在科学研究, 日常工作甚至生活中经常对某一 件事情提出疑问. 解决疑问的过程往往是先做一个和疑问 相关的假设, 然后在这个假设下去寻找有关的 证据.如果得到的证据是和假设相矛盾的, 就要 否定这个假设.
1
§8.1
假设检验的概念
何为假设检验?
当总体分布函数完全未知或只知其形式、 但不知其参数的情况,为推断总体的性质,提 出某些关于总体的假设。 为判断所作的假设是否正确, 从总体中抽 取样本, 根据样本的取值, 按一定的原则进 行检验, 然后, 作出接受或拒绝所作假设的 决定.
这说明在不同的检验水平下可以得到 不同的检验结果.
(2) 在H0 成立的假设下, 计算观测数据出现的概 率P. 如果P很小(一般用0.05衡量), 就应当否定H0, 承认 H1;
9
如果P不是很小, 也不必急于承认H0, 这是因为 证据往往还不够充分. 如果继续得到的观测数据还不能使得P降低下 来, 再承认H0不迟.
注:为了简便, 我们把以上的原假设和备择假 设记作 H0: p=0.35 vs H1: p>0.35.
分析: 9袋白糖中有7袋净重少于500克, 似乎净重 μ0=500不对.
但是, 方差是0.8克, 也可能是由于包装机的随 27 机误差导致了以上的数据.
解: 将包装机包装的袋装白糖的净重视为总体 X, 则X ~N ( 2), 其中2 =0.8已知,未知. 用Xj表示第 j 袋白糖的净重, 则X1,X2,…,X9 是来自总体X的n=9个样本. 提出假设 H0: =0 在 H 0下 , 检验统计量
24
假设检验步骤(三部曲) 根据实际问题所关心的内容,建立H0与H1。
在H0为真时,选择合适的统计量T, 并确定
拒绝域。
根据样本值计算,并作出相应的判断.
25
提出 假设
根据统计调查的目的, 提出 原假设H0 和备择假设H1
作出 决策
总 结
抽取 样本 P(T W)= 检验 假设
类错误的概率, W为拒绝域
如果调查了他教过的30个班, 都说他没有点 过名, 这时承认H0犯错误的概率就会很小了。 23 可惜调查30个班是很难做到的!
反过来, 在调查中只要有人证实这位老师点过 名, 就可以否定H0了(不论调查了几个班), 并且这 样做犯错误的概率很小. 例4告诉我们, 要否定原假设H0是比较简单的, 只要观测到了H0下小概率事件就可以。 要承认H0就比较费力了: 必须有足够多的证 据(样本量), 才能够以较大的概率保证H0的真实. 在这个例子中还有一个现象值得注意: 当调 查10个班发现都没有点过名就承认H0时, 即使判 断失误, 造成的后果也不严重. 因为数据已经说明 这位老师不爱点名.
30
在例5中, 如果取检验水平 =0.04, 则临界 值z /2 =2.054 . 这时|z|=1.97<2.054, 不能否定H0. 降低犯第一类错误的概率, 就会使得拒绝域 减小,
{| Z | z0.04/ 2} {| Z | z0.05/ 2}.
从而拒绝H0的机会变小,接受H0的机会变大。
其中的vs是versus的缩写.
10
参数检验的一般提法
一般来讲, 设X1, X2,…,Xn是来自总体X的样 本, 是总体X的未知参数, 但是已知 Θ0 Θ1, 它们是互不相交的参数集合. 对于假设 H0: Θ0 vs H1: Θ1,
根据样本,构造一个检验统计量T 和检验法则: 若与T的取值有关的一个小概率事件W发生,则 否定H0,否则接受H0,而且要求
x 68.5
问原假设是否正确?
12
解:构造检验统计量
3.6 若原假设H0正确, 则 X ~ N (68 , ) 36 又因为 X 是 的无偏估计。则它偏离68不 应该太远, 偏离较远是小概率事件。
由于
2
X 68 ~ N (0,1) 3.6 6
X 68 3.6 6
故
取较大值也是小概率事件。
P (W | H 0 )
此时称W为拒绝域,为检验水平。
11
例 3. 某厂生产的螺钉,按标准强度为68克/mm2, 而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 E ( X ) = = 68, 则认为这批螺钉符合要求,否 则认为不符合要求.为此提出如下原假设 H0 : = 68 和备择假设 H1 : 68 现从该厂生产的螺钉中抽取容量为 36 的样本, 其样本均值为
1.96
X 69.18 或 X 66.824
于是检验的拒绝域为
W { X 69.18 or X 66.824}
现根据样本观测值,
x 68.5
现 x 68.5未落入拒绝域, 则接受原假设H0: = 68
15
假设检验的两类错误
解决假设检验的问题时, 无论作出否定还 是接受原假设H0的决定, 都有可能犯错误. 我们 称否定H0时犯的错误为第一类错误, 接受H0时 犯的错误为第二类错误. 具体如下,
13
规定为小概率事件的概率大小,也是显著水平。
通常取
= 0.05, 0.01,…
如 = 0.05。确定一个常数 c , 使得
X 68 P c 3.6 6
则
c z z0.025 1.96
2
14
由
X 68 3.6 6
18
在例3 中 P(拒绝H0|H0为真)
P ( X 66.824 X 69.18)
0.05
19
在假设检验中,我们希望所用的检验方
法尽量少犯错误,但不能全排除犯错误的可
能性.理想的检验方法应使犯两类错误的概率
都很小,但在样本的容量给定的情形下, 不可 能使两者都很小,降低一个, 往往使另一个增 大.
20
假设检验的指导思想是控制犯第一类错误 的概率不超过 ,然后,若有必要,通过增大样 本容量的方法来减少 . 因为假设检验一般控制第一类错误的概率在 检验水平以下, 所以否定H0 时结论比较可靠。
如果承认H0,可能犯第二类错误,错误概率 可能会比较大。
21
在正确的统计推断前提下, 犯错误的原因总 是随机因素造成的。 要有效减少犯错误的概率, 只好增加观测数 据,或在可能的情况下提高数据的质量,这相当 于降低数据的样本方差.
2
我们主要讨论的假设检验的内容有 参数检验 总体均值、均值差的检验 总体方差、方差比的检验
非参数检验: 分布拟合检验 假设检验的理论依据 其理论背景为实际推断原理,即“小概率原 理”,其想法和前面的最大似然类似:如果实际 观测到的数据在某假设下不太可能出现, 则认为 该假设错误。 3
例 1: 某产品的出厂检验规定: 次品率 p 不超过 4%才能出厂. 现从一万件产品中任意抽查12件 发现3件次品, 问该批产品能否出厂?若抽查结 果发现1件次品, 问能否出厂? 解: 先作一个假设。 H 0 : p 0.04 我们称H0是原假设或零假设.
vs
H1: ≠ 0.
Z
X 9 0
~ N (0,1)
9
若要求
P (| Z | c )
28
对于标准正态分布,c应为其上α/2分位数zα/2, 于是拒绝域为
W {| Z ||
x9 0
| z / 2 }
9
本例中,如果取=0.05, 则 x9 0 W {| Z || | z0.025 1.96} 9 根据抽样数据,得|z| = 1.97时, 不该发生的小 概率事件发生了, 于是否定原假设H0.
正确
犯第一类错误的概率通常记为 犯第二类错误的概率通常记为
17
如在例2中, 如果第一起交通事故发生后, 就 断定隧道南更容易发生交通事故, 犯第一类错 误的概率是0.35. 当第二起交通事故发生后, 断 定隧道南更容易发生交通事故, 犯第一类错误 的概率是0.352=0.1225. 如果第四起交通事故又 发生在隧道南, 否定p=0.35时犯第一类错误的概 率是0.354=0.015.
6
H0: p=0.35. 我们称H0是原假设或零假设. 再作一个备择假设 H1: p> 0.35. 在本问题中,如果判定H0不对,就应当承认H1. 检验: 三起交通事故的发生是相互独立的, 他们 之间没有联系. 如果H0为真, 则每一起事故发生在隧道南的 概率都是0.35, 于是这三起交通事故都发生在隧 道南的概率是 P= 0.353 ≈ 0.043. 7 这是一个很小的概率, 一般不容易发生.
(1) H0为真, 统计推断的结果否定H0, 犯第一类 错误, 犯该错误的概率不超过。 (2) H0为假, 统计推断的结果接受H0, 犯第二类 错误,我们记犯该错误的概率为。
16
假设检验的两类错误
所作判断 真实情况 接受 H0 拒绝 H0
H0 为真
H0 为假
正确 第二类错误 (取伪)
第一类错误 (弃真)