概率论与数理统计 8.1(假设检验的思想方法和基本概念)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
于是可以选定一个适当的正数k,
x 0 当观察值 x 满足 k时, 拒绝假设H 0 , / n x 0 反之, 当观察值 x 满足 k时, 接受假设H 0 . / n
X 0 因为当H 0为真时 Z ~ N (0,1), / n
于是,当原假设 H0:μ =0.5 成立时,有:
带概率性质的反证法的逻辑是: 即如果假设H0是正确的话,出现一个概率很 小的事件,则以很大的把握否定假设H0.
8.1.1 假设检验的思想方法
下面分别推出这两种检验的拒绝域: (1) 右边检验: H0: 0 H1: > 0
对于给定的小概率 , 由图8-2易知
/ n
由于X~N(, 2) ,所以 Z X ~ N (0,1)
左侧检验
(显著性水平与拒绝域 )
抽样分布
拒绝域
置信水平
1- 接受域
临界值
H0值
样本统计量
观察到的样本统计量
8.1.1 假设检验的思想方法
再考察下面的例子. 【例8.2】一台包装机包装洗衣粉,额定标准重量为500g, 根据以往经验,包装机的实际装袋重量服从正态N(,2), 其中 = 15g通常不会变化
H0 : p 0.03
1 [(1 p)10 10 p(1 p)9 ]
d f ( p) 8 90 p(1 p) 0 dp
当 p 0.03 时,f ( p)单调增加
当 p 0.03 时,
f ( p) P{Y 2; p} 1 [(1 p)10 10 p(1 p)9 ] f (0.03) P{Y 2; 0.03} 0.035 0.05
当样本容量固定时 , 选定后, 数 k 就可以确 x 0 定, 然后按照统计量 Z 的观察值的绝对 / n 值大于等于 k 还是小于 k 来作决定.
x 0 如果 z k , 则称 x 与 0的差异是显著的, / n 则我们拒绝 H 0 ,
x 0 反之, 如果 z k , 则称 x 与 0的差异是 / n 不显著的, 则我们接受 H 0 ,
由于要检验的假设设计总体均值, 故可借助于样本 均值来判断.
因为 X 是 的无偏估计量 ,
所以若 H 0 为真, 则 | x 0 | 不应太大, X 0 当H 0为真时, ~ N (0,1), / n | x 0 | 衡量 | x 0 | 的大小可归结为衡量 的大小, / n
数 称为显著性水平.
上述关于 x 与 0 有无显著差异的判断是 在显 著性水平 之下作出的.
2. 检验统计量
X 0 统计量 Z 称为检验统计量. / n
3. 原假设与备择假设
假设检验问题通常叙述为: 在显著性水平下,
检验假设 H 0 : 0 , H1 : 0 .
或称为“在显著性水平 下, 针对 H1检验 H0” .
H 0称为原假设或零假设 , H1 称为备择假设.
4. 拒绝域与临界点
当检验统计量取某个区域C中的值时, 我们 拒绝原假设H0, 则称区域C为拒绝域, 拒绝域的边 界点称为临界点.
如在前面实例中,
拒绝域为 | z | z / 2 , 临界点为 z z / 2 , z z / 2 .
为检验包装机工作是否正常,随机抽取 9 袋,称得洗衣 粉净重数据如下(单位:g):
497 506 518 524 488 517 510 515 516
问这台包装机工作是否正常? 通过分析知道: 要检验包装机工作是否正常,就是要检验总体均值 = 500是否成立.
8.1.1 假设检验的思想方法
现在我们再次回到包装机包装洗衣粉的问题上
X 0.5 ~N (0,1) 0.015 / 9
为确定常数c,现在我们考虑一个相当小的 正数(理由下面讲).例如 =0.05. 于是,当原假设 H0:μ =0.5 成立时,有:
X 0.5 P k 0.015 / 9
由标准正态分布分位点的定义得
临界值
样本统计量
8.1.1 假设检验的思想方法
(2) 左边检验:H0: 0
由于X~N(, 2)
X ,所以 Z ~ N (0,1) / n
H1: < 0
对于给定的小概率 , 由图8-3知
X P z , / n X X 0 , 当原假设成立时,由于 / n / n X 0 所以 P z , / n 即 X 0 z 是小概率事件. / n
从而 P{Y 2; p} P{Y 2; p} 0.05 故 { Y 2 } 是小概率事件.
4º 作判断
{ Y 2 } 是小 由于在假设 H0成立的条件下,
概率事件, 而实际情况是: 小概率事件竟然 在一次试验中发生了,这违背了小概率原理,
是不合理的,故应该否定原假设H0 ,认为产品 的次品率 p >3% . 所以,这批产品不能出厂.
双侧检验
(显著性水平与拒绝域 )
抽样分布
拒绝域 /2 1-
置信水平 拒绝域 /2 接受域 H0值 样本统计量
临界点为 z z / 2 ,
临界值
临界值
z z / 2 .
下面我们指出这很符合人们的逻辑,实际上 这种思维也叫:
带概ห้องสมุดไป่ตู้性质的反证法
通常的反证法设定一个假设以后,如果出 现的事实与之矛盾,(即如果这个假设是正确的 话,出现一个概率等于0的事件)则绝对地否定假 设.
={ 抽取的10件产品中的次品数 }
3º 在假设 H0成立的条件下,计算
f ( p) P{Y 2; p} Y ~ B(10, p) 1 P{Y 2; p} 1 [ P{Y 0; p} P{Y 1; p}]
0 0 1 1 1 [C10 p (1 p)10 C10 p (1 p)9 ]
装糖重总体 X 的均值和标准差 ,
由长期实践可知, 标准差较稳定, 设 0.015,
则 X ~ N ( , 0.0152 ), 其中 未知.
问题: 根据样本值判断 0.5 还是 0.5 . 提出两个对立假设H 0 : 0 0.5 和 H1 : 0 . 再利用已知样本作出判断是接受假设 H0 ( 拒绝 假设 H1 ) , 还是拒绝假设 H0 (接受假设 H1 ). 如果作出的判断是接受 H0, 则 0 , 即认为机器工作是正常的, 否则, 认为是不正常的.
8.1.1 假设检验的思想方法
根据上例可以看到假设检验的思想方法是:
(1) 提出假设; (2) 在假设成立的条件下构造一个小概率事件; (3) 由样本数据判断小概率事件是否发生了,如果小 概率事件发生了,根据“小概率原理”,作出否定原 假设的推断.
实例 某车间用一台包装机包装葡萄糖, 包得的 袋装糖重是一个随机变量, 它服从正态分布.当 机器正常时, 其均值为0.5千克, 标准差为0.015 千克.某日开工后为检验包装机是否正常, 随机 地抽取它所包装的糖9袋, 称得净重为(千克): 0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512, 问机器是否正常? 分析: 用 和 分别表示这一天袋
x 0 由样本算得 x 0.511, 即有 2.2 1.96, / n
于是拒绝假设H0, 认为包装机工作不正常.
以上所采取的检验法是符合实际推断原理的.
由于通常总是取得很小 , 一般取 0.01, 0.05,
因而当H 0为真, 即 0时, X 0 P z / 2 = / n 是一个小概率事件, 根据实际推断原理, 就可以认为 x 0 如果H 0为真, 由一次试验得到满足不等式 z / 2 / n 的观察值 x , 几乎是不会发生的.
下面结合实例来说明假设检验的基本思想.
例1
某厂有一批产品,共有200件,需检验合
格才能出厂. 按国家标准,次品率不得超 过3%. 今在其中随机地抽取10件,发现
其中有2件次品,问:这批产品能否出厂?
分析:从直观上分析,这批产品不能出厂. 2 因为抽样得到的次品率: 3% 10 然而,由于样本的随机性,如何才能根据抽 样结果判断总体(所有产品)的次品率是否≤3%?
8.1.1 假设检验的思想方法
由于当原假设成立时,
X 0 z / n 是小概率事件,
X 0 因此,仍然可以选择 Z / n
做检验统计量
得到H0的拒绝域为
x 0 z z / n
由于拒绝域在数轴的左端, 故称此检验为左边检验.
§8.1 假设检验的思想方法和基本概念
若对参数 一无所知
若对 参数 有所 了解
用参数估计 的方法处理 但有怀 疑猜测 需要证 实之时
用假设 检验的 方法来 处理
假设检验
参数假设检验 非参数假设检验
总体分布已知, 检验关于未知参数 的某个假设
总体分布未知时的 假设检验问题
例如, 提出总体服从泊松分布的假设;
k z / 2 ,
x 0 x 0 当 z / 2时, 拒绝H 0 , z / 2时, 接受H 0 . / n / n
假设检验过程如下:
在实例中若取定 0.05,
则 k z / 2 z0.025 1.96,
又已知 n 9, 0.015,
洗衣粉净重数据如下:问袋装洗衣粉的平均重量是否大于 500?
497 506 518 524 488 517 510 515 516
在显著水平 = 0.05下做右边检验: H0: 500 H1: > 500 由于H0拒绝域为 z x 0 z 0.05 / n
是小概率事件,
X 0 因此,选择 Z 做检验统计量, / n
得到H0的拒绝域为: x 0 z z / n 由于拒绝域在数轴的右端, 故称此检验为右边检验.
右侧检验
(显著性水平与拒绝域 )
抽样分布
置信水平 拒绝域 1-
接受域
H0值
观察到的样本统计量
X P z / n 当原假设成立时,由于 X X 0 , / n / n
X P k / n
所以
X 0 P z / n
8.1.1 假设检验的思想方法
由于当原假设成立时, X 0 z / n
在一次试验中, 得到了 x 0 满足不等式 z / 2的观察值 x , / n
则我们有理由怀疑原来的假设H0的正确性, 因而拒绝H0 .
若出现观察值 x 满足不等式
x 0
/ n
z / 2 ,
则没有理由拒绝假设H0 , 因而只能接受H0 .
二、假设检验的相关概念
1. 显著性水平
解
用假设检验法,步骤: 1º 提出假设 H0: p 0.03
其中 p为总体的次品率.
抽 取 的 产 品 是 次 品 1, 第i次 2º 设 Xi 0, 否则
则 X i ~ B(1, p)
( i 1, 2, , 10 )
1
令 YX X 1 2 X 0
则 Y ~ B(10, p)
又如, 对于正态总体提出数学 期望等于 0 的 假设等.
假设检验就是根据样本对所提出的假设作出 判断: 是接受, 还是拒绝.
1. 基本原理
0 0.05 小概率推断原理: 小概率事件(概率接近0的事件),
在一次试验中,实际上可认为不 会发生.
2. 基本思想方法
采用概率性质的反证法: 先提出假设H0 , 再根据 一次抽样所得到的样本值进行计算. 若导致小概率 事件发生,则否认假设H0 ; 否则,接受假设H0 .
x 0 当观察值 x 满足 k时, 拒绝假设H 0 , / n x 0 反之, 当观察值 x 满足 k时, 接受假设H 0 . / n
X 0 因为当H 0为真时 Z ~ N (0,1), / n
于是,当原假设 H0:μ =0.5 成立时,有:
带概率性质的反证法的逻辑是: 即如果假设H0是正确的话,出现一个概率很 小的事件,则以很大的把握否定假设H0.
8.1.1 假设检验的思想方法
下面分别推出这两种检验的拒绝域: (1) 右边检验: H0: 0 H1: > 0
对于给定的小概率 , 由图8-2易知
/ n
由于X~N(, 2) ,所以 Z X ~ N (0,1)
左侧检验
(显著性水平与拒绝域 )
抽样分布
拒绝域
置信水平
1- 接受域
临界值
H0值
样本统计量
观察到的样本统计量
8.1.1 假设检验的思想方法
再考察下面的例子. 【例8.2】一台包装机包装洗衣粉,额定标准重量为500g, 根据以往经验,包装机的实际装袋重量服从正态N(,2), 其中 = 15g通常不会变化
H0 : p 0.03
1 [(1 p)10 10 p(1 p)9 ]
d f ( p) 8 90 p(1 p) 0 dp
当 p 0.03 时,f ( p)单调增加
当 p 0.03 时,
f ( p) P{Y 2; p} 1 [(1 p)10 10 p(1 p)9 ] f (0.03) P{Y 2; 0.03} 0.035 0.05
当样本容量固定时 , 选定后, 数 k 就可以确 x 0 定, 然后按照统计量 Z 的观察值的绝对 / n 值大于等于 k 还是小于 k 来作决定.
x 0 如果 z k , 则称 x 与 0的差异是显著的, / n 则我们拒绝 H 0 ,
x 0 反之, 如果 z k , 则称 x 与 0的差异是 / n 不显著的, 则我们接受 H 0 ,
由于要检验的假设设计总体均值, 故可借助于样本 均值来判断.
因为 X 是 的无偏估计量 ,
所以若 H 0 为真, 则 | x 0 | 不应太大, X 0 当H 0为真时, ~ N (0,1), / n | x 0 | 衡量 | x 0 | 的大小可归结为衡量 的大小, / n
数 称为显著性水平.
上述关于 x 与 0 有无显著差异的判断是 在显 著性水平 之下作出的.
2. 检验统计量
X 0 统计量 Z 称为检验统计量. / n
3. 原假设与备择假设
假设检验问题通常叙述为: 在显著性水平下,
检验假设 H 0 : 0 , H1 : 0 .
或称为“在显著性水平 下, 针对 H1检验 H0” .
H 0称为原假设或零假设 , H1 称为备择假设.
4. 拒绝域与临界点
当检验统计量取某个区域C中的值时, 我们 拒绝原假设H0, 则称区域C为拒绝域, 拒绝域的边 界点称为临界点.
如在前面实例中,
拒绝域为 | z | z / 2 , 临界点为 z z / 2 , z z / 2 .
为检验包装机工作是否正常,随机抽取 9 袋,称得洗衣 粉净重数据如下(单位:g):
497 506 518 524 488 517 510 515 516
问这台包装机工作是否正常? 通过分析知道: 要检验包装机工作是否正常,就是要检验总体均值 = 500是否成立.
8.1.1 假设检验的思想方法
现在我们再次回到包装机包装洗衣粉的问题上
X 0.5 ~N (0,1) 0.015 / 9
为确定常数c,现在我们考虑一个相当小的 正数(理由下面讲).例如 =0.05. 于是,当原假设 H0:μ =0.5 成立时,有:
X 0.5 P k 0.015 / 9
由标准正态分布分位点的定义得
临界值
样本统计量
8.1.1 假设检验的思想方法
(2) 左边检验:H0: 0
由于X~N(, 2)
X ,所以 Z ~ N (0,1) / n
H1: < 0
对于给定的小概率 , 由图8-3知
X P z , / n X X 0 , 当原假设成立时,由于 / n / n X 0 所以 P z , / n 即 X 0 z 是小概率事件. / n
从而 P{Y 2; p} P{Y 2; p} 0.05 故 { Y 2 } 是小概率事件.
4º 作判断
{ Y 2 } 是小 由于在假设 H0成立的条件下,
概率事件, 而实际情况是: 小概率事件竟然 在一次试验中发生了,这违背了小概率原理,
是不合理的,故应该否定原假设H0 ,认为产品 的次品率 p >3% . 所以,这批产品不能出厂.
双侧检验
(显著性水平与拒绝域 )
抽样分布
拒绝域 /2 1-
置信水平 拒绝域 /2 接受域 H0值 样本统计量
临界点为 z z / 2 ,
临界值
临界值
z z / 2 .
下面我们指出这很符合人们的逻辑,实际上 这种思维也叫:
带概ห้องสมุดไป่ตู้性质的反证法
通常的反证法设定一个假设以后,如果出 现的事实与之矛盾,(即如果这个假设是正确的 话,出现一个概率等于0的事件)则绝对地否定假 设.
={ 抽取的10件产品中的次品数 }
3º 在假设 H0成立的条件下,计算
f ( p) P{Y 2; p} Y ~ B(10, p) 1 P{Y 2; p} 1 [ P{Y 0; p} P{Y 1; p}]
0 0 1 1 1 [C10 p (1 p)10 C10 p (1 p)9 ]
装糖重总体 X 的均值和标准差 ,
由长期实践可知, 标准差较稳定, 设 0.015,
则 X ~ N ( , 0.0152 ), 其中 未知.
问题: 根据样本值判断 0.5 还是 0.5 . 提出两个对立假设H 0 : 0 0.5 和 H1 : 0 . 再利用已知样本作出判断是接受假设 H0 ( 拒绝 假设 H1 ) , 还是拒绝假设 H0 (接受假设 H1 ). 如果作出的判断是接受 H0, 则 0 , 即认为机器工作是正常的, 否则, 认为是不正常的.
8.1.1 假设检验的思想方法
根据上例可以看到假设检验的思想方法是:
(1) 提出假设; (2) 在假设成立的条件下构造一个小概率事件; (3) 由样本数据判断小概率事件是否发生了,如果小 概率事件发生了,根据“小概率原理”,作出否定原 假设的推断.
实例 某车间用一台包装机包装葡萄糖, 包得的 袋装糖重是一个随机变量, 它服从正态分布.当 机器正常时, 其均值为0.5千克, 标准差为0.015 千克.某日开工后为检验包装机是否正常, 随机 地抽取它所包装的糖9袋, 称得净重为(千克): 0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512, 问机器是否正常? 分析: 用 和 分别表示这一天袋
x 0 由样本算得 x 0.511, 即有 2.2 1.96, / n
于是拒绝假设H0, 认为包装机工作不正常.
以上所采取的检验法是符合实际推断原理的.
由于通常总是取得很小 , 一般取 0.01, 0.05,
因而当H 0为真, 即 0时, X 0 P z / 2 = / n 是一个小概率事件, 根据实际推断原理, 就可以认为 x 0 如果H 0为真, 由一次试验得到满足不等式 z / 2 / n 的观察值 x , 几乎是不会发生的.
下面结合实例来说明假设检验的基本思想.
例1
某厂有一批产品,共有200件,需检验合
格才能出厂. 按国家标准,次品率不得超 过3%. 今在其中随机地抽取10件,发现
其中有2件次品,问:这批产品能否出厂?
分析:从直观上分析,这批产品不能出厂. 2 因为抽样得到的次品率: 3% 10 然而,由于样本的随机性,如何才能根据抽 样结果判断总体(所有产品)的次品率是否≤3%?
8.1.1 假设检验的思想方法
由于当原假设成立时,
X 0 z / n 是小概率事件,
X 0 因此,仍然可以选择 Z / n
做检验统计量
得到H0的拒绝域为
x 0 z z / n
由于拒绝域在数轴的左端, 故称此检验为左边检验.
§8.1 假设检验的思想方法和基本概念
若对参数 一无所知
若对 参数 有所 了解
用参数估计 的方法处理 但有怀 疑猜测 需要证 实之时
用假设 检验的 方法来 处理
假设检验
参数假设检验 非参数假设检验
总体分布已知, 检验关于未知参数 的某个假设
总体分布未知时的 假设检验问题
例如, 提出总体服从泊松分布的假设;
k z / 2 ,
x 0 x 0 当 z / 2时, 拒绝H 0 , z / 2时, 接受H 0 . / n / n
假设检验过程如下:
在实例中若取定 0.05,
则 k z / 2 z0.025 1.96,
又已知 n 9, 0.015,
洗衣粉净重数据如下:问袋装洗衣粉的平均重量是否大于 500?
497 506 518 524 488 517 510 515 516
在显著水平 = 0.05下做右边检验: H0: 500 H1: > 500 由于H0拒绝域为 z x 0 z 0.05 / n
是小概率事件,
X 0 因此,选择 Z 做检验统计量, / n
得到H0的拒绝域为: x 0 z z / n 由于拒绝域在数轴的右端, 故称此检验为右边检验.
右侧检验
(显著性水平与拒绝域 )
抽样分布
置信水平 拒绝域 1-
接受域
H0值
观察到的样本统计量
X P z / n 当原假设成立时,由于 X X 0 , / n / n
X P k / n
所以
X 0 P z / n
8.1.1 假设检验的思想方法
由于当原假设成立时, X 0 z / n
在一次试验中, 得到了 x 0 满足不等式 z / 2的观察值 x , / n
则我们有理由怀疑原来的假设H0的正确性, 因而拒绝H0 .
若出现观察值 x 满足不等式
x 0
/ n
z / 2 ,
则没有理由拒绝假设H0 , 因而只能接受H0 .
二、假设检验的相关概念
1. 显著性水平
解
用假设检验法,步骤: 1º 提出假设 H0: p 0.03
其中 p为总体的次品率.
抽 取 的 产 品 是 次 品 1, 第i次 2º 设 Xi 0, 否则
则 X i ~ B(1, p)
( i 1, 2, , 10 )
1
令 YX X 1 2 X 0
则 Y ~ B(10, p)
又如, 对于正态总体提出数学 期望等于 0 的 假设等.
假设检验就是根据样本对所提出的假设作出 判断: 是接受, 还是拒绝.
1. 基本原理
0 0.05 小概率推断原理: 小概率事件(概率接近0的事件),
在一次试验中,实际上可认为不 会发生.
2. 基本思想方法
采用概率性质的反证法: 先提出假设H0 , 再根据 一次抽样所得到的样本值进行计算. 若导致小概率 事件发生,则否认假设H0 ; 否则,接受假设H0 .