应用统计学 第 6 章 假设检验
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多大的P 值合适?
显著性检验的目的是要描述样本所提供不利于原假 设的证据有多强。P值就在做这件事。但是,要证明 原假设不正确,P值要多小,才能令人信服呢?这要 根据两种情况来确定 • • 原假设的可信度有多高?如果H0 所代表的假设 是人们多年来一直相信的,就需要很强的证据 (小的P值)才能说服他们 拒绝的结论是什么?如果拒绝H0而肯定H1 ,就 需要有很强的证据显示要支持H1 。比如,H1 代 表要花很多钱把产品包装改换成另一种包装,你 就要有很强的证据显示新包装一定会增加销售量 (因为拒绝H0要花很高的成本)
6. 用Excel进行检验
6.1
6.1.1 6.1.2 6.1.3 6.1.4
假设检验的基本问题
假设的陈述 两类错误与显著性水平 统计量与拒绝域 利用P值进行决策
假设的陈述
什么是假设? (hypothesis)
• 对总体参数的具体
数值所作的陈述 – 总体参数包括总体 均值、比例、方差 等 – 分析之前必须陈述
H0 : 30%
H1 : 30%
提出假设 (结论与建议)
1. 原假设和备择假设是一个完备事件组,而 且相互对立
– 在一项假设检验中,原假设和备择假设必 有一个成立,而且只有一个成立
2. 先确定备择假设,再确定原假设
3. 等号“=‖总是放在原假设上
4. 因研究目的不同,对同一问题可能提出不 同的假设(也可能得出不同的结论)
– 原假设为正确时拒绝原假设 – 第Ⅰ类错误的概率记为
• 被称为显著性水平
• 2. 第Ⅱ类错误(取伪错误)
– 原假设为错误时未拒绝原假设 – 第Ⅱ类错误的概率记为(Beta)
假设检验中的两类错误 (决策结果)
H0: 无罪
假设检验就好像一场审判过程
统计检验过程
陪审团审判 实际情况 裁决
H0 检验 实际情况
检验统计量 (test statistic)
1. 根据样本观测结果计算得到的,并据以对原 假设和备择假设作出决策的某个样本统计量
2. 对样本估计量的标准化结果
–
–
原假设H0为真
点估计量的抽样分布
点估计量—假设值 标准化检验统计量 点估计量的抽样标准差
3. 标准化的检验统计量
显著性水平和拒绝域 (双侧检验 )
1-
临界值
H0
样本统计量
显著性水平和拒绝域 (左侧检验 )
抽样分布
拒绝H0 置信水平
1-
临界值
H0
样本统计量
显著性水平和拒绝域 (右侧检验 )
抽样分布
置信水平 拒绝H0 1-
H0 样本统计量
临界值
显著性水平和拒绝域 (右侧检验 )
抽样分布
置信水平 拒绝H0
1-
H0
临界值 样本统计量
两类错误的控制
1. 一般来说,对于一个给定的样本,如果犯第Ι 类错误的代价比犯第Ⅱ类错误的代价相对较 高,则将犯第Ⅰ类错误的概率定得低些较为 合理;反之,如果犯第Ι类错误的代价比犯第 Ⅱ类错误的代价相对较低,则将犯第Ⅰ类错 误的概率定得高些 2. 一般来说,发生哪一类错误的后果更为严重, 就应该首要控制哪类错误发生的概率。但由 于犯第Ι类错误的概率是可以由研究者控制的, 因此在假设检验中,人们往往先控制第Ι类错 误的发生概率
备择假设 (alternative hypothesis)
1. 也称“研究假设” 2. 总是有符号 , 或
3. 表示为 H1
4. 研究者想收集证据予以支持的假设
– –
H1 : <某一数值,或 某一数值 例如, H1 : < 10cm,或 10cm
提出假设 (例题分析)
【例】一种零件的生产标准是直径应为10cm,为对生产 过程进行控制,质量监测人员定期对一台加工机床 检查,确定这台机床生产的零件是否符合标准要求。 如果零件的平均直径大于或小于10cm,则表明生产 过程不正常,必须进行调整。试陈述用来检验生产 过程是否正常的原假设和备择假设 解:研究者想收集证据予以证明的假设 应该是“生产过程不正常”。建立的原 假设和备择假设为:
绿叶 洗涤 剂
H0 : 500
H1 : < 500
500g
提出假设 (例题分析)
【例】一家研究机构估计,某城市中家庭拥有汽车的比 例超过30%。为验证这一估计是否正确,该研究机 构随机抽取了一个样本进行检验。试陈述用于检验 的原假设与备择假设 解:研究者想收集证据予以支持的假设是“ 该城市中家庭拥有汽车的比例超过30%‖。建 立的原假设和备择假设为
双侧检验的P 值
/2
拒绝H0
1/2 P 值
/2
拒绝H0
1/2 P 值
临界值
计算出的样本统计量
0
临界值
Z
计算出的样本统计量
左侧检验的P 值
抽样分布
拒绝H0
置信水平
1-
P值
临界值 计算出的样本统计量
0
样本统计量
右侧检验的P 值
抽样分布
置信水平 拒绝H0 1-
P值
0
临界值
计算出的样本统计量
... 因此我们拒 绝假设 = 50
... 如果这是总 体的假设均值 20
= 50 H0
样本均值
假设检验的过程
提出假设 作出决策
拒绝假设 别无选择!
我认为人口的平 均年龄是50岁
总体
抽取随机样本
均值 x = 20
原假设与备择假设
原假设 (null hypothesis) 1. 2. 3. 4. 研究者想收集证据予以反对的假设 又称“0假设” 总是有符号 , 或 表示为 H0
3.
可解释为正确地拒绝一个错误的原假设的概率
显著性水平 (significant level)
• 1. 是一个概率值 • 2. 原假设为真时,拒绝原假设的概率 – 抽样分布的拒绝域 • 3. 表示为 (alpha) – 常用的 值有0.01, 0.05, 0.10 • 4. 由研究者事先确定
第6章 假设检验
假设检验在统计方法中的地位
统计方法
描述统计 推断统计
参数估计
假设检验
学习内容
6.1 6.2 6.3 假设检验的基本问题 一个总体参数的检验 两个总体参数的检验
学习目标
1. 假设检验的基本思想和原理
2. 假设检验的步骤 3. 一个总体参数的检验 4. 两个总体参数的检验
5. P值的计算与应用
/2
临界值
H0
临界值 样本统计量
显著性水平和拒绝域 (双侧检验 )
抽样分布
拒绝H0
置信水平
拒绝H0 1-
/2
/2
临界值 样本统计量
H0
临界值
ห้องสมุดไป่ตู้
显著性水平和拒绝域 (单侧检验 )
抽样分布
拒绝域
置信水平
拒绝H0
1-
非拒绝域
临界值
H0
显著性水平和拒绝域 (左侧检验 )
抽样分布
拒绝H0 置信水平
什么是P 值? (P-value)
1. 如果原假设为真,所得到的样本结果会像实 际观测结果那么极端或更极端的概率 • P值告诉我们:如果原假设是正确的话, 我们得到得到目前这个样本数据的可能性 有多大,如果这个可能性很小,就应该拒 绝原假设 2. 被称为观察到的(或实测的)显著性水平 3. 决策规则:若p值<, 拒绝 H0
H0 : 10cm
H1 : 10cm
提出假设 (例题分析)
【例】某品牌洗涤剂在它的产品说明书中声称:平均 净含量不少于500g。从消费者的利益出发,有关 研究人员要通过抽检其中的一批产品来验证该产 品制造商的说明是否属实。试陈述用于检验的原 假设与备择假设 解:研究者抽检的意图是倾向于证实这 种洗涤剂的平均净含量并不符合说明书 中的陈述 。建立的原假设和备择假设为
显著性水平 (significant level)
1. 我们可以在事先确定用于拒绝原假设H0 的证 据必须强到何种程度。这等于说我们要求多 小的 P 值。而这个 P 值就叫显著性水平,用 表示 – 显著性水平表示总体中某一类数据出现的经常
–
程度 假如我们选择=0.05,样本数据能拒绝原假设 的证据要强到:当H0正确时,这种样本结果发 生的频率不超过5%;如果我们选择=0.01,就 是要求拒绝H0的证据要更强,这种样本结果发 生的频率只有1%
到的;不拒绝原假设(拒绝原假设的证据不充分) , 则表示这样的样本结果只是偶然得到的
假设检验中的小概率原理 • 什么小概率? • 1. 在一次试验中,一个几乎不可能发 生的事件发生的概率 • 2.在一次试验中小概率事件一旦发生, 我们就有理由拒绝原假设 • 3. 小概率由研究者事先确定
统计量与拒绝域
影响 错误的因素
• 1. 总体参数的真值
– 随着假设的总体参数的减少而增大
• 2. 显著性水平
当 减少时增大
• 3. 总体标准差
当 增大时增大
• 4. 样本容量 n
–当 n 减少时增大
检验能力 (power of test)
1.
2.
拒绝一个错误的原假设的能力
根据 的定义, 是指没有拒绝一个错误的原假设 的概率。这也就是说,1- 则是指拒绝一个错误的 原假设的概率,这个概率被称为检验能力,也被称 为检验的势或检验的功效(power)
双侧检验与单侧检验 (假设的形式)
以总体均值的检验为例
假设
原假设
双侧检验
H0 : =0
单侧检验
左侧检验
H0 : 0
右侧检验
H0 : 0
备择假设
H1 : ≠0
H1 : <0
H1 : >0
两类错误与显著性水平
假设检验中的两类错误 • 1. 第Ⅰ类错误(弃真错误)
双侧检验与单侧检验
双侧检验与单侧检验
1. 备择假设没有特定的方向性,并含有符号 “”的假设检验,称为双侧检验或双尾检 验(two-tailed test) 2. 备择假设具有特定的方向性,并含有符号 “>‖或“<‖的假设检验,称为单侧检验或单 尾检验(one-tailed test) – 备择假设的方向为“<‖,称为左侧检验 – 备择假设的方向为“>‖,称为右侧检验
决策规则
1. 给定显著性水平,查表得出相应的临界值z 或z/2, t或t/2 2. 将检验统计量的值与 水平的临界值进行比较 3. 作出决策
– – – 双侧检验:|统计量| > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0
利用 P 值 进行决策
–
– –
H0 : = 某一数值 指定为符号 =, 或 例如, H0 : 10cm
为什么叫 0 假设?
之所以用零来修饰原假设,其原因是原假设的 内容总是表示没有差异或没有改变,或变量间 没有关系等等 零假设总是一个与总体参数有关的问题,所以 总是用希腊字母表示。关于样本统计量如样本 均值或样本均值之差的零假设是没有意义的, 因为样本统计量是已知的,当然能说出它们等 于几或是否相等
我认为这种新药的疗效 比原有的药物更有效!
什么是假设检验? (hypothesis test)
1. 先对总体的参数(或分布形式)提出某种假 设,然后利用样本信息判断假设是否成立 的过程 2. 有参数检验和非参数检验 3. 逻辑上运用反证法,统计上依据小概率原 理
假设检验的基本思想
抽样分布
这个值不像我 们应该得到的 样本均值 ...
无罪
无罪 有罪 正确 错误
有罪
错误 正确
决策 H0为真
未拒绝H0 拒绝H0
H0为假
正确决策 第Ⅱ类错 误() (1 – )
第Ⅰ类错 正确决策 误() (1-)
错误和 错误的关系
和 的关系就像 翘翘板,小 就 大, 大 就小
你要同时减少两类 错误的惟一办法是 增加样本容量!
抽样分布
拒绝域
置信水平
拒绝域
拒绝H0
拒绝H0 1-
非拒绝域
/2
/2
临界值
H0
临界值
显著性水平和拒绝域 (双侧检验 )
抽样分布
拒绝H0 置信水平 拒绝H0 1-
/2
/2
临界值 样本统计量
H0
临界值
显著性水平和拒绝域 (双侧检验 )
抽样分布
拒绝H0 置信水平 拒绝H0 1-
/2
2. 如果 P 值小于或等于 ,我们称该组数据不 利于原假设的证据有的显著性水平
统计显著性 (significant)
1. significant(显著的)一词的意义在这里并不是 “重要的”,而是指“非偶然的” 2. 在假设检验中,如果样本提供的证据拒绝原假 设,我们说检验的结果是显著的,如果不拒绝 原假设,我们则说结果是不显著的 3. 一项检验在统计上是“显著的”,意思是指: 这样的(样本)结果不是偶然得到的,或者说, 不是靠机遇能够得到的 – 拒绝原假设,表示这样的样本结果并不是偶然得