第二章 假设检验基本问题(1)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

检验统计量
(test statistic) statistic)
1. 根据样本观测结果计算得到的,并据以对原 根据样本观测结果计算得到的, 假设和备择假设作出决策的某个样本统计量 2. 对样本估计量的标准化结果
原假设H 原假设H0为真 点估计量的抽样分布
3. 标准化的检验统计量
点估计量—假设值 标准化检验统计量= 点估计量的抽样标准差
α
β
假设检验中的两类错误
(决策结果) 决策结果)
H0: 无罪
假设检验就好像一场审判过程 统计检验过程
陪审团审判 实际情况 裁决 无罪 无罪 有罪 正确 错误 有罪 错误 正确 未拒绝H 未拒绝H0 拒绝H 拒绝H0 决策
H0 检验 实际情况 H0为真 H0为假
正确决策 第Ⅱ类错 误(β ) (1 – α) 第Ⅰ类错 正确决策 误(α ) (1(1-β )
临界值
0
样本统计量
显著性水平和拒绝域
(左侧检验 )
抽样分布
拒绝H 拒绝H0 置信水平
α
1-α
临界值
0
样本统计量 观察到的样本统计量
显著性水平和拒绝域
(左侧检验 )
抽样分布
拒绝H 拒绝H0 置信水平
α
1-α
临界值
0
样本统计量
显著性水平和拒绝域
(右侧检验 )
抽样分布
置信水平 拒绝H 拒绝H0 1-α
解 : 研究者想收集证据予以证明的 假设应该是“ 生产过程不正常” 假设应该是 “ 生产过程不正常 ” 。 建立的原假设和备择假设为 H0 : = 10cm 10cm H1 : ≠ 10cm 10cm
提出假设
(例题分析) 例题分析)
【 例 】 某品牌洗涤剂在它的产品说明书中声称:平 均净含量不少于500克 从消费者的利益出发, 均净含量不少于500克。从消费者的利益出发, 有关研究人员要通过抽检其中的一批产品来验 证该产品制造商的说明是否属实。 证该产品制造商的说明是否属实 。 试陈述用于 检验的原假设与备择假设 解 : 研究者抽检的意图是倾向于 证实这种洗涤剂的平均净含量并 不符合说明书中的陈述 。建立的 原假设和备择假设为 H0 : ≥ 500 H1 : < 500
双侧检验的P 双侧检验的P 值
α /2
拒绝H 拒绝H0
1/2 P 值
α /2
拒绝H 拒绝H0
1/2 P 值
临界值
计算出的样本统计量
0
临界值
Z
计算出的样本统计量
左侧检验的P 左侧检验的P 值
抽样分布
拒绝H 拒绝H0 置信水平
α
1-α
P值
临界值 计算出的样本统计量
0
样本统计量
右侧检验的P 右侧检验的P 值
4.由研究者事先确定 4.由研究者事先确定
假设检验中的小概率原理
什么小概率? 什么小概率? 1. 在一次试验中,一个几乎不可能发生的事 在一次试验中, 件发生的概率 2. 在一次试验中小概率事件一旦发生,我们 在一次试验中小概率事件一旦发生, 就有理由拒绝原假设 3. 小概率由研究者事先确定
检验统计量与拒绝域
备择假设
(alternative hypothesis)
1. 研究者想收集证据予以支持的假设 研究者想收集证据予以支持的假设 2. 也称“研究假设” 也称“研究假设” 3. 总是有符号 ≠, < 或 > 4. 表示为 H1 或Ha
H1 : <某一数值,或 >某一数值 某一数值, 例如, 例如, H1 : < 10cm,或 >10cm 10cm, 10cm
α 错误和 β 错误的关系
α和β 的关系就像 翘翘板, 翘翘板,α小β 就 大, α大β 就小
你不能同时减 少两类错误! 少两类错误
β α
影响 β 错误的因素
1. 总体参数的真值
随着假设的总体参数的减少而增大
2. 显著性水平 α
当 α 减少时增大
3. 总体标准差 σ
当 σ 增大时增大
4. 样本容量 n
的假设(也可能得出不同的结论) 的假设(也可能得出不同的结论)
双侧检验与单侧检验
双侧检验与单侧检验
1. 备择假设没有特定的方向性,并含有符号
“≠”的假设检验,称为双侧检验或双尾检 验(two-tailed test) (two2. 备择假设具有特定的方向性,并含有符号 “>”或“<”的假设检验,称为单侧检验或 >”或“<”的假设检验,称为单侧检验或 单尾检验(one单尾检验(one-tailed test)
显著性水平和拒绝域
(双侧检验 )
抽样分布
拒绝H 拒绝H0 置信水平 拒绝H 拒绝H0 1-α
α/2
α/2
临界值
0
临界值
样本统计量
显著性水平和拒绝域
(双侧检验 )
抽样分布
拒绝H 拒绝H0 置信水平 拒绝H 拒绝H0 1-α
α /2
α /2
临界值
0
临界值
样本统计量
显著性水平和拒绝域
(双侧检验 )
抽样分布
利用 P 值 进行决策
什么是P 什么是P 值?
(P-value)
1. 在原假设为真的条件下,检验统计量的观察 值大于或等于其计算值的概率
双侧检验为分布中两侧面积的总和
2. 反映实际观测到的数据与原假设H0之间不一 反映实际观测到的数据与原假设H 致的程度 3. 被称为观察到的(或实测的)显著性水平 被称为观察到的(或实测的) 4. 决策规则:若p值≤ α, 拒绝 H0
(hypothesis) hypothesis) 对总体参数的具体数 值所作的陈述
总体参数包括总体均值 总体参数包括总体均值、 总体均值、 比率、方差等 比率、方差等 分析之前 分析之前必须陈述 之前必须陈述
我认为这种新药的疗效 比原有的药物更有效! 比原有的药物更有效!
什么是假设检验? 什么是假设检验?
拒绝H 拒绝H0 置信水平 拒绝H 拒绝H0 1-α
α /2
α /2
临界值
0
临界值
样本统计量
显著性水平和拒绝域
(双侧检验 )
抽样分布
拒绝H 拒绝H0 置信水平 拒绝H 拒绝H0 1-α
α /2
α /2
临界值
0
临界值
样本统计量
显著性水平和拒绝域
(单侧检验 )
抽样分布
拒绝H 拒绝H0 置信水平
α
1-α
H1 : < 0 H1 : > 0
两类错误与显著性水平
假设检验中的两类错误
1. 第Ⅰ类错误(弃真错误) 类错误(弃真错误)
原假设为真时拒绝原假设 第Ⅰ类错误的概率记为α
被称为显著性水平
2. 第Ⅱ类错误(取伪错误) 类错误(取伪错误)
原假设为假时未拒绝原假设 第Ⅱ类错误的概率记为 β (Beta)
500g
提出假设
(例题分析) 例题分析)
【 例 】 一家研究机构估计, 某城市中家庭拥有汽车 一家研究机构估计, 的比率超过30% 为验证这一估计是否正确, 的比率超过 30% 。 为验证这一估计是否正确 , 该研究机构随机抽取了一个样本进行检验。 该研究机构随机抽取了一个样本进行检验 。 试 陈述用于检验的原假设与备择假设 解:研究者想收集证据予以支持的假 设是“该城市中家庭拥有汽车的比率 超过30%” 超过30%”。建立的原假设和备择假设 为 H0 : ≤ 30% H1 : > 30%
提出假设
(结论与建议) 结论与建议)
1. 原假设和备择假设是一个完备事件组,而且 原假设和备择假设是一个完备事件组,
相互wenku.baidu.com立
在一项假设检验中, 在一项假设检验中, 原假设和备择假设必有一 个成立, 个成立,而且只有一个成立
2. 先确定备择假设,再确定原假设 先确定备择假设, 3. 等号“=”总是放在原假设上 等号“ 4. 因研究目的不同,对同一问题可能提出不同 因研究目的不同,
均值 x = 20
原假设与备择假设
原假设
(null hypothesis) 1. 2. 3. 4. 研究者想收集证据予以反对的假设 又称“0 又称“0假设” 总是有符号 =, ≤ 或 ≥ 表示为 H0
H0 : = 某一数值 指定为符号 =,≤ 或 ≥ 例如, 例如, H0 : = 10cm
第 二章 假设检验的基本问题
一、假设的陈述 二、两类错误与显著性水平 三、统计量与拒绝域 利用P 四、利用P值进行决策
假设检验在统计方法中的地位
统计方法
描述统计 推断统计
参数估计
假设检验
学习目标
1. 假设检验的基本思想和原理 2. 假设检验的步骤 3. P值的计算与应用
假设的陈述
什么是假设? 什么是假设?
抽样分布
置信水平 拒绝H 拒绝H0 1-α
α
P值
0
临界值 计算出的样本统计量
假设检验步骤的总结
1. 陈述原假设和备择假设 2. 从所研究的总体中抽出一个随机样本 3. 确定一个适当的检验统计量,并利用样本数据 确定一个适当的检验统计量, 算出其具体数值 4. 确定一个适当的显著性水平,并计算出其临界 确定一个适当的显著性水平, 值,指定拒绝域 5. 将统计量的值与临界值进行比较,作出决策 将统计量的值与临界值进行比较,
备择假设的方向为“< 备择假设的方向为“<”,称为左(下)侧检验 备择假设的方向为“> 备择假设的方向为“>”,称为右(上)侧检

双侧检验与单侧检验
(假设的形式) 假设的形式)
单侧检验 左侧检验
H0 : ≥ 0
假设
原假设 备择假设
双侧检验
H0 : = 0 H1 : ≠0
右侧检验
H0 : ≤ 0
当 n 减少时增大
显著性水平α
(significant level) level)
1.是一个概率值 1.是一个概率值 2.原假设为真时,拒绝原假设的概率 2.原假设为真时,拒绝原假设的概率
被称为抽样分布的拒绝域
3.表示为 α (alpha) 3.表示为
常用的 α 值有0.01, 0.05, 0.10 值有0.01,
抽样分布
这个值不像我 们应该得到的 样本均值 ... ... 因此我们拒 绝假设 = 50
... 如果这是总 体的假设均值 20
= 50 H0
样本均值
假设检验的过程
提出假设 作出决策
拒绝假设 别无选择! 别无选择
总体
我认为人口的平 均年龄是50 50岁 均年龄是50岁
抽取随机样本
统计量的值落在拒绝域,拒绝H 否则不拒绝H 统计量的值落在拒绝域,拒绝H0,否则不拒绝H0 也可以直接利用P 也可以直接利用P值作出决策
结 束

提出假设
(例题分析) 例题分析)
【例】一种零件的生产标准是直径应为10cm,为对生 一种零件的生产标准是直径应为10cm, 产过程进行控制, 产过程进行控制,质量监测人员定期对一台加工机 床检查, 床检查,确定这台机床生产的零件是否符合标准要 求 。 如果零件的平均直径大于或小于10cm, 则表 如果零件的平均直径大于或小于10cm, 10cm 明生产过程不正常,必须进行调整。 明生产过程不正常,必须进行调整。试陈述用来检 验生产过程是否正常的原假设和被择假设
(hypothesis test) test) 1. 先对总体的参数(或分布形式)提出某种假 先对总体的参数(或分布形式) 设 , 然后利用样本信息判断假设是否成 立的过程 2. 有参数检验和非参数检验 有参数检验和非 3. 逻辑上运用反证法 , 统计上依据小概率 逻辑上运用反证法, 原理
假设检验的基本思想
α
0 观察到的样本统计量
样本统计量 临界值
显著性水平和拒绝域
(右侧检验 )
抽样分布
置信水平 拒绝H 拒绝H0 1-α
α
0
临界值
样本统计量
决策规则
1. 给定显著性水平α,查表得出相应的临界 值zα或zα/2, tα或tα/2 2. 将检验统计量的值与α 水平的临界值进 行比较 3. 作出决策
双侧检验:I统计量I 临界值,拒绝H 双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 临界值,拒绝H 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 临界值,拒绝H 右侧检验:统计量 > 临界值,拒绝H0
相关文档
最新文档