统计学__假设检验(第五章)_(1)_2
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样分布 拒绝H0
Region of Rejection
√
置信水平 拒绝H0
/2
1-
Region of Non rejection
Region of Rejection
/2
临界值
H0
临界值
观察到的样本统计量
双侧检验:
抽样分布 拒绝H0
Region of Rejection
×
置信水平 拒绝H0
一、假设检验的基本原理
1. 假设检验(hypothesis test)
1° 先对总体参数(或分布形式)提出某种假设,再利用样
本信息判断假设是否成立 2°参数检验——总体的分布形式已知; 非参数检验 3°逻辑上运用反证法,统计上依据小概率原理! 小概率是在一次试验中,一个几乎不可能发生的事 件发生的概率; 在一次试验中小概率事件一旦发生,我们就有理由
根据样本数据,计算的平均值为36.8oC,标准差为0.36oC 根据参数估计方法,健康成年人平均体温的95%的置信区 间为(36.7,36.9) 研究人员发现这个区间内并没有包括37oC! 因此,提出了“不应该再把37oC作为正常人体温的一个 有任何特定意义的概念”
我们应该放弃“正常人的平均体温是37oC”这个共识吗?
建立在样本信息的基础之上,而样本又是随机的,因而 就有可能犯错误; 原假设和备择假设不能同时成立,决策的结果要么 拒绝H0 ,要么不拒绝H0 。决策时总是希望当原假设正确
时,没有拒绝它;当原假设不正确时拒绝它,但实际上
很难保证不犯错误
是针对原假设 H0 说的!
假设检验中的两类错误(决策结果)
假设检验就好像 一场审判过程 统计检验过程
37.1 36.9 37.6 36.1 37.1 37.0 36.6 36.1 36.7 36.8 36.9 36.6 36.7 37.1 36.2 36.7 37.2 37.1 37.2 37.0 36.9 36.2 37.3 36.6 36.3 36.9 36.4 37.0 36.3 37.0 37.1 36.7 36.9 36.5 37.5 37.0 36.6 36.6 37.1 36.1 36.4 36.9 36.4 36.7 36.9 37.1 37.3 36.9 36.7 37.0
床生产的零件是否符合标准要求。若零件的平均直径大于或
小于10cm,则表明生产过程不正常,必须进行调整。试陈述 用来检验生产过程是否正常的原假设和备择假设。
解:研究者想收集证据予以证明的假设应该是“生产过程不
正常”。建立的原假设和备择假设为:
H0 : 10cm
H1 : 10cm
双侧检验:
/2
临界值
H0
临界值
观察到的样本统计量
【例2】某品牌洗涤剂在它的产品说明书中声称:平均净含
量不少于500克,从消费者的利益出发,有关研究人员 要通过抽检其中的一批产品来验证该产品制造商的说明
是否属实。试陈述用于检验的原假设与备择假设。
解: 研究者抽检的意图是倾向于证实这种洗涤剂的平均
净含量并不符合说明书中的陈述。
建立的原假设和备择假设为:
H0 : 500
H1 : < 500
左侧检验:
抽样分布
Region of Rejection
√
置信水平
拒绝H0
1-
Region of Non rejection
临界值
H0
观察到的样本统计量
左侧检验:
抽样分布
Region of Rejection
×
置信水平
第五章 假设检验 ۩ ۩ 假设检验的基本原理 假设检验的步骤
۩
۩
一个总体参数的检验
利用p 值进行假设检验
总体参数
推断估计
抽样分布
参数估计
随机原则
统计量
假设检验
检验
假设检验在统计方法中的地位:
统计方法
描述统计法 推断统计法
参数估计
假设检验
正常人的平均体温是37oC吗?
当问起健康的成年人体温是多少时,多数人的回 答是37oC!这似乎已经成了一种共识……以下是一 位研究人员测量的50个健康成年人的体温数据。
是否属实。试陈述用于检验的原假设与备择假设。
解: 研究者抽检的意图是倾向于证实这种洗涤剂的平均
净含量并不符合说明书中的陈述。
建立的原假设和备择假设为:
H0 : 500
H1 : < 500
<提出假设>
【例3】一家研究机构估计,某城市中家庭拥有汽车的比例超 过30%。为验证这一估计是否正确,该研究机构随机抽取 了一个样本进行检验。试陈述用于检验的原假设与备择 假设。
计量,现代检验中人们直接使用由统计量
算出的犯第一类错误的概率,即所谓的 P
2. 确定适当的检验统计量
1°用于假设检验问题的统计量
2°选择统计量的方法与参数估计相同,需考虑:
是大样本 or 小样本 总体方差已知 or 未知
3. 规定显著性水平(significant level)
1°是一个概率值
2°原假设为真时,拒绝原假设的概率
<抽样分布的拒绝域>
3°表示为
常用的 值有0.01,0.05,0.10
拒绝H0
1-
Region of Non rejection
临界值
H0
观察到的样本统计量
【例3】一家研究机构估计,某城市中家庭拥有汽车的比例超 过30%。为验证这一估计是否正确,该研究机构随机抽取 了一个样本进行检验。试陈述用于检验的原假设与备择 假设。
解:研究者想收集证据予以支持的假设是“该城市中家庭拥
抽取随机样本
X = 20
均值
二、假设检验的步骤
1. 提出原假设和备择假设 2. 确定适当的检验统计量 3. 规定显著性水平 4. 计算检验统计量的值 5. 作出统计决策
1. 提出假设
1°原假设(null hypothesis)
研究者收集证据,指的是待检验的假设,用H0表示
统计学涵义是指参数没有变化或变量之间没有关系 起初被假设是成立的,后面根据样本数据确定是否 有足够的证据拒绝它 总是有符号 , ,
解:研究者想收集证据予以证明的假设应该是“生产过程不
正常”。建立的原假设和备择假设为:
H0 : 10cm
H1 : 10cm
<提出假设>
【例2】某品牌洗涤剂在它的产品说明书中声称:平均净含
量不少于500克,从消费者的利益出发,有关研究人员 要通过抽检其中的一批产品来验证该产品制造商的说明
H1 : 某一数值 H1 : 某一数值 H1 : < 某一数值
<提出假设>
【例1】一种零件的生产标准直径为10cm,为对生产过程进行控 制,质量监测人员定期对一台加工机床检查,来确定这台机 床生产的零件是否符合标准要求。若零件的平均直径大于或 小于10cm,则表明生产过程不正常,必须进行调整。试陈述 用来检验生产过程是否正常的原假设和备择假设。
H0 :无罪
陪审团审判 裁决 无罪 有罪 实际情况 无罪 正确 错误 有罪 错误 正确 接受H0 拒绝H0
放过坏人
H0 检验
决策
实际情况 H0为真 H0为假
正确决策 第二类错 误() 1– 第一类错 正确决策 误() (1-)
冤枉好人
两类错误的控制:
对于一个给定的样本,如果犯第一类错误的代价比犯
H0 : = 某一数值
H0 : 某一数值 H0 : 某一数值
2°备择假设(alternative hypothesis)
也称“研究假设”,研究者想收集证据予以支持的假 设,通常用 H1 表示 <与原假设对立> 统计学涵义是指总体参数发生了变化或变量之间有某 种关系
备择假设用于表达研究者自己倾向于支持的看法,然 后收集证据拒绝原假设,以支持备择假设 总是有符号 , ,
拒绝原假设
2. 假设检验的基本思想
抽样分布
这个值不像我们应 该得到的样本均值 ...
因此,我们 拒绝假设 =50!
如果这是总体 的真实均值
20
= 50 H0
样本均值
3.假设检验的过程(提出假设→抽取样本→作出决策)
提出假设
我认为人口的 平均年龄是50岁
总体
作出决策
拒绝假设!
4. 检验统计量(test statistic)的计算
1°根据样本观测结果,计算出对原假设和备择假设做出 决策的某个样本统计量 2°对样本估计量的标准化结果
原假设H0为真
点估计量的抽样分布
3°检验统计量的基本形式为(以正态分布为例): x 0 z n
5. 作出统计决策
1°根据给定的显著性水平,查表得出相应的临界 值Z或Z/2 , tα 或 tα/2 2°将检验统计量的值与 水平的临界值进行比较 3°得出接受或拒绝原假设的结论
第二类错误的代价相对较高,则将犯第Ⅰ类错误的概率定 得低些较为合理;反之,则将犯第Ⅰ类错误的概率定得高 些; 一般来说,发生哪一类错误的后果更为严重,就应该
首要控制哪类错误发生的概率。由于犯第一类错误的概率
是可以由研究者控制的,因此在假设检验中,人们往往先 控制第一类错误的发生概率
错误和 错误的关系:
/2
1-
Region of Non rejection
Region of Rejection
/2
临界值
H0
临界值
观察到的样本统计量
双侧检验:
抽样分布 拒绝H0
Region of Rejection
×
置信水平 拒绝H0
/2
1-
Region of Non rejection
Region of Rejection
和的关系就 像翘翘板,小就 大, 大就小
你不能同时减少 两类错误!
两类错误与显著性水平:
显著 水平 与 两类 错误
生活中如何避免——弃 真错误控制得小一些!
第一类错误:弃真(显著水平α)
P{拒绝H 0 H 0为真}
第二类错误:取伪
P{接受H 0 H 0不真}
传统上,做出决策所依据的是样本统
右侧检验:统计量 > 临界值,拒绝H0
(2)假设检验中的两类错误
第一类错误(弃真错误)
原假设为真时,拒绝原假设
会产生一系列后果 第一类错误的概率为,被称为显著性水平
假设检验的结果 不一定正确!
第二类错误(取伪错误)
原假设为假时,接受原假设 第二类错误的概率为
原假设抽样分布
α
µ0
接受域 (原假设为真)
(1)双侧检验与单侧检验
1°备择假设没有特定的方向性,并含有符号“”的假设检 验,称为双侧检验或双尾检验(two-tailed test) 2°备择假设具有特定的方向性,并含有符号“>”或“<”的
假设检验,称为单侧检验或单尾检验(one-tailed test)
备择假设的方向为“<”,称为左侧检验 备择假设的方向为“>”,称为右侧检验
×
1-
Region of Non rejection Region of Rejection
H0
临界值
观察到的样本统计量
统计量决策规则:
1°给定显著性水平,查表得出相应的临界值Z或Z/2 , tα 或 tα/2 2°将检验统计量的值与 水平的临界值进行比较 3°作出决策
双侧检验:|统计量| > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0
假设检验的3种形式:
以总体均值的检验为例: 假设
原假设
双侧检验
H0 : =0
单侧检验
左侧检验
H0 : 0
右侧检验
H0 : 0
备择假设
H1 : ≠0
H1 : <0
H1 : >0
【例1】一种零件的生产标准直径为10cm,为对生产过程进行控 制,质量监测人员定期对一台加工机床检查,来确定这台机
第一类错误(弃真错误)
弃真错误:原假设为真, 却落在拒绝域内被拒绝。
x
拒绝域
wenku.baidu.com
扩大拒绝域( α 变大),第
原假设抽样分布
一类错误可能性变大;反之,为
α
µ0
防止弃真错误,就要缩小α 。
x
拒绝域
原假设:
1-α
µ0
接受域
α
拒绝域
1-β
备择假设:
β
µ1
拒绝域
接受域
研究者总是希望能做出正确的决策,但由于决策是
有汽车的比例超过30%”。
建立的原假设和备择假设为:
H0 : 30%
H1 : 30%
右侧检验:
抽样分布
置信水平 拒绝H0
√
1-
Region of Non rejection Region of Rejection
H0
临界值
观察到的样本统计量
右侧检验:
抽样分布
置信水平 拒绝H0
解:研究者想收集证据予以支持的假设是“该城市中家庭拥
有汽车的比例超过30%”。
建立的原假设和备择假设为:
H0 : 30%
H1 : 30%
提出假设(小结):
1°原假设和备择假设是一个完备事件组,而且相互 对立 <互斥互补> 2°先确定备择假设,再确定原假设 3°等号“=”总是放在原假设上
Region of Rejection
√
置信水平 拒绝H0
/2
1-
Region of Non rejection
Region of Rejection
/2
临界值
H0
临界值
观察到的样本统计量
双侧检验:
抽样分布 拒绝H0
Region of Rejection
×
置信水平 拒绝H0
一、假设检验的基本原理
1. 假设检验(hypothesis test)
1° 先对总体参数(或分布形式)提出某种假设,再利用样
本信息判断假设是否成立 2°参数检验——总体的分布形式已知; 非参数检验 3°逻辑上运用反证法,统计上依据小概率原理! 小概率是在一次试验中,一个几乎不可能发生的事 件发生的概率; 在一次试验中小概率事件一旦发生,我们就有理由
根据样本数据,计算的平均值为36.8oC,标准差为0.36oC 根据参数估计方法,健康成年人平均体温的95%的置信区 间为(36.7,36.9) 研究人员发现这个区间内并没有包括37oC! 因此,提出了“不应该再把37oC作为正常人体温的一个 有任何特定意义的概念”
我们应该放弃“正常人的平均体温是37oC”这个共识吗?
建立在样本信息的基础之上,而样本又是随机的,因而 就有可能犯错误; 原假设和备择假设不能同时成立,决策的结果要么 拒绝H0 ,要么不拒绝H0 。决策时总是希望当原假设正确
时,没有拒绝它;当原假设不正确时拒绝它,但实际上
很难保证不犯错误
是针对原假设 H0 说的!
假设检验中的两类错误(决策结果)
假设检验就好像 一场审判过程 统计检验过程
37.1 36.9 37.6 36.1 37.1 37.0 36.6 36.1 36.7 36.8 36.9 36.6 36.7 37.1 36.2 36.7 37.2 37.1 37.2 37.0 36.9 36.2 37.3 36.6 36.3 36.9 36.4 37.0 36.3 37.0 37.1 36.7 36.9 36.5 37.5 37.0 36.6 36.6 37.1 36.1 36.4 36.9 36.4 36.7 36.9 37.1 37.3 36.9 36.7 37.0
床生产的零件是否符合标准要求。若零件的平均直径大于或
小于10cm,则表明生产过程不正常,必须进行调整。试陈述 用来检验生产过程是否正常的原假设和备择假设。
解:研究者想收集证据予以证明的假设应该是“生产过程不
正常”。建立的原假设和备择假设为:
H0 : 10cm
H1 : 10cm
双侧检验:
/2
临界值
H0
临界值
观察到的样本统计量
【例2】某品牌洗涤剂在它的产品说明书中声称:平均净含
量不少于500克,从消费者的利益出发,有关研究人员 要通过抽检其中的一批产品来验证该产品制造商的说明
是否属实。试陈述用于检验的原假设与备择假设。
解: 研究者抽检的意图是倾向于证实这种洗涤剂的平均
净含量并不符合说明书中的陈述。
建立的原假设和备择假设为:
H0 : 500
H1 : < 500
左侧检验:
抽样分布
Region of Rejection
√
置信水平
拒绝H0
1-
Region of Non rejection
临界值
H0
观察到的样本统计量
左侧检验:
抽样分布
Region of Rejection
×
置信水平
第五章 假设检验 ۩ ۩ 假设检验的基本原理 假设检验的步骤
۩
۩
一个总体参数的检验
利用p 值进行假设检验
总体参数
推断估计
抽样分布
参数估计
随机原则
统计量
假设检验
检验
假设检验在统计方法中的地位:
统计方法
描述统计法 推断统计法
参数估计
假设检验
正常人的平均体温是37oC吗?
当问起健康的成年人体温是多少时,多数人的回 答是37oC!这似乎已经成了一种共识……以下是一 位研究人员测量的50个健康成年人的体温数据。
是否属实。试陈述用于检验的原假设与备择假设。
解: 研究者抽检的意图是倾向于证实这种洗涤剂的平均
净含量并不符合说明书中的陈述。
建立的原假设和备择假设为:
H0 : 500
H1 : < 500
<提出假设>
【例3】一家研究机构估计,某城市中家庭拥有汽车的比例超 过30%。为验证这一估计是否正确,该研究机构随机抽取 了一个样本进行检验。试陈述用于检验的原假设与备择 假设。
计量,现代检验中人们直接使用由统计量
算出的犯第一类错误的概率,即所谓的 P
2. 确定适当的检验统计量
1°用于假设检验问题的统计量
2°选择统计量的方法与参数估计相同,需考虑:
是大样本 or 小样本 总体方差已知 or 未知
3. 规定显著性水平(significant level)
1°是一个概率值
2°原假设为真时,拒绝原假设的概率
<抽样分布的拒绝域>
3°表示为
常用的 值有0.01,0.05,0.10
拒绝H0
1-
Region of Non rejection
临界值
H0
观察到的样本统计量
【例3】一家研究机构估计,某城市中家庭拥有汽车的比例超 过30%。为验证这一估计是否正确,该研究机构随机抽取 了一个样本进行检验。试陈述用于检验的原假设与备择 假设。
解:研究者想收集证据予以支持的假设是“该城市中家庭拥
抽取随机样本
X = 20
均值
二、假设检验的步骤
1. 提出原假设和备择假设 2. 确定适当的检验统计量 3. 规定显著性水平 4. 计算检验统计量的值 5. 作出统计决策
1. 提出假设
1°原假设(null hypothesis)
研究者收集证据,指的是待检验的假设,用H0表示
统计学涵义是指参数没有变化或变量之间没有关系 起初被假设是成立的,后面根据样本数据确定是否 有足够的证据拒绝它 总是有符号 , ,
解:研究者想收集证据予以证明的假设应该是“生产过程不
正常”。建立的原假设和备择假设为:
H0 : 10cm
H1 : 10cm
<提出假设>
【例2】某品牌洗涤剂在它的产品说明书中声称:平均净含
量不少于500克,从消费者的利益出发,有关研究人员 要通过抽检其中的一批产品来验证该产品制造商的说明
H1 : 某一数值 H1 : 某一数值 H1 : < 某一数值
<提出假设>
【例1】一种零件的生产标准直径为10cm,为对生产过程进行控 制,质量监测人员定期对一台加工机床检查,来确定这台机 床生产的零件是否符合标准要求。若零件的平均直径大于或 小于10cm,则表明生产过程不正常,必须进行调整。试陈述 用来检验生产过程是否正常的原假设和备择假设。
H0 :无罪
陪审团审判 裁决 无罪 有罪 实际情况 无罪 正确 错误 有罪 错误 正确 接受H0 拒绝H0
放过坏人
H0 检验
决策
实际情况 H0为真 H0为假
正确决策 第二类错 误() 1– 第一类错 正确决策 误() (1-)
冤枉好人
两类错误的控制:
对于一个给定的样本,如果犯第一类错误的代价比犯
H0 : = 某一数值
H0 : 某一数值 H0 : 某一数值
2°备择假设(alternative hypothesis)
也称“研究假设”,研究者想收集证据予以支持的假 设,通常用 H1 表示 <与原假设对立> 统计学涵义是指总体参数发生了变化或变量之间有某 种关系
备择假设用于表达研究者自己倾向于支持的看法,然 后收集证据拒绝原假设,以支持备择假设 总是有符号 , ,
拒绝原假设
2. 假设检验的基本思想
抽样分布
这个值不像我们应 该得到的样本均值 ...
因此,我们 拒绝假设 =50!
如果这是总体 的真实均值
20
= 50 H0
样本均值
3.假设检验的过程(提出假设→抽取样本→作出决策)
提出假设
我认为人口的 平均年龄是50岁
总体
作出决策
拒绝假设!
4. 检验统计量(test statistic)的计算
1°根据样本观测结果,计算出对原假设和备择假设做出 决策的某个样本统计量 2°对样本估计量的标准化结果
原假设H0为真
点估计量的抽样分布
3°检验统计量的基本形式为(以正态分布为例): x 0 z n
5. 作出统计决策
1°根据给定的显著性水平,查表得出相应的临界 值Z或Z/2 , tα 或 tα/2 2°将检验统计量的值与 水平的临界值进行比较 3°得出接受或拒绝原假设的结论
第二类错误的代价相对较高,则将犯第Ⅰ类错误的概率定 得低些较为合理;反之,则将犯第Ⅰ类错误的概率定得高 些; 一般来说,发生哪一类错误的后果更为严重,就应该
首要控制哪类错误发生的概率。由于犯第一类错误的概率
是可以由研究者控制的,因此在假设检验中,人们往往先 控制第一类错误的发生概率
错误和 错误的关系:
/2
1-
Region of Non rejection
Region of Rejection
/2
临界值
H0
临界值
观察到的样本统计量
双侧检验:
抽样分布 拒绝H0
Region of Rejection
×
置信水平 拒绝H0
/2
1-
Region of Non rejection
Region of Rejection
和的关系就 像翘翘板,小就 大, 大就小
你不能同时减少 两类错误!
两类错误与显著性水平:
显著 水平 与 两类 错误
生活中如何避免——弃 真错误控制得小一些!
第一类错误:弃真(显著水平α)
P{拒绝H 0 H 0为真}
第二类错误:取伪
P{接受H 0 H 0不真}
传统上,做出决策所依据的是样本统
右侧检验:统计量 > 临界值,拒绝H0
(2)假设检验中的两类错误
第一类错误(弃真错误)
原假设为真时,拒绝原假设
会产生一系列后果 第一类错误的概率为,被称为显著性水平
假设检验的结果 不一定正确!
第二类错误(取伪错误)
原假设为假时,接受原假设 第二类错误的概率为
原假设抽样分布
α
µ0
接受域 (原假设为真)
(1)双侧检验与单侧检验
1°备择假设没有特定的方向性,并含有符号“”的假设检 验,称为双侧检验或双尾检验(two-tailed test) 2°备择假设具有特定的方向性,并含有符号“>”或“<”的
假设检验,称为单侧检验或单尾检验(one-tailed test)
备择假设的方向为“<”,称为左侧检验 备择假设的方向为“>”,称为右侧检验
×
1-
Region of Non rejection Region of Rejection
H0
临界值
观察到的样本统计量
统计量决策规则:
1°给定显著性水平,查表得出相应的临界值Z或Z/2 , tα 或 tα/2 2°将检验统计量的值与 水平的临界值进行比较 3°作出决策
双侧检验:|统计量| > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0
假设检验的3种形式:
以总体均值的检验为例: 假设
原假设
双侧检验
H0 : =0
单侧检验
左侧检验
H0 : 0
右侧检验
H0 : 0
备择假设
H1 : ≠0
H1 : <0
H1 : >0
【例1】一种零件的生产标准直径为10cm,为对生产过程进行控 制,质量监测人员定期对一台加工机床检查,来确定这台机
第一类错误(弃真错误)
弃真错误:原假设为真, 却落在拒绝域内被拒绝。
x
拒绝域
wenku.baidu.com
扩大拒绝域( α 变大),第
原假设抽样分布
一类错误可能性变大;反之,为
α
µ0
防止弃真错误,就要缩小α 。
x
拒绝域
原假设:
1-α
µ0
接受域
α
拒绝域
1-β
备择假设:
β
µ1
拒绝域
接受域
研究者总是希望能做出正确的决策,但由于决策是
有汽车的比例超过30%”。
建立的原假设和备择假设为:
H0 : 30%
H1 : 30%
右侧检验:
抽样分布
置信水平 拒绝H0
√
1-
Region of Non rejection Region of Rejection
H0
临界值
观察到的样本统计量
右侧检验:
抽样分布
置信水平 拒绝H0
解:研究者想收集证据予以支持的假设是“该城市中家庭拥
有汽车的比例超过30%”。
建立的原假设和备择假设为:
H0 : 30%
H1 : 30%
提出假设(小结):
1°原假设和备择假设是一个完备事件组,而且相互 对立 <互斥互补> 2°先确定备择假设,再确定原假设 3°等号“=”总是放在原假设上