第八章----假设检验课件PPT
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
在一次试验中小概率事件一旦发生,我们就有理 由拒绝原假设
8
原假设
(null hypothesis)
1. 又称“0假设”,研究者想收集证据予以反对的假 设,用H0表示
2. 所表达的含义总是指参数没有变化或变量之间没 有关系
3. 最初被假设是成立的,之后根据样本数据确定是否 有足够的证据拒绝它
4. 总是有符号 , 或
❖ 一般来说,发生哪一类错误的后果更为严重, 就应该首要控制哪类错误发生的概率。但由 于犯第Ι类错误的概率是可以由研究者控制的, 因此在假设检验中,人们往往先控制第Ι类错 误的发生概率
❖ 错误与错误的关系: 与的关系就像跷跷板,
小就大, 大就小,同时减小两类错误惟一
的办法就是增加样本容量。
13
假设检验的流程
3. 备择假设通常用于表达研究者自己倾向于支持的 看法,然后就是想办法收集证据拒绝原假设,以 支持备择假设
4. 总是有符号 ≠, >或 <
H1 : 某一数值 H1 : 某一数值 H1 : <某一数值
10
假设检验中的两类错误 (决策风险)
11
假设检验中的两类错误
❖ 1.第一类错误(弃真错误)
就一个总体而言,总体参数包括总体均值、成 数、方差等
分析之前必需陈述
7
什么是假设检验?
(hypothesis test)
1. 先对总体的参数(或分布形式)提出某种假设, 然后利用样本信息判断假设是否成立的统计方 法
2. 有参数检验和非参数检验 3. 逻辑上运用反证法,统计上依据小概率原理
小概率是在一次试验中,一个几乎不可能发生的 事件发生的概率
第八章 假设检验
假设检验的基本问题 一个总体参数的检验 两个总体参数的检验
1
学习目标
假设检验的基本思想和原理 假设检验的步骤 一个总体参数的检验 两个总体参数的检验 P值的计算与应用 用Excel进行检验
2
正常人的平均体温是37oC吗?
37.1 36.9 36.9 37.1 36.4
原假设为真时拒绝原假设 会产生一系列后果 第一类错误的概率为
❖被称为显著性水平
❖ 2.第二类错误(取伪错误)
原假设为假时接受原假设 第二类错误的概率为(Beta)
12
两类错误的控制
❖ 一般来说,对于一个给定的样本,如果犯第Ι 类错误的代价比犯第Ⅱ类错误的代价相对较 高,则将犯第Ⅰ类错误的概率定得低些较为 合理;反之,如果犯第Ι类错误的代价比犯第 Ⅱ类错误的代价相对较低,则将犯第Ⅰ类错 误的概率定得高些
验统计量部分的面积
右侧检验时,P-值为曲线上方大于等于检
验统计量部分的面积
3. 被称为观察到的(或实测的)显著性水平
H0 能被拒绝的最小值
20
双侧检验的P 值
/ 2 拒绝
/ 2 拒绝
H0 : = 某一数值 H0 : 某一数值 H0 : 某一数值
例如, H0 : 10cm
9
备择假设
(alternative hypothesis)
1. 也称“研究假设”,研究者想收集证据予以支持的 假设(期望出现的结论作为备选假设),用H1或Ha表 示
2. 所表达的含义是总体参数发生了变化或变量之间 有某种关系
3
正常人的平均体温是37oC吗?
➢ 根据样本数据计算的平均值是36.8oC ,标准差 为0.36oC
➢ 根据参数估计方法得到的健康成年人平均体温的 95%的置信区间为(36.7,36.9)。研究人员发现 这个区间内并没有包括37oC
➢ 因此提出“不应该再把37oC作为正常人体温的 一个有任何特定意义的概念”
37.0
36.7
36.9
37.0
37.1
一 个 研 究 人 员 36.6 37.2 36.4 36.6 37.3
测 量 的 50 个 健 36.1 37.1 37.0 36.6 36.9
康 成 年 人 的 体 36.7 37.2 36.3 37.1 36.7
温数据
36.8 37.0 37.0 36.1 37.0
Z X 0
15
n
规定显著性水平
(significant level) ❖ 什么是显著性水平? ❖ 1. 是一个概率值
❖ 2. 原假设为真时,拒绝原假设的概率
被称为抽样分布的拒绝域
❖ 3. 表示为 (alpha)
常用的 值有0.01, 0.05, 0.10
❖ 4. 由研究者事先确定
16
作出统计决策
1. 计算检验的统计量
2. 根据给定的显著性水平,查表得出相应
的临界值z或z/2, t或t/2
3. 将检验统计量的值与 水平的临界值进
行比较 4. 得出拒绝或不拒绝原假设的结论
17
统计量决策规则
❖ 给定显著性水平,查表得出相应的临界值
z或z/2, t或t/2
❖ 将检验统计量的值与 水平的临界值进行比
➢ 当问起健康的 成年人体温是
36.9
36.6
36.2
36.7
36.9
多 少 时 , 多 数 37.6 36.7 37.3 36.9 36.4
人 的 回 答 是 36.1 37.1 36.6 36.5 36.7
37oC , 这 似 乎 37.1 36.2 36.3 37.5 36.9
已经成了一种 共识。下面是
➢ 我们应该放弃“正常人的平均体温是37oC”这个 共识吗?本章的内容就将提供一套标准统计程序 来检验这样的观点
4
假设检验
假设检验的基本原理
怎样提出假设? 怎样做出决策? 怎样表述决策结果?
5
假设检验的基本原理
怎样提出假设?
6
什么是假设?
(hypothesis)
❖ ☺ 在参数检验中,对总体参数的具体数值 所作的陈述
较Fra Baidu bibliotek
❖ 作出决策
双侧检验:I统计量I > 临界值,拒绝H0
左侧检验:统计量 < -临界值,拒绝H0
右侧检验:统计量 > 临界值,拒绝H0
18
利用P值进行决策
19
什么是P 值?
(P-value)
1. 是一个概率值
2. 如果原假设为真,P-值是抽样分布中大于 或小于样本统计量的概率
左侧检验时,P-值为曲线上方小于等于检
▪ 提出假设 ▪ 确定适当的检验统计量 ▪ 规定显著性水平 ▪ 计算检验统计量的值 ▪ 作出统计决策
14
确定适当的检验统计量
❖ 什么是检验统计量?
❖ 1.用于假设检验决策的统计量
❖ 2.选择统计量的方法与参数估计相同,需考 虑
是大样本还是小样本
总体方差已知还是未知
3. 检验统计量的基本形式为
8
原假设
(null hypothesis)
1. 又称“0假设”,研究者想收集证据予以反对的假 设,用H0表示
2. 所表达的含义总是指参数没有变化或变量之间没 有关系
3. 最初被假设是成立的,之后根据样本数据确定是否 有足够的证据拒绝它
4. 总是有符号 , 或
❖ 一般来说,发生哪一类错误的后果更为严重, 就应该首要控制哪类错误发生的概率。但由 于犯第Ι类错误的概率是可以由研究者控制的, 因此在假设检验中,人们往往先控制第Ι类错 误的发生概率
❖ 错误与错误的关系: 与的关系就像跷跷板,
小就大, 大就小,同时减小两类错误惟一
的办法就是增加样本容量。
13
假设检验的流程
3. 备择假设通常用于表达研究者自己倾向于支持的 看法,然后就是想办法收集证据拒绝原假设,以 支持备择假设
4. 总是有符号 ≠, >或 <
H1 : 某一数值 H1 : 某一数值 H1 : <某一数值
10
假设检验中的两类错误 (决策风险)
11
假设检验中的两类错误
❖ 1.第一类错误(弃真错误)
就一个总体而言,总体参数包括总体均值、成 数、方差等
分析之前必需陈述
7
什么是假设检验?
(hypothesis test)
1. 先对总体的参数(或分布形式)提出某种假设, 然后利用样本信息判断假设是否成立的统计方 法
2. 有参数检验和非参数检验 3. 逻辑上运用反证法,统计上依据小概率原理
小概率是在一次试验中,一个几乎不可能发生的 事件发生的概率
第八章 假设检验
假设检验的基本问题 一个总体参数的检验 两个总体参数的检验
1
学习目标
假设检验的基本思想和原理 假设检验的步骤 一个总体参数的检验 两个总体参数的检验 P值的计算与应用 用Excel进行检验
2
正常人的平均体温是37oC吗?
37.1 36.9 36.9 37.1 36.4
原假设为真时拒绝原假设 会产生一系列后果 第一类错误的概率为
❖被称为显著性水平
❖ 2.第二类错误(取伪错误)
原假设为假时接受原假设 第二类错误的概率为(Beta)
12
两类错误的控制
❖ 一般来说,对于一个给定的样本,如果犯第Ι 类错误的代价比犯第Ⅱ类错误的代价相对较 高,则将犯第Ⅰ类错误的概率定得低些较为 合理;反之,如果犯第Ι类错误的代价比犯第 Ⅱ类错误的代价相对较低,则将犯第Ⅰ类错 误的概率定得高些
验统计量部分的面积
右侧检验时,P-值为曲线上方大于等于检
验统计量部分的面积
3. 被称为观察到的(或实测的)显著性水平
H0 能被拒绝的最小值
20
双侧检验的P 值
/ 2 拒绝
/ 2 拒绝
H0 : = 某一数值 H0 : 某一数值 H0 : 某一数值
例如, H0 : 10cm
9
备择假设
(alternative hypothesis)
1. 也称“研究假设”,研究者想收集证据予以支持的 假设(期望出现的结论作为备选假设),用H1或Ha表 示
2. 所表达的含义是总体参数发生了变化或变量之间 有某种关系
3
正常人的平均体温是37oC吗?
➢ 根据样本数据计算的平均值是36.8oC ,标准差 为0.36oC
➢ 根据参数估计方法得到的健康成年人平均体温的 95%的置信区间为(36.7,36.9)。研究人员发现 这个区间内并没有包括37oC
➢ 因此提出“不应该再把37oC作为正常人体温的 一个有任何特定意义的概念”
37.0
36.7
36.9
37.0
37.1
一 个 研 究 人 员 36.6 37.2 36.4 36.6 37.3
测 量 的 50 个 健 36.1 37.1 37.0 36.6 36.9
康 成 年 人 的 体 36.7 37.2 36.3 37.1 36.7
温数据
36.8 37.0 37.0 36.1 37.0
Z X 0
15
n
规定显著性水平
(significant level) ❖ 什么是显著性水平? ❖ 1. 是一个概率值
❖ 2. 原假设为真时,拒绝原假设的概率
被称为抽样分布的拒绝域
❖ 3. 表示为 (alpha)
常用的 值有0.01, 0.05, 0.10
❖ 4. 由研究者事先确定
16
作出统计决策
1. 计算检验的统计量
2. 根据给定的显著性水平,查表得出相应
的临界值z或z/2, t或t/2
3. 将检验统计量的值与 水平的临界值进
行比较 4. 得出拒绝或不拒绝原假设的结论
17
统计量决策规则
❖ 给定显著性水平,查表得出相应的临界值
z或z/2, t或t/2
❖ 将检验统计量的值与 水平的临界值进行比
➢ 当问起健康的 成年人体温是
36.9
36.6
36.2
36.7
36.9
多 少 时 , 多 数 37.6 36.7 37.3 36.9 36.4
人 的 回 答 是 36.1 37.1 36.6 36.5 36.7
37oC , 这 似 乎 37.1 36.2 36.3 37.5 36.9
已经成了一种 共识。下面是
➢ 我们应该放弃“正常人的平均体温是37oC”这个 共识吗?本章的内容就将提供一套标准统计程序 来检验这样的观点
4
假设检验
假设检验的基本原理
怎样提出假设? 怎样做出决策? 怎样表述决策结果?
5
假设检验的基本原理
怎样提出假设?
6
什么是假设?
(hypothesis)
❖ ☺ 在参数检验中,对总体参数的具体数值 所作的陈述
较Fra Baidu bibliotek
❖ 作出决策
双侧检验:I统计量I > 临界值,拒绝H0
左侧检验:统计量 < -临界值,拒绝H0
右侧检验:统计量 > 临界值,拒绝H0
18
利用P值进行决策
19
什么是P 值?
(P-value)
1. 是一个概率值
2. 如果原假设为真,P-值是抽样分布中大于 或小于样本统计量的概率
左侧检验时,P-值为曲线上方小于等于检
▪ 提出假设 ▪ 确定适当的检验统计量 ▪ 规定显著性水平 ▪ 计算检验统计量的值 ▪ 作出统计决策
14
确定适当的检验统计量
❖ 什么是检验统计量?
❖ 1.用于假设检验决策的统计量
❖ 2.选择统计量的方法与参数估计相同,需考 虑
是大样本还是小样本
总体方差已知还是未知
3. 检验统计量的基本形式为