假设检验基础:单样本检验(1)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
that μ = 50.
拒绝域和接受域
• 检验统计量的抽样分布成两个区域,一个是拒绝域,也叫否 定域,一个是接受域。
• 如果检验统计值落在接受域之内,就不能拒绝原假设;如果 检验统计值是落在拒绝域之内,则就要拒绝原假设。
拒绝域和接受域
拒绝域
接受域
拒绝域
临界值 距样本均值的距离太远
• 拒绝域是由原假设为真时检验统计量不大可能出现的值所组 成的。原假设错误时,这些值更有可能发生。因此检验统计 值落在了拒绝域内,就可以拒绝原假设。
20
If it is unlikely that you would get a sample mean of this value ...
μ = 50 If H0 is true
... When in fact this were the population mean…
X
... then you reject the null hypothesis
假设检测
• 总wk.baidu.com均值是50
– H0: μ = 50,
H1: μ ≠ 50
• 从总体中抽样,并统计其均值
总体
样本
•
• 如果样本均值与总体均值接近,那么原假设成立,不被拒绝。 • 如果样本均值与总体均值相差很大,则原假设被拒绝。 • 差距多大才能认为足够满足拒绝原假设H0呢?
Sampling Distribution of X
Xμ σ
n
σ Un未kn知own (t 检验)
假设检验示例
美国家庭户均拥有电视3台 (假设 σ = 0.8)
1. 写出原假设和备择假设 H0: μ = 3 H1: μ ≠ 3 (这属于双尾检验)
2. 选择显著性水平和样本容量 显著性水平 : = 0.05 和样本容量: n = 100
3. 因为σ已知,可以使用服从正态分布的Z检验统计量 4. 确定拒绝域
4. 收集数据,计算检验值和p值 假设样本数据是
n = 100, X = 2.84 (σ = 0.8) 计算检验统计量:
ZSTAT
X μ 2.84 3 .16 2.0
σ
0.8
.08
n
100
P值检验示例(续)
4. (续) 计算p值
因为 = 0.05 所以Z 检验的临界值为 ±1.96
假设检验示例(续)
5. 收集样本数据,计算检验统计量的值 n = 100, X = 2.84 (σ = 0.8) 所以检验统计量是:
ZSTAT
X μ 2.84 3 .16 2.0
σ
0.8
.08
n
100
假设检验示例(续)
• 6. 判断这个检验值是否在拒绝域内?
/2 = 0.025
/2 = 0.025
如果 ZSTAT < 1.96 或 ZSTAT > 1.96,拒绝H0 , 否则接受 H0
拒绝 H0
-Zα/2 = -1.96
接受H0
0
拒绝 H0
+Zα/2 = +1.96
这里 , ZSTAT = -2.0 < -1.96, 所以 检验值是在拒绝域内
假设检验中的p值法
•
P值检验示例
美国家庭户均拥有电视3台 (假设 σ = 0.8)
1. 写出原假设和备择假设 H0: μ = 3 H1: μ ≠ 3 (这属于双尾检验)
2. 选择显著性水平和样本容量 显著性水平 : = 0.05 和样本容量: n = 100
3. 因为σ已知,可以使用服从正态分布的Z检验统计量
P值检验示例(续)
α /2
显著信水平=α α /2
0 临界值 拒绝域 This is a two-tail test because there is a rejection region in both tails
•
均值的Z假设检验 (σ 已知)
均值 的 假设检验
σK已no知wn (Z 检验)
检验统计量是:
ZSTAT
正确判断概率=(1 – α)
第II类错误的概率= β
第I类错误的概率= 正确决策的功效=(1
α
– β)
第I类错误和第II类错误的关系
▪ 第 I 类错误和第 II 错误不能同时发生 ▪ 第 I 类错误只能在原假设 H0 为真时发生 ▪ 第 II 类错误只能在原假设 H0 为假时发生
如果第 I 类错误的概率 ( ) 类错误的概率 ( β )
假设检验方法的风险
•
假设检验方法的风险
•
检验的功效:与第II类错误概率互补的是(1- β ),叫做统计检验的功效。 统计检验的功效(1- β ):是你拒绝原假设,而实际上该假设也是错误的 或应该被拒绝的概率。
假设检验和决策
假设检验和决策
统计决策 H0 为真
实际情况
H0 为假
没有拒绝H0 拒绝 H0
假设检验基础:单样本 检验
学习目标
• 假设检验的基本原则 • 如何用假设检验均值和比例 • 如何评价假设检验中的假设,以及违背时的后果 • 如何避免假设检验的缺陷 • 假设检验中的道德问题
原假设和备择假设
原假设一般都是根据统计经验的事先判断,然后去证明是 否符合这个假设,如果不符合那么就是备择假设,统计学原理 中的假设检验只能回答是还是不是,而不是如何,怎么样,这 样多种选择的问题。
, 那么第 II
影响第II类错误的因素
• All else equal,
–β
when the difference between
hypothesized parameter and its true value
–β –β –β
when when σ
when n
显著信水平和拒绝域
H0: μ = 3 H1: μ ≠ 3
例如方差检验中原假设是各均值都相等,备择假设是各均 值不全相等。
什么是原假设
政府统计数据
Example: 美国家庭的户均拥有电视台数是3。 ( H0 :μ3 )
关注在是总体信息,而不是样本信息
H0 :μ3
H0 : X 3
•
原假设和备择假设的重要观点
•
检验统计量的临界值
• 假设检验方法背后的逻辑是根据样本得出的信息确定原假设 是正确的可能性。
• 如果统计值和总体参数的假设值之间有很大的差距,那么可 以设为原假设是错误的。
• 通常情况下不那么清晰,如何确定近似还是差距大是很主观 的,缺乏明确的定义。假设检验的方法给出了如何衡量差距 的明确定义。
• 检验统计量的抽样分布通常是服从普遍的抽样分布的,像标 准正态分布,t分布等,可以通过这些分布来确定原假设是 否正确。
拒绝域和接受域
• 检验统计量的抽样分布成两个区域,一个是拒绝域,也叫否 定域,一个是接受域。
• 如果检验统计值落在接受域之内,就不能拒绝原假设;如果 检验统计值是落在拒绝域之内,则就要拒绝原假设。
拒绝域和接受域
拒绝域
接受域
拒绝域
临界值 距样本均值的距离太远
• 拒绝域是由原假设为真时检验统计量不大可能出现的值所组 成的。原假设错误时,这些值更有可能发生。因此检验统计 值落在了拒绝域内,就可以拒绝原假设。
20
If it is unlikely that you would get a sample mean of this value ...
μ = 50 If H0 is true
... When in fact this were the population mean…
X
... then you reject the null hypothesis
假设检测
• 总wk.baidu.com均值是50
– H0: μ = 50,
H1: μ ≠ 50
• 从总体中抽样,并统计其均值
总体
样本
•
• 如果样本均值与总体均值接近,那么原假设成立,不被拒绝。 • 如果样本均值与总体均值相差很大,则原假设被拒绝。 • 差距多大才能认为足够满足拒绝原假设H0呢?
Sampling Distribution of X
Xμ σ
n
σ Un未kn知own (t 检验)
假设检验示例
美国家庭户均拥有电视3台 (假设 σ = 0.8)
1. 写出原假设和备择假设 H0: μ = 3 H1: μ ≠ 3 (这属于双尾检验)
2. 选择显著性水平和样本容量 显著性水平 : = 0.05 和样本容量: n = 100
3. 因为σ已知,可以使用服从正态分布的Z检验统计量 4. 确定拒绝域
4. 收集数据,计算检验值和p值 假设样本数据是
n = 100, X = 2.84 (σ = 0.8) 计算检验统计量:
ZSTAT
X μ 2.84 3 .16 2.0
σ
0.8
.08
n
100
P值检验示例(续)
4. (续) 计算p值
因为 = 0.05 所以Z 检验的临界值为 ±1.96
假设检验示例(续)
5. 收集样本数据,计算检验统计量的值 n = 100, X = 2.84 (σ = 0.8) 所以检验统计量是:
ZSTAT
X μ 2.84 3 .16 2.0
σ
0.8
.08
n
100
假设检验示例(续)
• 6. 判断这个检验值是否在拒绝域内?
/2 = 0.025
/2 = 0.025
如果 ZSTAT < 1.96 或 ZSTAT > 1.96,拒绝H0 , 否则接受 H0
拒绝 H0
-Zα/2 = -1.96
接受H0
0
拒绝 H0
+Zα/2 = +1.96
这里 , ZSTAT = -2.0 < -1.96, 所以 检验值是在拒绝域内
假设检验中的p值法
•
P值检验示例
美国家庭户均拥有电视3台 (假设 σ = 0.8)
1. 写出原假设和备择假设 H0: μ = 3 H1: μ ≠ 3 (这属于双尾检验)
2. 选择显著性水平和样本容量 显著性水平 : = 0.05 和样本容量: n = 100
3. 因为σ已知,可以使用服从正态分布的Z检验统计量
P值检验示例(续)
α /2
显著信水平=α α /2
0 临界值 拒绝域 This is a two-tail test because there is a rejection region in both tails
•
均值的Z假设检验 (σ 已知)
均值 的 假设检验
σK已no知wn (Z 检验)
检验统计量是:
ZSTAT
正确判断概率=(1 – α)
第II类错误的概率= β
第I类错误的概率= 正确决策的功效=(1
α
– β)
第I类错误和第II类错误的关系
▪ 第 I 类错误和第 II 错误不能同时发生 ▪ 第 I 类错误只能在原假设 H0 为真时发生 ▪ 第 II 类错误只能在原假设 H0 为假时发生
如果第 I 类错误的概率 ( ) 类错误的概率 ( β )
假设检验方法的风险
•
假设检验方法的风险
•
检验的功效:与第II类错误概率互补的是(1- β ),叫做统计检验的功效。 统计检验的功效(1- β ):是你拒绝原假设,而实际上该假设也是错误的 或应该被拒绝的概率。
假设检验和决策
假设检验和决策
统计决策 H0 为真
实际情况
H0 为假
没有拒绝H0 拒绝 H0
假设检验基础:单样本 检验
学习目标
• 假设检验的基本原则 • 如何用假设检验均值和比例 • 如何评价假设检验中的假设,以及违背时的后果 • 如何避免假设检验的缺陷 • 假设检验中的道德问题
原假设和备择假设
原假设一般都是根据统计经验的事先判断,然后去证明是 否符合这个假设,如果不符合那么就是备择假设,统计学原理 中的假设检验只能回答是还是不是,而不是如何,怎么样,这 样多种选择的问题。
, 那么第 II
影响第II类错误的因素
• All else equal,
–β
when the difference between
hypothesized parameter and its true value
–β –β –β
when when σ
when n
显著信水平和拒绝域
H0: μ = 3 H1: μ ≠ 3
例如方差检验中原假设是各均值都相等,备择假设是各均 值不全相等。
什么是原假设
政府统计数据
Example: 美国家庭的户均拥有电视台数是3。 ( H0 :μ3 )
关注在是总体信息,而不是样本信息
H0 :μ3
H0 : X 3
•
原假设和备择假设的重要观点
•
检验统计量的临界值
• 假设检验方法背后的逻辑是根据样本得出的信息确定原假设 是正确的可能性。
• 如果统计值和总体参数的假设值之间有很大的差距,那么可 以设为原假设是错误的。
• 通常情况下不那么清晰,如何确定近似还是差距大是很主观 的,缺乏明确的定义。假设检验的方法给出了如何衡量差距 的明确定义。
• 检验统计量的抽样分布通常是服从普遍的抽样分布的,像标 准正态分布,t分布等,可以通过这些分布来确定原假设是 否正确。