第9章假设检验基础:单样本检验 (1)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

$ $
Intermediate Calculations Standard Error of the Mean $ Degrees of Freedom t test statistic
P值 > α 因此不能拒绝 H0
3.08 =B8/SQRT(B6) 24 =B6-1 1.46 =(B7-B4)/B11
正确判断概率=(1 第II类错误的概率= β – α)
第I类错误的概率= α
正确决策的功效=(1 – β)
第I类错误和第II类错误的关系
第 I 类错误和第 II 错误不能同时发生

第 I 类错误只能在原假设 H0 为真时发生

第 II 类错误只能在原假设 H0 为假时发生 如果第 I 类错误的概率 ( )
单尾检验
• 在很多情况,备注假设关注的是某一边的情况
H0: μ ≥ 3 H1: μ < 3 H0: μ ≤ 3 H1: μ > 3
备择假设关注的是低于均值3的 lower-tail
备择假设关注的是高于均值3的uppertail
lower-tail检测
H0: μ ≥ 3

这里只有一个临界值, 拒绝域只在一边存在
假设检测
• 总体均值是50
– H0: μ = 50, H1: μ ≠ 50
• 从总体中抽样,并统计其均值
总体
样本
• 如果样本均值与总体均值接近,那么原假设成立,不被拒绝。
• 如果样本均值与总体均值相差很大,则原假设被拒绝。
• 差距多大才能认为足够满足拒绝原假设H0呢?
Sampling Distribution of X
显著信水平和拒绝域
H0: μ = 3 H1: μ ≠ 3
显著信水平=α
α /2
α /2
0 临界值 拒绝域
This is a two-tail test because there is a rejection region in both tails
均值的Z假设检验 (σ 已知)
均值 的 假设检验
拒绝 H0
因为p值 = 0.2937 > = 0.10,因此不能拒绝 H0
例解:p值计算
t Test for the Hypothesis of the Mean Data Null Hypothesis µ= Level of Significance Sample Size Sample Mean Sample Standard Deviation Intermediate Calculations Standard Error of the Mean Degrees of Freedom t test statistic 52.00 0.1 25 53.10 10.00
• 临界值 :
±t24,0.025 = ± 2.0639
不能拒绝H0
采用p值法完成双尾T检验
t Test for the Hypothesis of the Mean Data Null Hypothesis µ= Level of Significance Sample Size Sample Mean Sample Standard Deviation $ 168.00 0.05 25 172.50 15.40
σ 已知 Known Known (Z test) 检验) σ Unknown Unknown 未知 (t test) 检验) 检验统计量:
Xμ t STAT S n
例子(双尾检验, 未知)
H0: μ = 168 H1: μ 168
例解
H0: μ = 168 H1: μ 168
假设检验( σ 未知)
• 如果总体标准差未知,我们只能利用样本的标准差S 来完 成检验 • 因为这一变化,我们需要用t检验来替代Z检验,去检验原 假设是否有效 • 当使用t分布时,我们需确认所抽样的总体是服从正态分布 的
• 其他的步骤和方法就与前面的相同
均值的t假设检验 (σ 未知)
Hypothesis 均值 的 Tests for 假设检验
• = 0.05
• n = 25
• df = 25-1=24 • 未知,使用 t 检验
/2=.025
/2=.025
拒绝 H0
-t 24,0.025 -2.0639
不拒绝 H0
0
1.46
t 24,0.025 2.0639
拒绝 H0
t STAT
Xμ 172.50 168 1.46 S 15.40 n 25
P(Z < -2.0) = 0.0228
P(Z > 2.0) = 0.0228
0 -2.0 P值 = 0.0228 + 0.0228 = 0.0456 2.0
Z
P值检验示例(续)
• 5. p值 < α ?
– p值 = 0.0456 < α = 0.05 拒绝 H0
没有足够的证据支持电视在美国家庭的平均数等于3的结论
一个电话公司的管理人员认为客户每月的电话 费用在上升,现在平均每月的费用超过了$52, 公司希望检测这种说法的可靠性 (假设总体呈正态分布) 形成假设检验:
H0: μ ≤ 52
H1: μ >52
每月电话费均值没有超过$52
每月电话费均值超过$52
例解:找出拒绝域
• 假设置信水平: = 0.10 • 此次检测的抽样样本 n = 25. 找出拒绝域:
拒绝域和接受域
• 检验统计量的抽样分布成两个区域,一个是拒绝域,也叫否
定域,一个是接受域。 • 如果检验统计值落在接受域之内,就不能拒绝原假设;如果 检验统计值是落在拒绝域之内,则就要拒绝原假设。
拒绝域和接受域
拒绝域 接受域
拒绝域
临界值
距样本均值的距离太远
• 拒绝域是由原假设为真时检验统计量不大可能出现的值所组 成的。原假设错误时,这些值更有可能发生。因此检验统计 值落在了拒绝域内,就可以拒绝原假设。
什么是原假设
政府统计数据
Example: 美国家庭的户均拥有电视台数是3。 ( H :μ 3 )
0
关注在是总体信息,而不是样本信息
H0 : X 3
H0 : μ 3
原假设和备择假设的重要观点
检验统计量的临界值
• 假设检验方法背后的逻辑是根据样本得出的信息确定原假设 是正确的可能性。 • 如果统计值和总体参数的假设值之间有很大的差距,那么可 以设为原假设是错误的。 • 通常情况下不那么清晰,如何确定近似还是差距大是很主观 的,缺乏明确的定义。假设检验的方法给出了如何衡量差距 的明确定义。 • 检验统计量的抽样分布通常是服从普遍的抽样分布的,像标 准正态分布,t分布等,可以通过这些分布来确定原假设是 否正确。
2.00 =B8/SQRT(B6) 24 =B6-1 0.55 =(B7-B4)/B11

H1: μ < 3
拒绝 H0
接受 H0
-Zα or -tα
0
Z or t X
μ
临界值
upper-tail检测
这里只有一个临界值, 拒绝域只在一边存在
H0: μ ≤ 3

H1: μ > 3

Z or t _ X
接受 H0
0
Zα or tα
拒绝 H0
μ
临界值
例子: 基于均值的Upper-Tail t 检验 (未知)
P值检验示例
美国家庭户均拥有电视3台
(假设 σ = 0.8)
1. 写出原假设和备择假设 H0: μ = 3 H1: μ ≠ 3 (这属于双尾检验) 2. 选择显著性水平和样本容量 显著性水平 : = 0.05 和样本容量: n = 100 3. 因为σ已知,可以使用服从正态分布的Z检验统计量
P值检验示例(续)
拒绝 H0
= 0.10
接受 H0
0
1.318
拒绝 H0
如果 tSTAT > 1.318,拒绝 H0
例解:计算检验值
假设检验样本得出如下结论: n = 25, X = 53.1, and S = 10
– 检验统计量是:
t STAT Xμ 53.1 52 0.55 S 10 n 25
假设检验基础:单样本 检验
学习目标
• 假设检验的基本原则 • 如何用假设检验均值和比例 • 如何评价假设检验中的假设,以及违背时的后果 • 如何避免假设检验的缺陷 • 假设检验中的道德问题
原假设和备择假设
原假设一般都是根据统计经验的事先判断,然后去证明是
否符合这个假设,如果不符合那么就是备择假设,统计学原理 中的假设检验只能回答是还是不是,而不是如何,怎么样,这 样多种选择的问题。 例如方差检验中原假设是各均值都相等,备择假设是各均 值不全相等。
σ Known 已知 (Z 检验) 检验统计量是: σ Unknown 未知 (t 检验)
Z STAT
Xμ σ n
假设检验示例
美国家庭户均拥有电视3台
(假设 σ = 0.8)
1. 写出原假设和备择假设 H0: μ = 3 H1: μ ≠ 3 (这属于双尾检验) 2. 选择显著性水平和样本容量 显著性水平 : = 0.05 和样本容量: n = 100 3. 因为σ已知,可以使用服从正态分布的Z检验统计量 4. 确定拒绝域 因为 = 0.05 所以Z 检验的临界值为 ±1.96
类错误的概率 ( β )
wk.baidu.com, 那么第 II
影响第II类错误的因素
• All else equal,
– β when the difference between hypothesized parameter and its true value
– – –
β β β
when when when
σ
n
例解:结论
拒绝 H0
= 0.10
接受H0
1.318 0 tSTAT = 0.55
拒绝t H0
因为 tSTAT = 0.55 ≤ 1.318, 不能拒绝 H0 没有足够的证据证明假设不成立
例:利用p值法检验
• p值和进行比较
P值 = 0.2937
拒绝 H0 = 0.10
0
接受 H0
1.318 tSTAT = .55
Two-Tail Test Lower Critical Value -2.0639 =-TINV(B5,B12) Upper Critical Value 2.0639 =TINV(B5,B12) p-value 0.157 =TDIST(ABS(B13),B12,2) Do Not Reject Null Hypothesis =IF(B18<B5, "Reject null hypothesis", "Do not reject null hypothesis")
假设检验示例(续)
5. 收集样本数据,计算检验统计量的值 n = 100, X = 2.84 (σ = 0.8) 所以检验统计量是:
Z STAT X μ 2.84 3 .16 2.0 σ 0.8 .08 n 100
假设检验示例(续)
• 6. 判断这个检验值是否在拒绝域内?
/2 = 0.025 /2 = 0.025
如果 ZSTAT < 1.96 或 ZSTAT > 1.96,拒绝H0 , 否则接受 H0
拒绝 H0
接受H0
拒绝 H0
-Zα/2 = -1.96
0
+Zα/2 = +1.96
这里 , ZSTAT = -2.0 < -1.96, 所以 检验值是在拒绝域内
假设检验中的p值法
20
If it is unlikely that you would get a sample mean of this value ...
μ = 50 If H0 is true ... When in fact this were the population mean…
X ... then you reject the null hypothesis that μ = 50.
假设检验方法的风险
假设检验方法的风险
检验的功效:与第II类错误概率互补的是(1- β ),叫做统计检验的功效。 统计检验的功效(1- β ):是你拒绝原假设,而实际上该假设也是错误的 或应该被拒绝的概率。
假设检验和决策
假设检验和决策
实际情况
统计决策 H0 为真 没有拒绝H0 拒绝 H0 H0 为假
4. 收集数据,计算检验值和p值 假设样本数据是 n = 100, X = 2.84 (σ = 0.8) 计算检验统计量:
Z STAT X μ 2.84 3 .16 2.0 σ 0.8 .08 n 100
P值检验示例(续)
4. (续) 计算p值
• 为了计算检验统计量在标准差之外的概率,要计算Z值大于 或小于+2.0和-2.0的概率
相关文档
最新文档