第六章 假设检验(Hypothesis test)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
31 Back
3.小样本的正态总体,σ未知
检验统计量:
X t ~ t n 1 S n
z
×
2
×
z
2
z
2
•它有两个拒绝域,两个临界值, 每个拒绝域的概率α/2 。 •在抽样分布两端各α/2位置上 确定拒绝域边界的临界值。
临界值
拒绝域: Z Baidu Nhomakorabea Z 0 or
2
Z 0 Z
2
14
样本数据计算出来的统计量Z0落在拒绝域,则拒绝H0 。
单侧假设检验的拒绝域定义:
•单侧检验有一个拒绝域,一个 临界值,拒绝域的概率α 。 •在抽样分布某一端的α位置上 确定拒绝域边界的临界值。
如果有人对用户说:灯泡的平均使用寿命低于1600hr。 此时,用户要研究的是μ是否会小于1600hr。
提出假设:
H0:μ=1600; H1:μ<1600
10
思考题:
想要检验女性职员平均体重是否大于55公 斤,如何提出原假设和备择假设?
H0:μ=55; H1:μ>55 μ≦55;H1:μ>55
或
如果厂商的宣称是真的,随机抽取1件是次品的情况几乎是 不可能发生的。如果这种情况发生了,我们就有理由怀疑 原来的假设是否成立,这时我们可以推翻原来的假设。
当然,推论也可能犯错误,确实有1件次品,刚好1次被抽 到,这种错误概率是1%(显著水平)。
12
二、接受域和拒绝域
以统计量(称检验统计量,test statistic)的抽 样分布为基础,给定小概率α ,判断样本数据 是否接受H0。
(1)以α=0.05 为检验标准,进行检验。
(2)以α=0.01 为检验标准,结论有变化吗?
29
(1)解: H0:μ=500;H1: μ>500 α=0.05,正态总体,小样本n=16,X=554,σ=100 在H0为真的情况下,构造检验统计量:
X Z ~ N (0,1) n
由样本数据计算检验统计量的数值:
为检验此论述,进行随机抽样调查, 以样本数据检验此假设是否成立。
2
假设检验
产生假设检验的原因大致有两个:
当对总体参数的真实性感到怀疑,需要通过 样本来考察其正确与否时,往往借助于假设 检验做出判断(决策)。 当对变量间存在某种关系的证据(平均值之 差、方差之比等)怀疑时,也会要求进行假 设检验。
Back5
一、建立假设
原假设/虚无假设(null hypothesis):H0
研究者要收集证据予以反对的假设。 将研究结果无效的说法作为原假设。
设定总体参数等于某一数值。
认为两个或两个以上总体参数相等。
H0:μ=2500 H 0 : μ 1 = μ2
OR
H0:μ≥2500 (收入)
此时,H0:员工满意度和性别无关
7
一、建立假设
备择假设(alternative hypothesis) :H1
研究者要收集证据予以支持的假设。 将研究结果有效的假设作为备择假设。
与原假设对立,是要研究的问题。
强调差异或方向性。
例如,某品牌洗涤剂的产品, H1:μ<500
例如, H1:员工满意度和性别有关
H 0 为真
(取伪错误) 1 (正确判断)
H 0 为假
弃真错误又称第I类错误(Type I error)。 取伪错误又称第II类错误(Type II error)。
假设检验时,希望正确判断并减少犯错误的概率。通过 控制α(显著性水平,level of significance)减少犯错, 此种检验称显著性检验。
双侧检验或单侧检验,根据H1来定。
9
例如:灯泡厂商在给用户提供一批灯泡时声称,该 批灯泡的平均使用寿命是1600hr。为验证厂商的说 法,需要用样本数据进行检验。
提出假设: H0:μ=1600; H1:μ≠1600
如果样本数据很接近1600hr,则可以接受H0;如果 样本数据离1600hr很远,就会拒绝H0,接受H1。
3
第六章 假设检验
第一节 假设检验原理 第二节 单一总体均值的假设检验 第三节 两个总体均值差的假设检验 第四节 总体比例与方差的假设检验 第五节 SPSS在假设检验中的应用
4
第一节 假设检验原理
一、建立假设 二、接受域和拒绝域 三、两类错误 四、假设检验的步骤 五、p值(p-value) 六、正确表述统计决策结果
由样本数据计算检验统计量的数值:
554 500 Z 2.16 100 16 决策规则(如图),如果 Z>Z0.01 拒绝H0
z 0.01 2.33
Z 2.16 Z0.01 2.33
因为检验统计量Z的数值落在接受域,所以不拒绝H0。 证据显示,参加辅导班对学生的SAT分数没有影响。
(1会计,2企管,统计学成绩)
“等号”始终在H0。
6
一、建立假设
例如:你对某品牌洗涤剂的产品标签中声称: “平均净含量不低于500克”,感到质疑。
你想要证实“平均净含量不足500克”。即你想
要推翻的是μ≥500克,要证实μ<500克。
此时,H0:μ≥500
例如:你研究认为员工满意度和性别有关,你 想要以样本数据来支持你的论点。
计算检验统计量的数值进行推断。
确定H0为真时,检验统计量服从的抽样分布。
• 例如:总体服从正态分布,且σ已知,则构 造检验统计量Z,在H0为真的情况下,有
X 0 Z ~ N 0,1 n
可以确定临界值,构 造拒绝域和接受域。
19
四、假设检验的步骤
Step4:计算检验统计量的数值
根据样本数据计算检验统计量的数值。
Back 27
2.小样本的正态总体,σ已知
检验统计量:
X Z ~ N 0,1 n
【例】
28
例题()
SAT测验分数遵从μ=500,σ=100的正态分布。一 位老师办辅导班,希望能够提高学生的SAT分数。 随机抽取16个学生参加他的辅导班,其参加测验 后得到的平均分数X=554。试问:参加这个辅导 班对学生的SAT分数有影响吗?
554 500 Z 2.16 100 16 决策规则(如图),如果 Z>Z0.05 拒绝H0
z 0.05 1.64
Z 2.16 Z0.05 1.64
因为检验统计量Z的数值落在拒绝域,所以拒绝H0。 证据显示,参加辅导班对学生的SAT分数有显著影响。
30
(2)解: H0:μ=500;H1: μ>500 α=0.01,正态总体,小样本n=16,X=554,σ=100 在H0为真的情况下,构造检验统计量: X Z ~ N (0,1) n
H0:
Back 11
二、接受域和拒绝域
假设设定之后,我们需要一个判别标准,判断拒绝或 接受H0。利用“小概率原理”,指发生概率很小的随机 事件,在一次试验中几乎是不可能发生的。如果发生 了,就可以拒绝提出的原假设。
例如:有一个厂商声称其产品的合格品率很高,可以达到 99%,则从一批产品(100件)中随机抽取1件,该件是次品 的概率就非常小,只有1%。
平均数的差异性 t 检验
主讲人:朱
丹
假设检验
你相信他们的说法吗? 你要如何去证明这些说法 是正确或是错误?
对总体参数、分布形式、相互关系等提出假 设,然后利用样本数据来判断该假设论述的 合理性。
• 假设来西藏旅游的外国旅客平均消费支出8000元。 • 有人提出拉萨市民人均月收入是2500元。 • 有人提出西藏大学学生的平均IQ测验分数是110。
Back 21
计算的检验统计量数值
六、正确表述统计决策结果
统计决策得出:拒绝或不拒绝H0。
“不拒绝H0”不等同于“接受H0”
“不拒绝H0”只是说明根据现有样本不能认为H0
有问题,但重新抽取一个样本就有可能推翻H0。
如果说成“接受H0”,就等于认为H0在任何条件
下都是成立的。
没能拒绝H0,只是表示现有样本提供的证据还不
Back 17
四、假设检验的步骤
Step1:提出原假设 H0 和备择假设 H1
例如:H0:μ=μ0;H1:μ≠μ0
Step2:确定显著性水平α
是决策中的风险。主观确定。 α一般取0.05或0.01。
18
四、假设检验的步骤
Step3:选择检验统计量(Test Statistic)
假设检验也是从抽样分布出发,借由样本数据
检验统计量所有可能取值分两为部分,可以拒绝H0 的检验统计量取值的集合称拒绝域。反之,称接受 域,不拒绝H0。划分的数值称临界值。
接受域的区间概率1-α,拒绝域的区间概率α。
如何定义接受域和拒绝域?
13
双侧假设检验的拒绝域定义:
H0:μ=μ0; H1:μ≠μ0
•只要μ>μ0或μ<μ0,二者 之一成立,就可以否定H0。
在H0为真的情况下,构造检验统计量:
X Z ~ N (0,1) n
由样本数据计算检验统计量的数值:
69 65 Z 4 10 100
决策规则(如图),如果 Z>Z0.05 拒绝H0
z 0.05 1.64
Z 4 Z0.05 1.64
因为检验统计量Z的数值落在拒绝域,所以拒绝H0。 证据显示,参加培训后可以提高词汇记忆任务的成绩。
(σ已知)
(σ未知)
【例】
25
例题(★★★)
对大批学生进行词汇记忆考查,得到总体均值 μ=65,标准差σ=10。现抽取样本容量n=100的 样本,对其进行记忆技巧培训后,得到样本均 值X=69。试问:该培训是否能够提高词汇记 忆任务的成绩。( α=0.05 )
26
解:
H0:μ=65;H1: μ>65 α=0.05,因为 n=100为大样本,X=69,σ=10
足以拒绝它而已。
故常用“拒绝H0”或“不拒绝H0”的表述方式。
Back 22
第二节 单一总体均值的假设检验
单一总体,关于定量数据的检验。
西藏外国旅客平均旅游消费支出5000元? 经管学院毕业生平均起薪为每月2500元? 女性消费者每年在化妆品的平均支出3500元? 2010级统计学平均成绩为70分?
统计软件给出检验统计量的数值时,一般都给出该 检验统计量数值的p值。
以Zobs表示Z统计量的观测值: 双侧检验時p值=P(|Z|≥ Zobs) 右侧检验时p值=P(Z≥ Zobs)
p值/2
p值/2
α/2
-1.96
1 -α
α/2
1.96(临界值)
以p值进行假设检验: p值>α,接受H0 p值<α ,拒绝H0
8
一、建立假设
H0和H1是互斥的,主要有三种情况:
双侧或双尾假设检验(two-tailed test)
H0:μ=2500 ,H1:μ≠2500 ≤2500 ,H1:μ>2500
单侧或单尾假设检验(one-tailed test)
右侧假设检验: H0:μ
左侧假设检验:
H1: μ ≥2500 ,H1:μ<2500
23
第二节 单一总体均值的假设检验
1. 大样本
2. 小样本的正态总体,σ已知
3. 小样本的正态总体,σ未知
假设检验步骤相同,主要区别在于选择适当的 检验统计量,以利确定临界值和定义拒绝域。
Back 24
1.大样本
检验统计量:
X Z ~ N 0,1 n
X Z ~ N 0,1 S n
Back 16
三、两类错误
弃真错误
如前例,厂商声称产 品合格率是99%。100 件中确实只有1件次品。 进行抽样时,刚好1次 被抽到次品,这种错 误称弃真错误(第Ⅰ 类错误),错误概率 是1%(α)。
取伪错误
厂商声称产品合格率 是99%,实际上仅有 90%,表示100件中有 10件次品。为了检验 厂商宣称是否真实, 我们随机抽取20件产 品,结果都是合格品, 于是我们推断厂商宣 称是真实的。犯第二 类错误,错误概率β。
临界值
z
右侧检验图
×
右侧假设检验拒绝域在右边, 左侧假设检验拒绝域在左边。 右侧检验拒绝域:Z
0 0
Z
Back 15
左侧检验拒绝域: Z
Z
三、两类错误
以样本统计量推论总体参数,因为样本数据具随机性, 存在判断正确和错误的四种概率:
判 断 接受 H 0 拒绝 H 0
实
际
1 (正确判断) (弃真错误)
Step5:建立决策准则,进行判断
根据α值和抽样分布,确定临界值。
将检验统计量的数值与临界值相比较,做出
是否拒绝H0的判断。
或以检验统计量计算p值,确定是否拒绝H0 。
Back 20
五、p值(p-value)
p值:H0为真时,由样本数据给出的犯第Ⅰ类错误 的概率的精确数值(观察到的显著性水平)。
3.小样本的正态总体,σ未知
检验统计量:
X t ~ t n 1 S n
z
×
2
×
z
2
z
2
•它有两个拒绝域,两个临界值, 每个拒绝域的概率α/2 。 •在抽样分布两端各α/2位置上 确定拒绝域边界的临界值。
临界值
拒绝域: Z Baidu Nhomakorabea Z 0 or
2
Z 0 Z
2
14
样本数据计算出来的统计量Z0落在拒绝域,则拒绝H0 。
单侧假设检验的拒绝域定义:
•单侧检验有一个拒绝域,一个 临界值,拒绝域的概率α 。 •在抽样分布某一端的α位置上 确定拒绝域边界的临界值。
如果有人对用户说:灯泡的平均使用寿命低于1600hr。 此时,用户要研究的是μ是否会小于1600hr。
提出假设:
H0:μ=1600; H1:μ<1600
10
思考题:
想要检验女性职员平均体重是否大于55公 斤,如何提出原假设和备择假设?
H0:μ=55; H1:μ>55 μ≦55;H1:μ>55
或
如果厂商的宣称是真的,随机抽取1件是次品的情况几乎是 不可能发生的。如果这种情况发生了,我们就有理由怀疑 原来的假设是否成立,这时我们可以推翻原来的假设。
当然,推论也可能犯错误,确实有1件次品,刚好1次被抽 到,这种错误概率是1%(显著水平)。
12
二、接受域和拒绝域
以统计量(称检验统计量,test statistic)的抽 样分布为基础,给定小概率α ,判断样本数据 是否接受H0。
(1)以α=0.05 为检验标准,进行检验。
(2)以α=0.01 为检验标准,结论有变化吗?
29
(1)解: H0:μ=500;H1: μ>500 α=0.05,正态总体,小样本n=16,X=554,σ=100 在H0为真的情况下,构造检验统计量:
X Z ~ N (0,1) n
由样本数据计算检验统计量的数值:
为检验此论述,进行随机抽样调查, 以样本数据检验此假设是否成立。
2
假设检验
产生假设检验的原因大致有两个:
当对总体参数的真实性感到怀疑,需要通过 样本来考察其正确与否时,往往借助于假设 检验做出判断(决策)。 当对变量间存在某种关系的证据(平均值之 差、方差之比等)怀疑时,也会要求进行假 设检验。
Back5
一、建立假设
原假设/虚无假设(null hypothesis):H0
研究者要收集证据予以反对的假设。 将研究结果无效的说法作为原假设。
设定总体参数等于某一数值。
认为两个或两个以上总体参数相等。
H0:μ=2500 H 0 : μ 1 = μ2
OR
H0:μ≥2500 (收入)
此时,H0:员工满意度和性别无关
7
一、建立假设
备择假设(alternative hypothesis) :H1
研究者要收集证据予以支持的假设。 将研究结果有效的假设作为备择假设。
与原假设对立,是要研究的问题。
强调差异或方向性。
例如,某品牌洗涤剂的产品, H1:μ<500
例如, H1:员工满意度和性别有关
H 0 为真
(取伪错误) 1 (正确判断)
H 0 为假
弃真错误又称第I类错误(Type I error)。 取伪错误又称第II类错误(Type II error)。
假设检验时,希望正确判断并减少犯错误的概率。通过 控制α(显著性水平,level of significance)减少犯错, 此种检验称显著性检验。
双侧检验或单侧检验,根据H1来定。
9
例如:灯泡厂商在给用户提供一批灯泡时声称,该 批灯泡的平均使用寿命是1600hr。为验证厂商的说 法,需要用样本数据进行检验。
提出假设: H0:μ=1600; H1:μ≠1600
如果样本数据很接近1600hr,则可以接受H0;如果 样本数据离1600hr很远,就会拒绝H0,接受H1。
3
第六章 假设检验
第一节 假设检验原理 第二节 单一总体均值的假设检验 第三节 两个总体均值差的假设检验 第四节 总体比例与方差的假设检验 第五节 SPSS在假设检验中的应用
4
第一节 假设检验原理
一、建立假设 二、接受域和拒绝域 三、两类错误 四、假设检验的步骤 五、p值(p-value) 六、正确表述统计决策结果
由样本数据计算检验统计量的数值:
554 500 Z 2.16 100 16 决策规则(如图),如果 Z>Z0.01 拒绝H0
z 0.01 2.33
Z 2.16 Z0.01 2.33
因为检验统计量Z的数值落在接受域,所以不拒绝H0。 证据显示,参加辅导班对学生的SAT分数没有影响。
(1会计,2企管,统计学成绩)
“等号”始终在H0。
6
一、建立假设
例如:你对某品牌洗涤剂的产品标签中声称: “平均净含量不低于500克”,感到质疑。
你想要证实“平均净含量不足500克”。即你想
要推翻的是μ≥500克,要证实μ<500克。
此时,H0:μ≥500
例如:你研究认为员工满意度和性别有关,你 想要以样本数据来支持你的论点。
计算检验统计量的数值进行推断。
确定H0为真时,检验统计量服从的抽样分布。
• 例如:总体服从正态分布,且σ已知,则构 造检验统计量Z,在H0为真的情况下,有
X 0 Z ~ N 0,1 n
可以确定临界值,构 造拒绝域和接受域。
19
四、假设检验的步骤
Step4:计算检验统计量的数值
根据样本数据计算检验统计量的数值。
Back 27
2.小样本的正态总体,σ已知
检验统计量:
X Z ~ N 0,1 n
【例】
28
例题()
SAT测验分数遵从μ=500,σ=100的正态分布。一 位老师办辅导班,希望能够提高学生的SAT分数。 随机抽取16个学生参加他的辅导班,其参加测验 后得到的平均分数X=554。试问:参加这个辅导 班对学生的SAT分数有影响吗?
554 500 Z 2.16 100 16 决策规则(如图),如果 Z>Z0.05 拒绝H0
z 0.05 1.64
Z 2.16 Z0.05 1.64
因为检验统计量Z的数值落在拒绝域,所以拒绝H0。 证据显示,参加辅导班对学生的SAT分数有显著影响。
30
(2)解: H0:μ=500;H1: μ>500 α=0.01,正态总体,小样本n=16,X=554,σ=100 在H0为真的情况下,构造检验统计量: X Z ~ N (0,1) n
H0:
Back 11
二、接受域和拒绝域
假设设定之后,我们需要一个判别标准,判断拒绝或 接受H0。利用“小概率原理”,指发生概率很小的随机 事件,在一次试验中几乎是不可能发生的。如果发生 了,就可以拒绝提出的原假设。
例如:有一个厂商声称其产品的合格品率很高,可以达到 99%,则从一批产品(100件)中随机抽取1件,该件是次品 的概率就非常小,只有1%。
平均数的差异性 t 检验
主讲人:朱
丹
假设检验
你相信他们的说法吗? 你要如何去证明这些说法 是正确或是错误?
对总体参数、分布形式、相互关系等提出假 设,然后利用样本数据来判断该假设论述的 合理性。
• 假设来西藏旅游的外国旅客平均消费支出8000元。 • 有人提出拉萨市民人均月收入是2500元。 • 有人提出西藏大学学生的平均IQ测验分数是110。
Back 21
计算的检验统计量数值
六、正确表述统计决策结果
统计决策得出:拒绝或不拒绝H0。
“不拒绝H0”不等同于“接受H0”
“不拒绝H0”只是说明根据现有样本不能认为H0
有问题,但重新抽取一个样本就有可能推翻H0。
如果说成“接受H0”,就等于认为H0在任何条件
下都是成立的。
没能拒绝H0,只是表示现有样本提供的证据还不
Back 17
四、假设检验的步骤
Step1:提出原假设 H0 和备择假设 H1
例如:H0:μ=μ0;H1:μ≠μ0
Step2:确定显著性水平α
是决策中的风险。主观确定。 α一般取0.05或0.01。
18
四、假设检验的步骤
Step3:选择检验统计量(Test Statistic)
假设检验也是从抽样分布出发,借由样本数据
检验统计量所有可能取值分两为部分,可以拒绝H0 的检验统计量取值的集合称拒绝域。反之,称接受 域,不拒绝H0。划分的数值称临界值。
接受域的区间概率1-α,拒绝域的区间概率α。
如何定义接受域和拒绝域?
13
双侧假设检验的拒绝域定义:
H0:μ=μ0; H1:μ≠μ0
•只要μ>μ0或μ<μ0,二者 之一成立,就可以否定H0。
在H0为真的情况下,构造检验统计量:
X Z ~ N (0,1) n
由样本数据计算检验统计量的数值:
69 65 Z 4 10 100
决策规则(如图),如果 Z>Z0.05 拒绝H0
z 0.05 1.64
Z 4 Z0.05 1.64
因为检验统计量Z的数值落在拒绝域,所以拒绝H0。 证据显示,参加培训后可以提高词汇记忆任务的成绩。
(σ已知)
(σ未知)
【例】
25
例题(★★★)
对大批学生进行词汇记忆考查,得到总体均值 μ=65,标准差σ=10。现抽取样本容量n=100的 样本,对其进行记忆技巧培训后,得到样本均 值X=69。试问:该培训是否能够提高词汇记 忆任务的成绩。( α=0.05 )
26
解:
H0:μ=65;H1: μ>65 α=0.05,因为 n=100为大样本,X=69,σ=10
足以拒绝它而已。
故常用“拒绝H0”或“不拒绝H0”的表述方式。
Back 22
第二节 单一总体均值的假设检验
单一总体,关于定量数据的检验。
西藏外国旅客平均旅游消费支出5000元? 经管学院毕业生平均起薪为每月2500元? 女性消费者每年在化妆品的平均支出3500元? 2010级统计学平均成绩为70分?
统计软件给出检验统计量的数值时,一般都给出该 检验统计量数值的p值。
以Zobs表示Z统计量的观测值: 双侧检验時p值=P(|Z|≥ Zobs) 右侧检验时p值=P(Z≥ Zobs)
p值/2
p值/2
α/2
-1.96
1 -α
α/2
1.96(临界值)
以p值进行假设检验: p值>α,接受H0 p值<α ,拒绝H0
8
一、建立假设
H0和H1是互斥的,主要有三种情况:
双侧或双尾假设检验(two-tailed test)
H0:μ=2500 ,H1:μ≠2500 ≤2500 ,H1:μ>2500
单侧或单尾假设检验(one-tailed test)
右侧假设检验: H0:μ
左侧假设检验:
H1: μ ≥2500 ,H1:μ<2500
23
第二节 单一总体均值的假设检验
1. 大样本
2. 小样本的正态总体,σ已知
3. 小样本的正态总体,σ未知
假设检验步骤相同,主要区别在于选择适当的 检验统计量,以利确定临界值和定义拒绝域。
Back 24
1.大样本
检验统计量:
X Z ~ N 0,1 n
X Z ~ N 0,1 S n
Back 16
三、两类错误
弃真错误
如前例,厂商声称产 品合格率是99%。100 件中确实只有1件次品。 进行抽样时,刚好1次 被抽到次品,这种错 误称弃真错误(第Ⅰ 类错误),错误概率 是1%(α)。
取伪错误
厂商声称产品合格率 是99%,实际上仅有 90%,表示100件中有 10件次品。为了检验 厂商宣称是否真实, 我们随机抽取20件产 品,结果都是合格品, 于是我们推断厂商宣 称是真实的。犯第二 类错误,错误概率β。
临界值
z
右侧检验图
×
右侧假设检验拒绝域在右边, 左侧假设检验拒绝域在左边。 右侧检验拒绝域:Z
0 0
Z
Back 15
左侧检验拒绝域: Z
Z
三、两类错误
以样本统计量推论总体参数,因为样本数据具随机性, 存在判断正确和错误的四种概率:
判 断 接受 H 0 拒绝 H 0
实
际
1 (正确判断) (弃真错误)
Step5:建立决策准则,进行判断
根据α值和抽样分布,确定临界值。
将检验统计量的数值与临界值相比较,做出
是否拒绝H0的判断。
或以检验统计量计算p值,确定是否拒绝H0 。
Back 20
五、p值(p-value)
p值:H0为真时,由样本数据给出的犯第Ⅰ类错误 的概率的精确数值(观察到的显著性水平)。