第六讲 假设检验基础
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
t检验的前提条件
当样本量较小时(N<60),
样本符合正态或近似正态分布或
样本来自正态总体
两样本所对应的两总体方差相等(即两总 体方差差异无统计学意义,简称方差齐) 个体独立性即样本中无重复记录
单一总体均值的假设检验(大样本)
当样本来自正态总体或数据符合正态分布 时,样本均数同样会符合正态分布,如样 X 本含量较大,此时对数据进行u= / n ,则 u值符合标准正态分布,这种假设检验又称 为u检验。 如果总体标准差未知,则可用样本标准差S 加以代替
重点讲解:
假设检验的基本步骤; t检验(总体均数与样本均数比较的t检验,配对t检验,成组t检验); 两大样本均数比较的u检验
一般介绍:
两样本方差齐性检验; t’检验; 成组设计两样本几何均数比较的t检验
假设检验的概念与原理
例1
某商家宣称他的一大批鸡蛋“变质率低于1%”, 现在要想判断一下商家有没有说谎即这批鸡蛋 的“变质率”到底是低于1%还是高于1%,我 们应该怎么办呢?
两个总体均值差异的假设检验
当两个样本均为小样本时,可用t检验
t ( X 1 X 2 ) ( 1 2 ) S1 S2 n1 n2
2 2
两个总体均值差异的假设检验
假设检验的步骤
建立假设,确定检验水准
H0:1=2 H1:1≠2 =0.05
计算统计量t值
假设检验
hypothesis test 毛广运 MD & PhD
环境与公共卫生学院
目的与要求
掌握:
假设检验的原理和基本步骤;
t检验和u检验
熟悉:
Ⅰ型错误、Ⅱ型错误和检验效能的概念; 可信区间和假设检验的区别和联系
了解:
t’检验
教学内容
详细讲解:
假设检验的基本步骤; t检验和u检验; 假设检验中的两类错误(Ⅰ型错误和Ⅱ型错误); 假设检验应注意的问题
确定P值,下结论
将t值与t/2,进行比较,如果t≥ t/2, ,则存在P≤, 则时就有理由拒绝H0,接受H1;反之则不能拒绝H0。
两个总体均值差异的假设检验
配对设计资料
常见于
患者服用某种药物治疗前后 工人经过技术培训前后的工作效率等 首先求出每对观察值的差值d及其均数和标准差
要想正确的回答这个问题,就必须进行假 设检验
假设检验的概论与原理
假设检验的概念
事先作出一个关于总体均数或总体率的假设, 然后利用样本信息来判断原假设是否合理,从 而决定是否接受原假设的统计推断过程。
假设检验又称为显著性检验
与参数估计均为统计推断的重要组成部分
参数估计解决的是总体均数或总体率多大?
增大样本含量为什么会同时减小两类错误?
抽样误差主要是通过标准误加以体现
标准误的公式 x
一个总体的标准差始终都是固定的,通过 上述公式我们知道如果增大样本含量n,则 分母变大,最终标准误的值(即抽样误差)就 会减小,必然导致两类错误的同时减小。
n
检验功效
检验功效(power of a test)
增大样本含量为什么会同时减小两类错误?
假设检验的两类错误缘自何处?如果进行 普查会不会有两类错误的发生?
如果进行普查的话,则可以直接得到两个或多 个总体的均数,此时再判断其是否相同会不 会犯错误?(肯定不会) 抽样调查与普查的主要区别之一就在于抽样调 查存在抽样误差,那么抽样调查中的两类错误 则主要是由抽样误差所导致的。 抽样误差越大,则犯两类错误的概率就越大。
假设检验的步骤
建立检验假设并确定检验水准
H0:从事铅作业工人的血红蛋白与正常人群平 均值140g/L,即μ=140 g/L H1 :从事铅作业工人的血红蛋白高于正常人群 平均值140 g/L,即μ>140 g/L
检验水准(size of a test)
α=0.05 或0.01
假设检验的步骤
统计量
t
d d
2 ( d d ) i
n 1
/ n
两个总体均值差异的假设检验
假设检验的步骤
建立假设,确定检验水准
H0:d=0 H1:d≠0
=0.05
计算统计量t值 确定P值,下结论
将t值与t/2,进行比较,如果t≥ t/2, ,则存在P≤,则时就有理 由拒绝H0,接受H1;反之则不能拒绝H0。
如何决定单、双侧检验?
假设检验的目的是推断若干个或是否相同
选择单侧检验的情况
某个参数是否大于其它参数?如铅作业人员的血铅水 平是否高于一般人群。 某个参数是否小于其它参数?如苯作业人员的血相是 否低于一般人群。
绝大多数情况下均选择双侧检验。
同等情况下选择双侧检验较单侧检验犯Ⅰ类错误的概 率更小
无效假设:(H0)
备择假设:(H1)
=0.05
选择单侧还是双侧检验
计算检验统计量
确定P值,作出统计推断
假设检验的步骤
假设检验的推断结论是对“H0是否真实”作出判断。 如果P值小于或等于检验水准α,意味着在H0成立的 前提下发生了小概率事件,根据“小概率事件在一 次随机试验中不(大)可能发生”的推断原理,怀 疑H0的真实性,从而做出拒绝(reject) H0的决策。 因为H0与H1是对立的,既然拒绝H0 ,就只能接受 H1 。 如果P值大于α,在H0成立的假设下发生较为可能的 事件,没有充足的理由对H0提出怀疑。于是做出不 拒绝H0的决策。
当样本来自正态总体或数据符合正态分布 时,样本均数同样会符合正态分布,如样 X t 本含量较小,此时对数据进行 S / n ,则t 值符合t分布,这种假设检验又称为t检验。
0
如果总体标准差未知,则可用样本标准差S加 以代替
假设检验步骤
建立假设,确定检验水准
H0:=0
H1:≠0 =0.05
假设检验的两类错误
Ⅰ类错误
拒绝了实际上成立的H0,“弃真”
Ⅱ类错误
不拒绝实际上不成立的H0,“存假”
两者关系
Ⅰ类错误与Ⅱ类错误的值成反变关系 只有增加样本量才能同时减小两者的值,为什么?
推断结论和两类错误
实际情况 H0真 H0 不真 检验结果 拒绝H0 第Ⅰ类错误 (α) 结论正确 (1-β) 不拒绝H0 结论正确(1-α) 第Ⅱ类错误(β)
12
n1
22
n2
如果未知,则可用S代替
目前更多的是使用统计软件进行假设检验
两个总体均值差异的假设检验
假设检验的步骤
建立假设,确定检验水准
H0:1=2 H1:1≠2 =0.05
计算统计量u值
确定P值,下结论
将u值与u/2进行比较,如果u≥ u/2,则存在P≤, 则时就有理由拒绝H0,接受H1;反之则不能拒绝H0。
假设检验主要推断质的不同即总体均数间是否 相同
联系
可信区间同样可以回答假设检验的问题
可信区间如包含了H0,则按水准,不拒绝H0,否 则拒绝H0,接受H1
可信区间可以比假设检验提供更多的信息
可信区间和假设检验
可信区间在回答差别有无统计学意义的同时, 还可以提示差别是否具有实际意义
一般情况下对同一检验水准α ,功效大的检验 方法更可取
power不足是很多理论上本该得出阳性结果而 实际工作中却为阴性结果的最主要原因
必须给予足够的重视
假设检验的注意事项
基线是否均衡、可比(即是否具有同质性)
检验方法要正确
所用的检验方法必须首先满足其前提条件
正确理解差异有无显著性的统计学意义
-2
-1
0
1
2
3
4
5
不同自由度下的t分布图
假设检验的基本步骤
例3-5 某医生测量了36名从事铅作业男性 工人的血红蛋白含量,算得其均数为 130.83g/L,标准差为25.74g/L。问从事铅作 业工人的血红蛋白是否不同于正常成年男 性平均值140g/L?
假设检验的步骤
建立假设,确定检验水准
计算统计量 (假定H0成立)
t检验的统计量t
t=2.14
自由度:
n 1 36 1 35
确定P值,给出结论
P值的意义是: 假定H0成立的情况下,统计量>t界值或 H0真正成立的可能性(概率)有多大? 自由度为35 ,查附表2,得到:
单侧 t 0.5(35) 0.682 ,得知P<0.05。
差异具有显著性不表示差距很大
差异是否具有显著性受样本量的影响
假设检验的注意事项
结论不能绝对化
统计学的结论不同于数学上的结论
结论具有概率性,允许犯概率≤的错误
需与专业知识结合起来分析
合理选择单、双侧检验
可信区间和假设检验
区别
可信区间主要推断量的大小即总体均数多大
计算统计量t值 确定P值,下结论
将t值与t/2,进行比较,如果t≥ t/2, ,则存在P≤,则 时就有理由拒绝H0,接受H1;反之则不能拒绝H0。
两个总体均值差异的假设检验
独立样本(成组设计资料)
当两个已知或均为大样本,可用u检验
u
( X 1 X 2 ) ( 1 2 )
假设检验的基本原理与步骤
1
Mean1
Mean1≠Mean2
?
1=2 1≠2
=
2 Mean2
x
Mean1≠Mean2 Mean1≠Mean2
自由度(υ)一定时,p 与 t 成反比;
υ=∞ (标准正态分布)
f(t)
υ=5
0.3
υ=1
0.2
概率一定时, υ与 t 成反比
0.1
-5
-4
-3
上图中,可信区间(1)~(3)均不包含H0,意味着 相应的差异具有统计学意义,(4)与(5)均无统计 学意义
» (1)还提示差异具有实际意义; » (2)提示可能具有实际意义;
» (3)提示实际意义不大;
» (4)提示样本量不足。 » (5)属于可以接受原假设的情况。
假设检验示意图
假设检验常用方法(单一或两样本)
U检验
常用于大样本(N≥30或N≥50)
t检验
常用于小样本(N<30或N<50) 事实上样本量无论多大均可以使用t检验,只是在大样 本时,t检验的结论与U检验基本相同(U分布是t分布 的特例,U检验也是t检验的特例),且U检验远比t检 验简单(手工法),故此时多用U检验。 目前多采用统计软件,故基本上已无人再使用U检验。
定义:如果1≠2,按检验水平α 能够检验出 1≠2的能力。 计算公式:power=1-
目前已基本不用手工计算,主要使用统计软件
交叉设计检验功效示意图
Hale Waihona Puke Baidu
检验效能
意义:
如果1-β =0.90,则意味着当H0不成立时,理 论上在每100次抽样中,在α 的检验水准上平 均有90次能拒绝H0。
假设检验解决的是若干个总体均数或总体率间 是否有显著性差异?
假设检验的基本思想
假设我们要推断1与2是否相同,那么1与2间的 关系只可能是1=2或1≠2这两种情况; 统计学家的经历证实直接寻找1≠2的证据很难; 利用反证法的原理,如果我们事先假设1=2,借助 于概率论的原理,利用适当的统计方法判断此假设成 立的概率P有多大,如果P≤0.05(小概率事件),那么就 可以认为原假设是错误的,即可以认为1≠2;如果 P>0.05,则可以原假设成立。
假设检验的步骤
建立假设,确定检验水准
H0:=0
H1:≠0 =0.05
计算统计量u值 确定P值,下结论
将u值与u/2进行比较,如果u≥ u/2,则存在P≤,则时 就有理由拒绝H0,接受H1;反之则不能拒绝H0。
确定P值示意图
u/2界值
单一总体均值的假设检验(小样本)
假设检验的步骤
由于P<0.05(α) ,意味着H0成立的情况下出现了小 概率事件,故有理由认为H0不成立,即铅作业工 人的血红蛋白与正常人群平均值相同的概率较小 (P<0.05),有理由对H0提出怀疑,于是做出拒 绝H0,接受H1的推断结论即可以认为铅作业工人 的血红蛋白低于正常人群平均值。
无论做出哪一种推断结论(接受或是拒绝H0 ), 都面临着发生判断错误的风险。这就是假设检验 的两类错误