第六讲假设检验基础

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

t检验的前提条件
当样本量较小时（N＜60），
样本符合正态或近似正态分布或
样本来自正态总体
两样本所对应的两总体方差相等（即两总体方差差异无统计学意义，简称方差齐）个体独立性即样本中无重复记录
单一总体均值的假设检验(大样本)
当样本来自正态总体或数据符合正态分布时，样本均数同样会符合正态分布，如样 X 本含量较大，此时对数据进行u= / n ，则 u值符合标准正态分布，这种假设检验又称为u检验。如果总体标准差未知，则可用样本标准差S 加以代替
重点讲解：
假设检验的基本步骤； t检验（总体均数与样本均数比较的t检验，配对t检验，成组t检验）；两大样本均数比较的u检验
一般介绍：
两样本方差齐性检验； t’检验；成组设计两样本几何均数比较的t检验
假设检验的概念与原理
例1
某商家宣称他的一大批鸡蛋“变质率低于1%”，现在要想判断一下商家有没有说谎即这批鸡蛋的“变质率”到底是低于1%还是高于1%，我们应该怎么办呢？
两个总体均值差异的假设检验
当两个样本均为小样本时，可用t检验
t ( X 1 X 2 ) ( 1 2 ) S1 S2 n1 n2
2 2
两个总体均值差异的假设检验
假设检验的步骤
建立假设，确定检验水准
H0：1=2 H1：1≠2 =0.05
计算统计量t值
假设检验
hypothesis test 毛广运 MD & PhD
环境与公共卫生学院
目的与要求
掌握：
假设检验的原理和基本步骤；
t检验和u检验
熟悉：
Ⅰ型错误、Ⅱ型错误和检验效能的概念；可信区间和假设检验的区别和联系
了解：
t’检验
教学内容
详细讲解：
假设检验的基本步骤； t检验和u检验；假设检验中的两类错误（Ⅰ型错误和Ⅱ型错误）；假设检验应注意的问题
确定P值，下结论
将t值与t/2,进行比较，如果t≥ t/2, ，则存在P≤，则时就有理由拒绝H0，接受H1；反之则不能拒绝H0。
两个总体均值差异的假设检验
配对设计资料
常见于
患者服用某种药物治疗前后工人经过技术培训前后的工作效率等首先求出每对观察值的差值d及其均数和标准差
要想正确的回答这个问题，就必须进行假设检验
假设检验的概论与原理
假设检验的概念
事先作出一个关于总体均数或总体率的假设，然后利用样本信息来判断原假设是否合理，从而决定是否接受原假设的统计推断过程。
假设检验又称为显著性检验
与参数估计均为统计推断的重要组成部分
参数估计解决的是总体均数或总体率多大？
增大样本含量为什么会同时减小两类错误？
抽样误差主要是通过标准误加以体现
标准误的公式 x

一个总体的标准差始终都是固定的，通过上述公式我们知道如果增大样本含量n，则分母变大，最终标准误的值(即抽样误差)就会减小，必然导致两类错误的同时减小。
n
检验功效
检验功效（power of a test）
增大样本含量为什么会同时减小两类错误？
假设检验的两类错误缘自何处？如果进行普查会不会有两类错误的发生？
如果进行普查的话，则可以直接得到两个或多个总体的均数，此时再判断其是否相同会不会犯错误？(肯定不会) 抽样调查与普查的主要区别之一就在于抽样调查存在抽样误差，那么抽样调查中的两类错误则主要是由抽样误差所导致的。抽样误差越大，则犯两类错误的概率就越大。
假设检验的步骤
建立检验假设并确定检验水准
H0：从事铅作业工人的血红蛋白与正常人群平均值140g/L，即μ=140 g/L H1 ：从事铅作业工人的血红蛋白高于正常人群平均值140 g/L，即μ>140 g/L
检验水准（size of a test）
α=0.05 或0.01
假设检验的步骤
统计量
t
d d
2 ( d d ) i
n 1
/ n
两个总体均值差异的假设检验
假设检验的步骤
建立假设，确定检验水准
H0：d=0 H1：d≠0
=0.05
计算统计量t值确定P值，下结论
将t值与t/2,进行比较，如果t≥ t/2, ，则存在P≤，则时就有理由拒绝H0，接受H1；反之则不能拒绝H0。
如何决定单、双侧检验？
假设检验的目的是推断若干个或是否相同
选择单侧检验的情况
某个参数是否大于其它参数？如铅作业人员的血铅水平是否高于一般人群。某个参数是否小于其它参数？如苯作业人员的血相是否低于一般人群。
绝大多数情况下均选择双侧检验。
同等情况下选择双侧检验较单侧检验犯Ⅰ类错误的概率更小
无效假设：(H0)
备择假设：(H1)
=0.05
选择单侧还是双侧检验
计算检验统计量
确定P值，作出统计推断
假设检验的步骤
假设检验的推断结论是对“H0是否真实”作出判断。如果P值小于或等于检验水准α，意味着在H0成立的前提下发生了小概率事件，根据“小概率事件在一次随机试验中不（大）可能发生”的推断原理，怀疑H0的真实性，从而做出拒绝（reject） H0的决策。因为H0与H1是对立的，既然拒绝H0 ，就只能接受 H1 。如果P值大于α，在H0成立的假设下发生较为可能的事件，没有充足的理由对H0提出怀疑。于是做出不拒绝H0的决策。
当样本来自正态总体或数据符合正态分布时，样本均数同样会符合正态分布，如样 X t 本含量较小，此时对数据进行 S / n ，则t 值符合t分布，这种假设检验又称为t检验。
0
如果总体标准差未知，则可用样本标准差S加以代替
假设检验步骤
建立假设，确定检验水准
H0：=0
H1：≠0 =0.05
假设检验的两类错误
Ⅰ类错误
拒绝了实际上成立的H0，“弃真”
Ⅱ类错误
不拒绝实际上不成立的H0，“存假”
两者关系
Ⅰ类错误与Ⅱ类错误的值成反变关系只有增加样本量才能同时减小两者的值，为什么？
推断结论和两类错误
实际情况 H0真 H0 不真检验结果拒绝H0 第Ⅰ类错误 (α) 结论正确 (1-β) 不拒绝H0 结论正确(1-α) 第Ⅱ类错误（β）
12
n1

22
n2
如果未知，则可用S代替
目前更多的是使用统计软件进行假设检验
两个总体均值差异的假设检验
假设检验的步骤
建立假设，确定检验水准
H0：1=2 H1：1≠2 =0.05
计算统计量u值
确定P值，下结论
将u值与u/2进行比较，如果u≥ u/2，则存在P≤，则时就有理由拒绝H0，接受H1；反之则不能拒绝H0。
假设检验主要推断质的不同即总体均数间是否相同
联系
可信区间同样可以回答假设检验的问题
可信区间如包含了H0，则按水准，不拒绝H0，否则拒绝H0，接受H1
可信区间可以比假设检验提供更多的信息
可信区间和假设检验
可信区间在回答差别有无统计学意义的同时，还可以提示差别是否具有实际意义
一般情况下对同一检验水准α ，功效大的检验方法更可取
power不足是很多理论上本该得出阳性结果而实际工作中却为阴性结果的最主要原因
必须给予足够的重视
假设检验的注意事项
基线是否均衡、可比(即是否具有同质性)
检验方法要正确
所用的检验方法必须首先满足其前提条件
正确理解差异有无显著性的统计学意义
-2
-1
0
1
2
3
4
5
不同自由度下的t分布图
假设检验的基本步骤
例3-5 某医生测量了36名从事铅作业男性工人的血红蛋白含量，算得其均数为 130.83g/L，标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L？
假设检验的步骤
建立假设，确定检验水准
计算统计量 (假定H0成立）
t检验的统计量t
t=2.14
自由度:
n 1 36 1 35
确定P值，给出结论
P值的意义是: 假定H0成立的情况下，统计量＞t界值或 H0真正成立的可能性（概率）有多大？自由度为35 ,查附表2,得到:
单侧 t 0.5(35) 0.682 ，得知P<0.05。
差异具有显著性不表示差距很大
差异是否具有显著性受样本量的影响
假设检验的注意事项
结论不能绝对化
统计学的结论不同于数学上的结论
结论具有概率性，允许犯概率≤的错误
需与专业知识结合起来分析
合理选择单、双侧检验
可信区间和假设检验
区别
可信区间主要推断量的大小即总体均数多大
计算统计量t值确定P值，下结论
将t值与t/2,进行比较，如果t≥ t/2, ，则存在P≤，则时就有理由拒绝H0，接受H1；反之则不能拒绝H0。
两个总体均值差异的假设检验
独立样本（成组设计资料）
当两个已知或均为大样本，可用u检验
u
( X 1 X 2 ) ( 1 2 )
假设检验的基本原理与步骤
1
Mean1
Mean1≠Mean2
？
1=2 1≠2
=
2 Mean2
x
Mean1≠Mean2 Mean1≠Mean2
自由度（υ）一定时，p 与 t 成反比;
υ=∞ (标准正态分布)
f(t)
υ=5
0.3
υ=1
0.2
概率一定时， υ与 t 成反比
0.1
-5
-4
-3
上图中，可信区间(1)～(3)均不包含H0，意味着相应的差异具有统计学意义，(4)与(5)均无统计学意义
» (1)还提示差异具有实际意义； » (2)提示可能具有实际意义；
» (3)提示实际意义不大；
» (4)提示样本量不足。 » (5)属于可以接受原假设的情况。
假设检验示意图
假设检验常用方法(单一或两样本)
U检验
常用于大样本（N≥30或N≥50）
t检验
常用于小样本（N＜30或N＜50）事实上样本量无论多大均可以使用t检验，只是在大样本时，t检验的结论与U检验基本相同（U分布是t分布的特例，U检验也是t检验的特例），且U检验远比t检验简单（手工法），故此时多用U检验。目前多采用统计软件，故基本上已无人再使用U检验。
定义：如果1≠2,按检验水平α 能够检验出 1≠2的能力。计算公式：power=1-
目前已基本不用手工计算，主要使用统计软件
交叉设计检验功效示意图
Hale Waihona Puke Baidu
检验效能
意义：
如果1-β =0.90，则意味着当H0不成立时，理论上在每100次抽样中，在α 的检验水准上平均有90次能拒绝H0。
假设检验解决的是若干个总体均数或总体率间是否有显著性差异？
假设检验的基本思想
假设我们要推断1与2是否相同，那么1与2间的关系只可能是1=2或1≠2这两种情况；统计学家的经历证实直接寻找1≠2的证据很难；利用反证法的原理，如果我们事先假设1=2，借助于概率论的原理，利用适当的统计方法判断此假设成立的概率P有多大，如果P≤0.05(小概率事件)，那么就可以认为原假设是错误的，即可以认为1≠2；如果 P>0.05，则可以原假设成立。
假设检验的步骤
建立假设，确定检验水准
H0：=0
H1：≠0 =0.05
计算统计量u值确定P值，下结论
将u值与u/2进行比较，如果u≥ u/2，则存在P≤，则时就有理由拒绝H0，接受H1；反之则不能拒绝H0。
确定P值示意图
u/2界值
单一总体均值的假设检验(小样本)
假设检验的步骤
由于P<0.05(α) ，意味着H0成立的情况下出现了小概率事件，故有理由认为H0不成立，即铅作业工人的血红蛋白与正常人群平均值相同的概率较小（P＜0.05），有理由对H0提出怀疑，于是做出拒绝H0，接受H1的推断结论即可以认为铅作业工人的血红蛋白低于正常人群平均值。
无论做出哪一种推断结论（接受或是拒绝H0 ），都面临着发生判断错误的风险。这就是假设检验的两类错误

第六讲 假设检验基础

第六讲假设检验基础