假设检验新知识点
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
v1.0 可编辑可修改假设检验
一、假设检验的概念
统计推断包括两大方面的内容,其一为参数估计(如总体均数的估计),另一方面,即假设检验(hypothesis test)。假设检验过去亦称显著性检验(significance test)。其基本原理和步骤用以下实例说明。
例为研究某山区成年男子的脉搏均数是否高于一般成年男子的脉搏均数。某医生在一山区随机抽查了 25名健康成年男子,求得其脉搏的均数为 74.2次/分,标准差为6.0次/分。根据大量调查,已知健康成年男子脉搏均数为72次/分;能否据此认为该山区成年男子的脉搏均数高于一般成年男子的脉搏均数
本例可用下图表示。
显然,本例其目的是判断是否μ>μ0。从所给条件看,样本均数X与已知总体均数μ0不等,造成两者不等的原因有二:
①非同一总体,即μ#μ0;
②同一总体即μ=μ0,两个均数不相等的原因在于抽样误差。
假设检验的目的就是要判断造成上面两个均数不等的原因是哪一个。也就是说,是解决样本均数代表性如何的问题。上例是,样本均数比已知总体均数大,有可能是由于抽样误差引起,也有可能是由于所调查的样本人群的生活环境、生活习惯、遗传或其他原因所致,如何判断呢,这就需要利用统计学方法----假设检验方法。假设检验也是统计分析的重要组成部分。
(提问:统计分析包括参数估计和假设检验)
下面我们以例题所提出的问题学习假设检验的基本步骤,同时学习样本均数与总体均数比较的t检验。
假设检验一般都是有“名”的,比如t检验,大家要知道假设检验的命名通常是以所要计算的统计量来命名的,如t检验、F检验、X2检验等。后面有进一步介绍。
二、假设检验的基本步骤
(三)选定检验方法,计算检验统计量
应根据研究目的、变量或资料类型、设计方案、检验方法的适用条件等选择检验方法,并计算统计量(test statistic)。如两均数比较可选用t检验,(当样本含量较大,如n>100时可用u检验;两样本方差比较可选用F检验、率的比较可选用u检验或x2检验。
(四)确定P值
从假设检验的整个逻辑推理过程可看出,P的含义是指从由H0规定的总体中随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值(如 t或u)的概率,可以简单地理解P的含义是H0成立的概率。
(五)作出统计推断
根据计算出的检验统计量,查相应的界值表即可得概率P。如上例,算得t=1.833,查表14-16,t界值表,先从横标目找到自由度υ=24一行,1. 833在界值与2.064之间,相对应纵标目的单尾P值分别为0.05与,得本例0.025< P< 0.05;余类推。
将获得的事后概率P,与事先规定的概率——检验水准α进行比较而得出结论。一般来说,推断的结论应包含统计结论和专业结论两部分。统计结论只说明有统计学意义(statistical significance)或无统计学意义
(statistical significance),而不能说明专业上的差异大小。它必须和专业结论有机地相结合,才能得出恰如其分、符合客观实际的最终结论。若P≤α,则结论为按所取的α检验水准,拒绝H0,接受H1,差别有统计学意义(统计结论),可认为……不同或不等(专业结论)。如例题得到0.025<P<0.05,按所取检验水准0.05,则拒绝H0,接受H1,有统计学意义,可认为该山区健康成年男子脉搏均数高于一般健康成年男子。若P>a,则结论为按α检验水准,不拒绝H。,无统计学意义(统计结论),还不能认为……不同或不等(专业结论)。
P>α过去称“无显著性”,在文献中常用 NS(non- significant/no- significant。)表示,也就是人们常说的“阴性结论”。注意:①虽然否定之否定为肯定,但不拒绝H0不等于完全接受H。,此时,尚没有足够的证据认为H。成立。从决策的观点:可认为暂时“接受”它,或“阴性待观察”。②下结论时,对H0只能说:拒绝(reject)或不拒绝(not reject);而对 H1只能说:接受 H1,除此之外的其它说法均不妥当。
三.计量资料的假设检验
假设检验的具体方法,通常以选定的检验统计量来命名。如检验统计量t和u分别对应于t检验(t-test,亦称Student’s t-test)和 u检验(u-test,亦称 Z-test)。假设检验方法的选择应根据不同的资料类型和性质,研究的目的等来确定。实际应用时,应弄清各种检验方法的用途、适用条件和注意事项。
前面我们学过,统计资料可分为计量资料、计数资料和等级资料三种,这三种不同类型的资料都有其相应的假设检验方法:
计量资料:常用t检验(u检验)、F检验(方差分析)等;
计数资料:X2检验等;
等级资料:秩和检验。
我们首先学习计量资料的假设检验。同样是计量资料,还有不同的检验方法,这主要是要根据具体的资料内容的研究目的来确定。一般来说,两均数比较用t检验,而两个以上均数的比较就必须用方差分析了。
t检验的应用条件:当样本含量n较小时(如n<= 50,理论上要求样本取自正态总体,两小样本均数比较时还要求两样本总体方差相等。但在实际应用时,与上述条件略有偏离,只要其分布为单峰近似对称分布,则对结果亦影响不大。u检验的应用条件:样本含量n较大, 一般要求n>50。其实,u检验和t检验都属同类,其方法步骤也基本相同,不同的地方仅在于确定P值时界值的选择。
(一)样本均数与总体均数比较的t检验
下面我们以例题提出的问题为例,学习假设检验的一般步骤方法、掌握样本均数与总体均数比较的t检验的过程。
在例题中,某医生在一山区随机抽查了 25名健康成年男子,其脉搏的均数为 74.2次/分,标准差为6.0次/分,这是一个样本。而已知的一般健康成人脉搏均数72次/分可作为总体均数。这是一个样本均数与已知总体均数比较的问题,故选用t检验方法。(有的同学会问,不是说总体均数一般为未知的吗是的,但医学上也有一些数据比较稳定、经过长时间研究应用的常数,如医学正常值、理论值、标准值,这些有时可作为总体均数来应用。)
①建立检验假设,确定检验水准
H0:µ=µ0,即山区成年男子平均脉搏数与一般成年男子相等
H1:µ>µ0,即山区成年男子平均脉搏数高于一般成年男子
α=0.05
③选定检验方法,计算检验统计量
因该例为计量资料且 n=25<50,故选用样本均数与总体均数比较的 t检验。已知 X=74.2次/分,S=6.0次/分,按下式计算统计量: t=(X-µ)/s x=