假设检验——非参数检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
假设检验(二)——非参数检验
假设检验的统计方法,从其统计假设的角度可分为两类:参数检验与非参数检验。上一节我们所介绍的Z 检验、t 检验,都是参数检验。它们的共同特点是总体分布正态,并满足某些总体参数的假定条件。参数检验就是要通过样本统计量去推断或估计总体参数。然而,在实践中我们常常会遇到一些问题的总体分布并不明确,或者总体参数的假设条件不成立,不能使用参数检验。这一类问题的检验应该采用统计学中的另一类方法,即非参数检验。非参数检验是通过检验总体分布情况来实现对总体参数的推断。
非参数检验法与参数检验法相比,特点可以归纳如下: (1)非参数检验一般不需要严格的前提假设; (2)非参数检验特别适用于顺序资料;
(3)非参数检验很适用于小样本,并且计算简单;
(4)非参数检验法最大的不足是没能充分利用数据资料的全部信息; (5)非参数检验法目前还不能用于处理因素间的交互作用。
非参数检验的方法很多,分别适用于各种特点的资料。本节将介绍几种常用的非参数检验方法。
一.2
χ检验
2χ检验主要用于对按属性分类的计数资料的分析,对于数据资料本身的分布形态不作任何
假设,所以从一定的意义上来讲,它是一种检验计数数据分布状态的最常用的非参数检验方法。
2χ检验的方法主要包括适合性检验和独立性检验。
(一)2
χ检验概述
2χ是实得数据与理论数据偏离程度的指标。其基本公式为:
∑-=e
e f f f 2
02
)(χ (公式11—9) 式中,0f 为实际观察次数,e f 为理论次数。
分析公式可知,把实际观测次数和依据某种假设所期望的次数(或理论次数)的差数平方,除以理论次数,求出比值,再将n 个比值相加,其和就是2
χ。观察公式可发现,如果实际观察
次数与理论次数的差异越小,2χ值也就越小。当0f 与e f 完全相同时,2
χ值为零。
2χ值的特点为:① 2χ值具有可加性。② 2χ值永远不会小于零。③ 2χ值的大小随着实
际次数与理论次数之差的大小而变化。
利用2
χ值去检验实际观察次数与理论次数的差异是否显著的方法称为2
χ检验。
2χ检验有两个主要的作用:第一,可以用来检验各种实际次数与理论次数是否吻合的问题,
这类问题统称为适合性检验;第二,判断计数的两组或多组资料是否相互关联还是相互独立的问题,这类问题统称为独立性检验。
2χ检验的具体步骤与t 检验基本相同。
第一,建立虚无假设。例如假定实测次数与理论次数无显著差异,差异仅由机会造成。 第二,计算理论次数,并求出2
χ值。
第三,统计推断。根据df 数目和选定的显著性水平,查2
χ值表得出超过实得2
χ值的概率。把概率的大小,作为接受或拒绝假设的依据。
表11—9 2
χ检验统计决断规则
(二)适合性检验
适合性检验是应用2
χ检验方法的一种。它主要适用于检验实际观测次数与理论次数之检查以是否显著,它所面对的研究对象主要是一个因素多项分类的计数资料,所以又称为单因素分类
2χ检验或单项表的2χ检验。适合性检验的种类主要有无差假设的适合性检验和实际次数分布
是否属于正态分布的适合性检验,下面逐一进行简要介绍。
1. 无差假设的适合性检验
所谓无差假设是指各项分类的次数没有差异,理论次数完全按概率相等的条件计算,即理论次数= 总数/分类项数
例1,随机抽取70名学生,调查他们对高中分文理科的意见,回答赞成的有42人,反对的有28人。问对分科的意见有无显著差异?
解:此例只有两种分类。因此应有理论次数e f =70×0.5=35(人) 检验步骤:
(1)建立假设: 0H :300==e f f , 1H :e f f ≠0 (2)计算2
χ值:
∑-=e
e f f f 202
)(χ=
8.235)3528(35)3542(2
2=-+- (3)统计推断。 首先确定自由度df ,2
χ检验的自由度一般等于分类项数减1,本例df =2 — 1 = 1。查df = 1的2
χ表,)
05.0,1(2χ
=3.84,故有 2χ<)
05.0,1(2
χ
,因此应在0.05显著性水
平上保留虚无假设,拒绝备择假设。其结论为:学生对高中文理分科的态度的差异不显著。
例2,某大学某系的46位老年教师中,健康状况属于良好的有15人,中等的有20人,比较差的有11人,问该系老教师中三种健康状况的人数是否一样?
解:此例有三种分类。因此应有理论次数e f = 3
46
= 18(人) 检验步骤:
(1)建立假设: 0H :健康状况好、中、差三种人数相同 1H :健康状况好、中、差三种人数不相同 (2)计算2
χ值:
∑-=e
e f f f 202
)(χ=
44.318)1811(18)1820(18)1815(2
22=-+-+- (3)统计推断。 首先确定自由度df ,本例df = 3— 1 = 2。查df = 2的2
χ表,
)05.0,2(2χ=5.99,故有 2χ<)05.0,2(2χ,因此应在0.05
显著性水平上保留虚无假设,拒绝备择
假设。其结论为:该系老教师中,健康状况好、中、差三种人数无显著差异。
2.实际次数分布是否属于正态分布的适合性检验
2χ检验还可以通过将正态分布的概率转换为理论次数的数值,来检验某些实际次数分布是
否属于正态分布。
例3,今对某校100名学生进行操行评定,分优、良、中、差四等,评定结果为:优19人、良39人、中35人、差7人。试检验其分布的形式是否属于正态分布?
解: 检验步骤:
(1)建立假设: 0H :评定结果服从正态分布 1H :评定结果不服从正态分布 (2)计算2
χ值:
首先需求出理论次数。正态分布的各部分理论次数,是通过正态分布图中面积比率乘以总次数得出的。在正态分布情况下,正态曲线底边上±3σ之内几乎包含了全部量数,因此我们可将正态分布底线长度从-3σ至+3σ分为四个等分,每等分为1.5σ,其面积比率为:
第一等分(优)的面积:上限3σ,下限为1.5σ。1.5σ~3σ之间的面积比率为: 0.4987-0.4332=0.0655,即7%。
第二等分(良)的面积:位于0~1.5σ之间,其面积比率为0.4332,即43%。 第三等分(中)的面积:位于0~-1.5σ之间,其面积比率为0.4332,即43%。
第四等分(差)的面积:位于-1.5σ~-3σ之间的面积比率为:0.4987-0.4332=0.0655,即7%。
根据各等分的面积比率,乘以总人数,即可得出理论次数。如:优的人数为7%×100=7,良的人数为43%×100=43。同理可求出中的人数为43,差的人数为7。即优的 e f =7,良的e f =43,中的e f =43,差的e f =7。代入(公式11—9)有:
=
2
χ43.227
)77(43)4335(43)4339(7)719(2
222=-+-+-+- (3)统计推断。 首先确定自由度df ,本例df = 4— 1 = 3。查df = 2的2
χ表,
)05.0,3(2χ=7.81,)01.0,3(2χ= 11.345,故有 2χ>)01.0,3(2χ,因此应在
0.01显著性水平上拒绝
虚无假设,接受备择假设。其结论为:此评定结果不服从正态分布。