假设检验——非参数检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
假设检验(二)——非参数检验
假设检验的统计方法,从其统计假设的角度可分为两类:参数检验与非参数检验。
上一节我们所介绍的Z 检验、t 检验,都是参数检验。
它们的共同特点是总体分布正态,并满足某些总体参数的假定条件。
参数检验就是要通过样本统计量去推断或估计总体参数。
然而,在实践中我们常常会遇到一些问题的总体分布并不明确,或者总体参数的假设条件不成立,不能使用参数检
验。
这一类问题的检验应该采用统计学中的另一类方法,即非参数检验。
非参数检验是通过检验总体分布情况来实现对总体参数的推断。
非参数检验法与参数检验法相比,特点可以归纳如下:
(1)非参数检验一般不需要严格的前提假设;
(2)非参数检验特别适用于顺序资料;
(3)非参数检验很适用于小样本,并且计算简单;
(4)非参数检验法最大的不足是没能充分利用数据资料的全部信息;
(5 )非参数检验法目前还不能用于处理因素间的交互作用。
非参数检验的方法很多,分别适用于各种特点的资料。
本节将介绍几种常用的非参数检验方法。
一.2检验
2
检验主要用于对按属性分类的计数资料的分析,对于数据资料本身的分布形态不作任何假设,所以从一定的意义上来讲,它是一种检验计数数据分布状态的最常用的非参数检验方法。
2
2
检验的方法主要包括适合性检验和独立性检验。
(一)2检验概述
2
是实得数据与理论数据偏离程度的指标。
其基本公式为:
2 ( f0 f e)(公式11—9)
f
e
式中,f0 为实际观察次数,f e 为理论次数。
分析公式可知,把实际观测次数和依据某种假设所期望的次数(或理论次数)的差数平方,除以理论次数,求出比值,再将n 个比值相加,其和就是2。
观察公式可发现,如果实际观察
次数与理论次数的差异越小, 2值也就越小。
当 f 0 与 f e 完全相同时,
2
值为零。
际次数与理论次数之差的大小而变化
利用
2
值去检验实际观察次数与理论次数的差异是否显著的方法称为
2
检验有两个主要的作第一,可以用来检验各种实际次数与理论次数是否吻合的
这类问题统称为适合性检验; 第二, 判断计数的两组或多组资料是否相互关联还是相互独立的问 题,这类问题统称为独立性检验。
2
检验的具体步骤与 t 检验基本相同。
第一,建立虚无假设。
例如假定实测次数与理论次数无显著差异,差异仅由机会造成。
第二,计算理论次数,并求出
2
值。
第三,统计推断。
根据 df 数目和选定的显著性水平, 查 2
值表得出超过实得 2
值的概率。
把概率的大小,作为接受或拒绝假设的依据。
表 11—9
2
检验统计决断规则
(二)适合性检验 适合性检验是应用
2
检验方法的一种。
它主要适用于检验实际观测次数与理论次数之检查
以是否显著, 它所面对的研究对象主要是一个因素多项分类的计数资料, 所以又称为单因素分类
2
检验或单项表的 2
检验。
适合性检验的种类主要有无差假设的适合性检验和实际次数分布 是否属
于正态分布的适合性检验,下面逐一进行简要介绍
2
值的特点为:①
2
值具有可加性。
②
2
值永远不会小于零。
③ 2
值的大小随着实
2
检验
1. 无差假设的适合性检验
所谓无差假设是指各项分类的次数没有差异, 理论次数完全按概率相等的条件计算, 即理论 次数 = 总数/分类项数
例 1 ,随机抽取 70 名学生,调查他们对高中分文理科的意见,回答赞成的有 42 人,反对的 有 28 人。
问对分科的意见有无显著差异?
解:此例只有两种分类。
因此应有理论次数 f e =70×0.5=35 (人)
检验步骤: ( 1)建立假设: H 0 : f 0 f e 30, H 1 : f 0 f e
(2)计算
2
值:
平上保留虚无假设,拒绝备择假设。
其结论为:学生对高中文理分科的态度的差异不显著。
例 2,某大学某系的 46 位老年教师中,健康状况属于良好的有 15 人,中等的有 20 人,比 较差的有 11 人,问该系老教师中三种健康状况的人数是否一样? 解:此例有三种分类。
因此应有理论
次数
f e = 46
= 18 (人)
e
3
检验步骤:
1)建立假设:
H 0 :健康状况好、中、差三种人数
H 1 :健康状况好、中、差三种人数不相同
2)计算 2
值:
22
(20 18)2 (11 18) 2
3.44
18 18
首先确定自由度 df ,本例 df = 3 — 1 = 2 。
查 df = 2 的
2
表,
2
(2,0.05) =5.99 ,故有
2
< 2
(2,0.05) ,因此应在 0.05 显著性水平上保留虚无假设,拒绝备择 假
设。
其结论为:该系老教师中,健康状况好、中、差三种人数无显著差异
2.实际次数分布是否属于正态分布的适合性检验
2
(f 0 f e )2 =
(42 35)2 (28 35) 35
2
2.8
35
3)统计推断。
首先确定自由度 df , 2
检验的自由度一般等于分类项数减 1 ,本例 df =2
— 1 = 1 。
查 df = 1 的
2
表, 2(1,0.05) =3.84 ,故有
2
(1,0.05) ,因此
0.05 显著性水
22
( f 0 f e ) (15 18) 18 3)统计推断
2
检验还可以通过将正态分布的概率转换为理论次数的数值,来检验某些实际次数分布是否属于正态分布。
例3 ,今对某校100 名学生进行操行评定,分优、良、中、差四等,评定结果为:优19 人、良39 人、中35 人、差7 人。
试检验其分布的形式是否属于正态分布?
解:
检验步骤:
(1)建立假设:H 0 :评定结果服从正态分布
H 1 :评定结果不服从正态分布
(2)计算2值:
首先需求出理论次数。
正态分布的各部分理论次数,是通过正态分布图中面积比率乘以总次数得出的。
在正态分布情况下,正态曲线底边上± 3 之内几乎包含了全部量数,因此我们可将正态分布底线长度从-3 至+3 分为四个等分,每等分为1.5 ,其面积比率为:
第一等分(优)的面积:上限3 ,下限为1.5 。
1.5 ~3 之间的面积比率为:
0.4987 -0.4332=0.0655 ,即7%。
第二等分(良)的面积:位于0~1.5 之间,其面积比率为0.4332 ,即43%。
第三等分(中)的面积:位于0 ~-1.5 之间,其面积比率为0.4332 ,即43%。
第四等分(差)的面积:位于-1.5 ~-3 之间的面积比率为:0.4987 -0.4332=0.0655 ,即7%。
根据各等分的面积比率,乘以总人数,即可得出理论次数。
如:优的人数为7%× 100=7,良的人数为43%×100=43。
同理可求出中的人数为43,差的人数为7。
即优的f e=7,良的f e=43,中的
f e=43,差的f e =7。
代入(公式11—9)有:
2 2 2 2
2 (19 7)2(39 43)2(35 43)2(7 7)222.43
7 43 43 722.43
(3 )统计推断。
首先确定自由度df ,本例df = 4 —1 = 3 。
查df = 2 的2表,
2
(3,0.05)=7.81 ,2
(3,0.01)= 11.345 ,故有
2
> 2(3,0.01),因此应在0.01 显著性水平上拒绝
虚无假设,接受备择假设。
其结论为:此评定结果不服从正态分布三)独立性检验
独立性检验也是2检验的一个重要应用。
如果想研究两个或两个以上因素之间是否具有独立性,就可利用2独立性检验。
独立性检验一般都采用表格的形式来显示观察结果,所以独立性检验也称为列联表分析。
当检验对象只有两个因素而且每个因素只有两项分类的列联表就称为2×2 列联表或四格表;而一个因素有R类,另一个因素有C类,这种表称之为R×C表。
本节
只讨论二维列联表的情况。
关于二维列联表的独立性检验,需注意几个问题:第一,独立性检验的虚无假设是二因素(或多元素)之间是独立的或无关联,被择假设是二因素(或多因素)自荐有关联或者说差异显著。
一般多用文字叙述而很少用符号代替。
第二,独立性检验的理论次数是直接由列联表所提供的数据推算出来的。
如果用f Ri表示第i 行的和,f Cj 表示第j 列的和,N 为所有数据值和,则第i 行第j 列的方格内的理论次数为:
f R i f C j
f e ij(公式11—10)
eij
N
第三,二维列联表自由度与二因素各自的分类项数有关。
设R为行分类项数(行数),C 为列分类项数(列数),则自由度为:df (R 1)(C 1)。
1.2× 2 列联表的独立性检验
2× 2 列联表就是把样本按两种性质分组,并排成两行两列的表,它是最简单的列联表,简称为四格表。
2×2 列联表用以进行两个组彼此独立互无关联的检验。
独立性检验下面我们从样本的不同情况出发,分别介绍相应的检验方法。
独立样本的2×2 列联表的独立性检验
独立样本4 格表的独立性检验,既可以用计算2的基本公式(公式11—9 )计算,也可用面的简捷公式计算:
2
2 =N (ad bc)
2
(公式11—11)
(a b)(c d )(a c)(b d )
式中:a,b, c, d 分别是四格表内的实计数
2
表11—10 2 × 2列联表的2值计算示意表
例4 ,设有甲乙两区,欲测验两区中学教学水平,各区随机抽取500 名初三学生,进行统一
试题的数学测验,其结果是:甲区及格学生为475 人,不及格为25 人;乙区及格学生460 人,不及格为40 人,问甲区中学与乙区中学的数学测验成绩的差异是否显著?
解:
检验步骤:
(1)建立假设:H 0 :甲区中学与乙区中学数学测验成绩无显著差异
H1 :甲区中学与乙区中学数学测验成绩差异显著
2)计算2值:
表11—11 甲区中学与乙区中学的数学测验成绩表
2 1000 (475 40 460 25)2
3.68
= 500 65 935 500
3)统计推断。
首先确定自由度df ,本例df =(2-1 )(2-1 )=1,查df =1 的2表,
2 2 2
2
(1,0.05) =3.84 ,故有 2<
2
(1, 0.05) ,因此应在 0.05 显著性水平上保留虚无假设,拒绝备择
假设。
其结论为:甲区中学与乙区中学数学测验成绩无显著差异。
例 5,随机抽取某校男生 250 名,女生 240 ,进行体育达标考核,结果如下表 问体育达标水平是否与性别有关?
表 11— 12 体育达标考核情况表
达标
未达标 合计
男 15 20 35 女 13 18 31 合计
28
38
66
解:检验步骤:
1)建立假设: H 0 :体育达标水平与性别无关
H 1 :体育达标水平与性别有关
2 2 2
(15 14.85)2 (20 20.15)2 (13 13.15) 2 14.85 20.15 13.15
3)统计决断: 首先确定自由度 df ,本例 df =1,查 df =1 的 2
表,
2
(1,0.05) =3.84 ,
故有 2
< 2
(1,0.05) ,因此应在 0.05 显著性水平上保留虚无假设,拒绝备择假设。
其结论为: 体育达标水平与性别无关。
相关样本的 2×2 列联表的独立性检验 相关样本 2 ×2 列联表的独立性检验的简捷
2)计算 2
值:利用基本公式
(f 0 f e )2
,
fe
,
其理论次数为:
f
e11 =
35 28
66
14.85 35 38 20.15 f
e21
31 28 13.15
66
f
e22
66
31 38
66
17.85 2
(18 17.85) 2
0.006
公式为:
例 6,110名教师培训普通话,培训 2天前后两次测验通过情况如下表,问 2 天的训练是否 有显著效果?
表 11— 13 40 天前后两次测验通过情况表
解:检验步骤:
1)建立假设: H 0 :2 天训练无显著效果
H 1 : 2天训练有显著效果
2)计算 2
值:
将上表中的数据代入(公式 11— 12),有:
22
2=
(b c )2 =
(26 24)2 0.08
b c 26 24
本例也可以用求理论次数的方法计算
2
值。
同一组教师两次测验结果只涉及到
b (第一次 通过而第二次未通过者)和
c (第一次未通过二第二次通过者) 。
根据虚无假设,
b c 26 24
论次数均为 f e b
2 c 26
2 24
25,所以
用简捷公式和用理论次数计算出的 2
值相同。
使用时可任选一种
( 3)统计决断: 首先确定自由度 df ,本例 df =1,查 df =1 的
2
表, 2(1,0.05)
=3.84 , 故有 2 <
2
(1,0.05) ,因此应在 0.05 显著性水平上保留虚无假设,拒绝备择假设。
其结论
为:
2 天训练无显著效果。
2=
(b c)2
bc
公式 11— 12)
b 和
c 的理
( f 0 f e )
2
2
(26 25)2
2
(24 25)2
25 25
0.08
二.符号检验
顾名思义,符号检验是以正负号为依据所进行的假设检验方法,它是非参数检验中最简单的一种。
(一)符号检验概述符号检验法是通过两个相关样本的每对数据之差的符号进行检验,从而比较两个样本的显著性。
具体地讲,若两个样本差异不显著,正差值与负差值的个数应大致各占一半。
符号检验与参数检验中相关样本显著性t 检验相对应,当资料不满足参数检验条件时,可采用此法来检验两相关样本的差异显著性。
根据符号检验判断差异显著性时也要查表找出相应的临界值。
但特别应注意的是在某一显著性水平下,实得的r 值大于表中r 的临界值时,表示差异不显著,这一点与参数检验时的统计量和临界值的判断结果不同。
表11—14 单侧符号检验统计判断规则
(二)符号检验的计算方法
符号检验的具体检验方法因样本大小的不同而不同。
1.小样本(N< 25)时的检验方法
例7 ,研究人员将三岁儿童经配对而成的实验组进行颜色试验教学,对照组不进行此种教学
后期测验得分如表11—15。
问颜色教学是否有显著效果?
表11—15 实验组和对照组测验得分比较表
解: 检验步骤: ( 1)建立假设:
H 0 :颜色教学无显著效果 H 1 :颜色教学有显著效果
( 2)求差数并记符号: 计算 X 1与 X 2 每对数据的差数,“+”的个数 n =7,“ -”的个数
n =3, 差数为 0不予考虑。
于是有: n =n +n = 7 + 3 = 10 。
将 n 和 n 中较小的一个记为 r ,本例 r =3 。
( 3 )统计决断:根据 n =n +n = 7 + 3 = 10 及显著性水平,查符号检验表寻找 r 的临界
值,
r 0.05 =1,而实际的 r
=3, 有 r
> r 0.05 。
由于符号检验表是单侧检验表,进行双侧检验时, 其显著
性水平应乘以 2。
所以本例应在 0.10 显著性水平上保留虚无假设,拒绝备择假设。
其结 论为:颜色教学无显著效果。
2. 大样本( N > 25)时的检验方法
对于差值的正负号差异的检验本属于二项分布的问题,当样本容量较大即( N > 25)时, 二项分布近似于正态分布,因此可用 Z 比率作为检验统计量。
检验公式为:
N
(r 0.5)
2 N
N
式中: r 为 n 或 n 的数值, N 为 n 与 n 之和。
± 0.5 为校正数,当 r > 时用 r -
0.5 ,
2 N
当 r < 时用 r +0.5。
2
30 名幼儿园教师进行手工技能培训,培训前后的测验结果如 表
11— 16,试问培训前后的两次测验结果差异是否显著?
公式 11— 13)
例 8,某省幼教培训中心,对
表11—16 30 名幼儿园教师培训前后的两次测验结果
解: 检验步骤:
1)建立假设:
H 0 :手工技能培训无显著效果 H 1 :手工技能培训有显著效果
2)求差数并记符号:计算
X 1与 X 2每对数据的差数, “+”的个数 n = 9,“-”的个
数
n =21 ,差数为 0 不予考虑。
于是有: N = n + n = 9 + 21 = 30 。
将 n 和 n 中较小的一个
记为 r ,本例 r = 9 。
由于样本容量比较大,则可使用(公式 11— 13)计算:
N 30 (r 0.5) (10 0.5)
Z 2 2 Z
N 2 择假设。
其结论为:手工技能培训无显著效果。
符号检验法的优点是不需要对所要检验的两个总体的
分布形态做任何假定,并且计算简便。
其最大的缺点是它只考虑符号, 不考察差数的大小, 因而失去样本所提供的一部分信息。
对于同 一样本数据,采用符号检验的精确度,只相当于 t 检验的 60%,因此除了小样本,一般不使 用符号检验。
三.秩和检验
到两样本容量不等( n 1 n 2 )的情况,因而又称为曼—惠特尼 U 检验。
这种方法主要用于比较 两个
4.5
4.5
1.64
30 2 3)统计决断:因为 Z < 1.96 ,所以本例应在
0.05 显著性水平上保留虚无假设,拒绝备 秩和检验方法最早是由维尔克松提出, 叫维尔克松两样本检验法。
后来曼—惠特尼将其应用
独立样本的差异。
(一)适用范围
如果两个样本来自两个独立的但非正态获形态不清的两总体,要检验两样本之间的差异是否显著,不应运用参数检验中的t 检验,而需采用秩和检验。
(二)检验方法
1 .两个样本的容量均小于10 的检验方法检验的具体步骤:
第一步:将两个样本数据混合并由小到大进行等级排列(最小的数据秩次编为1,最大的数据秩次编为n1 n2)。
第二步:把容量较小的样本中各数据的等级相加,即秩和,用T 表示。
第三步:把T 值与秩和检验表中某显著性水平下的临界值相比较,如果T1<T <T2,则两样本差异不显著;如果T ≤T1或T ≥ T2 ,则表明两样本差异显著。
例9,某年级随机抽取6 名男生和8 名女生的英语考试成绩如表11—17 所示。
问该年级男女生的英语成绩是否存在显著差异?
表11—17 男、女生英语考试成绩表
解:
检验步骤:
1)建立假设:H 0 :男女生的英语成绩不存在显著差异
H1 :男女生的英语成绩存在显著差异
2)编排秩次,求秩和:
T = 13 + 7 + 14 + 12 + 5.5 + 11= 62.5
(3
)统计推断:根据n1=6,n2=8 ,=0.05 ,查秩和检验表,T的上、下限分别为T1=
29 ,T 2=61,有 T > T 2,结论是:男女生的英语成绩存在显著差异。
3 . 两个样本的容量均大于 10 的检验方法
当两个样本容量都大于 10 时,秩和 T 的分布接近于正态分布,因此可以用 Z 检验,其基
本公式为:
T
n 1(n 1 n 2 1) Z
2
n 1 n 2 (n 1 n 2 1)
12
式中: T 为较小的样本的秩和。
例 10,某校演讲比赛后随即抽出两组学生的比赛成绩如表 11— 18,问两组成绩是否有显著
差异?
表
— 演讲成绩表
公式 11— 14)
解: ( 1)建立假设:
H 0 :两组成绩不存在显著差
异
H 1 :两组成绩存在显著差异
检验步骤:
2)编排秩次,求秩和:
n 1=12,n 2=14,T =144.5 ,代入公式,有: n 1(n 1 n 2 1) 12(12 14 1) T 144.5 Z
n 1 n 2(n 1 n 2 1) 12 14 (12 14 1)
144.5 162
0.90
19.44
3) 12
12
统计推断:因为 Z <1.96 ,则应保留虚无假设,拒绝备择假设。
结论是:两组的
演讲 比赛成绩不存在显著差异。
<。