非参数检验
【统计分析】非参数检验

3. 查表与结论 查T界值表,T0.05(11)=10~56,T=3.5,在界 值范围外,P<0.05,拒绝H0。
符号检验(Sign test)
z n n 1 n
二、两样本比较的秩和检验 (Wilcoxon法)
适用条件:完全随机设计的两个样本比较,若不满足参数 检验的应用条件,则用本法;两个等级资料比较。
-0.45
-1
13
15.20
5.50
9.70
11
14
16.50
9.00
7.50
8.5
步骤
1. 建立假设:H0:差值的总体中位数=0, H1:差值的总体中位数0;
=0.05 2. 计算统计量
计算差值d,由小到大的顺序编秩次,并冠以原d 的正负号,然后分别求正负秩和,得到T+=73, T-=5,取秩和较小者作为检验统计量T=5 3. 查表及结论
1.0
2.5
4
17.00
6.50
10.50
12
5
13.00
5.50
7.50
8.5
6
18.00
13.50
4.50
5
7
17.50
10.00
7.50
8.5
8
10.20
10.20
0.00
-
9
10.00
10.00
0.00
-
10
10.50
9.50
1.00
2.5
11
13.80
6.80
7.00
6
12
3.03
3.48
第6章 非参数检验

3 1
17
8.5
8 4
5 2
13 6
7 3
19 10
8+9 = 8.5 2
中央财经大学统计学院 37
Wilcoxon符号秩检验:基本原理 符号秩检验: 符号秩检验
分别计算出差值序列中正数的秩和以及负 数的秩和。 显然,如果零假设成立,W+与W-应该比较 接近。如果二者过大或过小,则说明零假 设不成立。 将正数的秩和或者负数的秩作为检验统计 量,根据其统计分布计算p值,从而可以得 出检验的结论。
中央财经大学统计学院 38
特别说明
符号检验在匹配数据分析应用中只用到差 值的符号,而对差值数值的大小未能考虑, 因而失去了部分信息。Wilcoxon符号秩检 验既考虑差值的符号,又考虑差值的大小, 因此在所需的假设条件满足时其功效比符 号检验高。 Wilcoxon符号秩检验也可以用于单样本中 位数的非参数检验,这时只需要将第二个 样本的值设为零假设中的数值即可。
中央财经大学统计学院 33
符号检验
对于差值序列中正数的个数和负数的个数 按照符号检验的方法进行假设检验
中央财经大学统计学院
34
Wilcoxon符号秩检验:基本原理 符号秩检验: 符号秩检验
计算差值绝对值的秩 。 将差值绝对值从小到大排序,其位次就是 的秩(rank),等于0值不参与排序。
中央财经大学统计学院
中央财经大学统计学院 18
软件操作
在SPSS软件中打开数据文件,选择“分析” “非参数检 验” “1样本K-S”,在弹出的对话框中将“时间”设定为 检验变量;检验分布为默认的“常规”(正态分布)。单 击 “确定”
中央财经大学统计学院
19
结果分析
常见的几种非参数检验方法

常见的几种非参数检验方法非参数检验是一种不需要对数据进行假设检验的统计方法,它不需要满足正态分布等前提条件,因此被广泛应用于实际数据分析中。
在本文中,我们将介绍常见的几种非参数检验方法。
一、Wilcoxon符号秩检验Wilcoxon符号秩检验是一种用于比较两个相关样本之间差异的非参数检验方法。
它基于样本差异的符号和秩来计算统计量,并通过查表或使用软件进行显著性判断。
二、Mann-Whitney U检验Mann-Whitney U检验是一种用于比较两个独立样本之间差异的非参数检验方法。
它基于样本排名来计算统计量,并通过查表或使用软件进行显著性判断。
三、Kruskal-Wallis H检验Kruskal-Wallis H检验是一种用于比较多个独立样本之间差异的非参数检验方法。
它基于样本排名来计算统计量,并通过查表或使用软件进行显著性判断。
四、Friedman秩和检验Friedman秩和检验是一种用于比较多个相关样本之间差异的非参数检验方法。
它基于样本排名来计算统计量,并通过查表或使用软件进行显著性判断。
五、符号检验符号检验是一种用于比较两个相关样本之间差异的非参数检验方法。
它基于样本差异的符号来计算统计量,并通过查表或使用软件进行显著性判断。
六、秩相关检验秩相关检验是一种用于比较两个相关样本之间关系的非参数检验方法。
它基于样本排名来计算统计量,并通过查表或使用软件进行显著性判断。
七、分布拟合检验分布拟合检验是一种用于检验数据是否符合某个特定分布的非参数检验方法。
它基于样本数据与理论分布之间的差异来计算统计量,并通过查表或使用软件进行显著性判断。
八、重复测量ANOVA重复测量ANOVA是一种用于比较多个相关样本之间差异的非参数检验方法。
它基于样本方差和均值来计算统计量,并通过查表或使用软件进行显著性判断。
九、Bootstrap法Bootstrap法是一种用于估计总体参数和构建置信区间的非参数方法。
它基于自助重采样技术来生成大量虚拟样本,以此估计总体参数和构建置信区间。
8非参数检验

②正态近似法:
u | T n0 ( N 1) / 2 | n1n2 ( N 1) / 12
本例u 2.205 0.05/ 2 1.96
N3 N ; 3 3 N N (ti ti )
i
*校正公式(当相同秩次较多时)
uc u c; c
ti为第i个相同秩号的数据个数
假定:两组样本的总体分布形状相同
如果两总体 分布相同
基本思想
两样本来自同一总体 任一组秩和不应太大或太小
T 与平均秩和 n0 (1 N ) / 2 应相差不大
较小例数组的秩和, n1 n2 T min( R1 , R2 ), n1 n2
N n1 n2 n0 min( n1 , n2 )
控制 显效 有效 近控
65 18 30 13 126
107 24 53 24
1-107 108-131 132-184 185-208
54 119.5 158 196.5
编号 1 2
病情 单纯型 单纯型合并肺气肿
疗效 控制 显效
3
4 … 206 207
单纯型合并肺气肿
单纯型 … 单纯型 单纯型合并肺气肿
10 12(12 1) / 4 | R n(n 1) / 4 | u 2.275 n(n 1)(2n 1) / 24 12(12 1)(2 12 1) / 24
查标准正态分布表,得 P 值 校正公式: (当相同秩次个数较多时)
u
| R n(n 1) / 4 | n(n 1)(2n 1) / 24 (ti3 ti ) / 48 10 12(12 1) / 4
第一节 非参数检验的概念
第九章 非参数检验方法

胃癌患者,观察其生存 时间如表9-4所示,问两 组患者的生存时间是否 不同?
n1=10
T1=162
假设检验的要点
1. 2. 3. 4. 混合编秩、数据相等时取平均秩 分别求两组的秩和 以样本量较小组的秩和为T 查成组设计的T界值表、确定P值
1.建立检验假设: H0:两组患者生存时间的总体 分布相同 H1:两组患者生存时间的总体 分布不同 α=0.05 2.计算检验统计量T值 ⑴编秩 ⑵求秩和,确定统计量T 3.确定P值(T界值:91~159); 做出推断结论
n1=8
T1=26
n2=7
T2=134
n3=9
n4=8
T4=54.5
秩和检验的两两比较
1、扩展的t检验 2、Nemenyi法检验
习题
• P105~P107 第1、3、5、7题
T1 16.2,T2=9.86
n1=10
T1=162
• 正态近似法
①当n1≤10,n2n1≤10 ,查T界值表(两样本比较的秩和 检验用)确定P值;
②当n1>10或n2>20的大样本时,对T进行u转换,则可用 正态近似法:
| T n1 ( N 1) / 2 | 0.5 u n1n2 ( N 1) /12
1312312051211iitnnuttnnnnn?????????????????二等级资料的秩和检验表95两组人痰液嗜酸性粒细胞的秩和计算例数统一编秩嗜酸性粒细胞数健康人病人范围平均秩次例数较小组病人组的秩和51111685935181810101744174430530530503050?若选行列表资料的卡方检验只能推断两组样本疗效构成比的差别有无统计学意义损失疗效的等级信息应采用秩和检验可推断两组等级强度的差别有无统计学意义比较两组病情的疗效
非参数检验

200
取显著性水平为0.05,查 2 分布表得临界值
2 0.05
(4)
9.488
,由于
2统计量大于临界值,所以应该拒
绝原假设,即认为消费者对各种品牌茶叶的偏好是有差
别的。
二、符号检验
1. 单样本位置的符号检验
一个随机样本,有 n 个数据
x1,x2,…,xn,其实际的总体中位数为
M,假定的中位数是某个特定值,记 做 M0 。位置检验是检验真实的中位 数和假定的中位数的关系:大于、等 于还是小于。
品牌,每一种只标上A、B、C、D、E,随机抽取1000消费 者,每人都品尝五种茶叶,然后把最偏好的茶叶的字母 写下来。下表是整理后的消费者偏好的频数分布。要求 判断消费者对这几种品牌茶叶的偏好有没有差异?
各种品牌茶叶爱好者的频数分布
喜欢的品牌
A B C D E
合计
人数
220 302 175 80 223
一、 检验
属于拟合程度检验,它是利用随机 样本对总体分布与某种特定
分布拟合程度 的检验 。
检验步骤:
① 确立原假设和备择假设。 ② 按照“原假设为真”的假定,导出 一组期望频数或理论频数。 ③ 计算 2 统计量 。
2 k ( fi ei )2
i1
ei
若统计量的值较大,拒绝原假设。
【例10.14】假定有五种不同牌号的茶叶,但都未标明
市场调查
【例10.15】领导者的领导水平是可以训练的吗?
根据人的聪明程度、人品、受教育状况等,随机抽取30 人配成15对,每对中有一人随机选择受训,另一人不受 训。经过一段时间后,按被设计好的问题评价他们的领 导水平,结果如下表所示。
领导水平评价表
非参数检验

两种方法治疗扁平足效果观察
建立假设
病例号
原始记录 A法 B法
量化值 A法 B法
差值
秩次
H0:两法疗效差值的总体中位数
1 2
为0;
3
4
H1:差值的总体中位数不为0。
5
6
=0.05
7
8
计算检验统计量
9
10
编秩:
11
12
求秩和:T+=61.5,T-
13
=4.5
14 15
好
差
好
好
好
差
好
中
差
中
中
差
好
中
好
差
秩和(rank sum): 同组秩次之和;在一定程度上反映了等级 的分布位置。
秩和检验:就是通过秩次的排列求出秩和,进行假设检验。
11
非参数检验 (nonparametric test )
非参数检验的最常用方法——秩和检验( rank test ) 利用秩的大小进行推断就避免了不知道背景分布的
困难。这也是非参数检验的优点。 多数非参数检验明显地或隐含地利用了秩的性质;
但也有一些非参数方法没有涉及秩的性质。 掌握对数据进行编秩的方法是学习秩和检验的基本
要求。
12
非参数检验 (nonparametric test )
非参数检验的最常用方法——秩和检验( rank test )
A组: - 、、+、+、+、+、++、++、++、++、+++、+++
适用条件: (1)上述两种设计类型的资料不满足参数检 验条件。 (2)配对设计等级资料的比较。
第9章 非参数检验

9.7多个独立样本比较秩和检验
1.多组计量资料的非参数检验
对于多组计量资料不服从正态性、方差齐性条件或 经转换后也不满足,则采用H检验法
例9-8研究白血病时,测定四组鼠脾DNA的含量,结 果如下表,分析各组DNA含量有无差别?(α=0.05)
正常脾
12.3
患自发性白血病的脾 10.8
患移植白血病的脾(甲组) 9.3
列联表(二维列联表按两个属性分类的表)分类: 1)双向无序表(检验法:Pearson卡方检验) 2)双向有序表(检验法:McNemar检验、Kappa检验) 3)单向有序表(等级资料,检验法:非参数检验)
Guiyang College of Traditional Chinese Medicine
例9-7《成都中医药大学学报》2004年第2期《益 心钦口服液治疗冠心病心率失常的疗效》一文, 调查数据如下表,判断其疗效与对照组是否相同? (α=0.05)
Guiyang College of Traditional Chinese Medicine
2.等级资料两样本比较秩和检验
医药学研究中的等级资料: 1)疗 效: 痊愈、显效、有效、无效、恶化 2)化验结果: - ++ +++ 3)体格发育: 下等、中下、中等、中上、上等 4)心功能分级:I、II、III… 5)营养水平: 差、一般、好
1959 30.5 1969 11.8
1960 24.5 1970 12.4
Guiyang College of Traditional Chinese Medicine
SPSS操作步骤
1)建立数据文件:变量名为x 2)Analyze→Nonparametric Tests→Runs,
非参数检验

非参数检验的优点:
①适用范围广,不论样本来自的 总体分布形式如何,都可适用;
②某些非参数检验方法计算简便, 研究者在急需获得初步统计结果时可 采用;
的总体分布不同。 α=0.05
2.混合编秩
依据两组数值由小到大编秩,结果 见上表。
3.求秩和并确定检验统计量T
把两组秩次分别相加求出两组的秩 和值,R1=315.5,R2=149.5。因乳 酸钙组样本含量较小,故 T=R2=149.5。
4.确定P值和作出推断结论 以较小样本含量为n1,n1=14, n2n1=2,查附表6,两样本比较秩和检验 用T界值表(双侧)。
当n1>20或(n2-n1)>10时,附表6 中查不到P值,则可采用正态近似法求u 值来确定P值,其公式如下:
u T n1(N 1) / 2 0.5 n1n2(N 1) 12
上式中T为检验统计量值,n1、n2 分别为两样本含量,N=n1+n2,0.5这 连续性校正数。上式为无相同秩次时使 用或作为相同秩次较少时的近似值。当 两样本相同秩次较多(超过总样本数的 25%)时,应按下式进行校正,u经校 正后可略增大,P值则相应减小。
式中,Ri为各组的秩和,ni为各组 样本含量,N为总样本含量。
当各组相同秩次较多时,可对H值进 行校正,按下式求值。
Hc H c
C 1
(t
3 j
t
j
)
(N3 N)
4.确定P值和作出推断结论
当组数K=3,每组样本含量ni≤5时, 可查附表7(H界值表)得到P值。若 k>3或ni>5时,H值的分布近似于自 由度为k-1的χ2分布,此时可查附表 4χ2界值表得到P值。最后按P值作出 推断结论。
非参数检验

用来检验样本与某一理论分布是否有明显差异,是一种 拟合优度检验方法,适用于探索连续随机变量分布。 如:分析储户总体一次性存款金额的分布与正态分布的 差异性等。 原假设:样本来自的总体与制定的理论分布无明显差异。 SPSS理论分布主要有:正态分布、均匀分布、指数分 布、泊松分布等。
均匀分布或称规则分布。植物种群的个体是
比较不同职业储户存款金额分布
配对样本非参数检验
连续数据——符号秩检验:也是检验两样本的总体分布
二元数据——McNemar
被试对象在实验前后被抽查两次,分别计算初 始反应比率与最终反应比率的差异
分类变量——边缘同质检验
使用卡方分布检验实验干涉前后设计中反应的 变化。
多个配对样本的非参数检验
这类资料有如下特点:
(1)资料的总体分布类型未知; (2)资料分布类型已知,但不符合正态分布; (3)某些变量可能无法精确测量如等级资料。 对这类资料可以采用非参数统计:即不考虑 总体分布类型是否已知,不比较总体参数, 只比较总体分布的位置是否相同的统计方法。 此类资料可以采用非参数方法进行统计分析。
等距分布,或个体之间保持一定的均匀的间 距。均匀分布在自然情况下极为罕见,而人 工栽培的有一定株行距的植物群落即是均匀 分布。
泊松分布
常用的一种离散型概率分布
泊松分布适合于描述单位时 间内随机事件发生的次数。如 某一服务设施在一定时间内到 达的人数,电话交换机接到呼 叫的次数,汽车站台的候客人 数,机器出现的故障数,自然 灾害发生的次数等等。
例:分析储户一次性金额总体是否服从正态
分布。
两个独立样本的检验
服从正态分布式用T检验
但样本所属总体的分布类型不明或非正态时,
第十讲 非参数检验

分析完全随机设计的多样本计量资料时,若多样本观察指标不满足正态性和方差齐性, 不能进行方差分析, 以及多样本观察指标为等级 (有序分类) 资料, 宜采用 Kruskal-Wallis H 秩和检验。
14
第二节秩和检验 —完全随机设计多样本的秩和检验
【例11-4】某医生在研究再生障碍性贫血时, 测得不同程度再生障碍性贫血患者血清中可溶 性CD8抗原水平(U/ml),结果见表11-5,问不 同程度再生障碍性贫血患者血清中可溶性CD8抗 原水平有无差别?
通常规定,当 n1 n2 时,取较小样本的秩和作为检验统计量 T ;当 n1 n2 时,取秩和 较小者作为检验统计量 T 。
9
第二节秩和检验 —成组设计资料的秩和检验
【例11-2】某医院某医生对28例糖尿病早期微血管病 变的患者,按年龄、性别、病程、中医证候评分、生存 质量量表评分、饮食控制等情况,随机分为两组,试验 组采用西药加中药联合治疗方法,对照组采用西药加安 慰剂治疗方法,治疗4周,测定24小时尿蛋白改变量, 结果见表11-3,问该中药对糖尿病患者早期微血管病变 有无疗效?
16
第二节秩和检验 —完全随机设计多样本的秩和检验
【例11-5】探讨中药联合NB-UVB治疗寻常性银 屑病的临床疗效。95例患者分为3组,治疗组35 例给予NB-UVB照射,同时中药浴疗;对照1组33 例予NB-UVB照射,对照2组30例给予中药浴疗。 结果见表11-6,试比较三组疗效是否有差异?
4
第一节 非参数检验简述
表 11-1 参数检验与非参数检验的区别 非参数检验 推断总体分布,如中位数是否相等,是 否符合某种分布 参数检验 推断总体的参数,如算数均数、方 差、率是否相等 已知总体分布:如正态分布、二项 分布、poission 分布
非参数检验

➢ 编秩:数据相等则取平均秩,
➢ 求秩和
➢ 计算检验统计量H值
H 12 N(N 1)
Ri2 3( N 1) ni
出生体重(kg)xij ABCD
相应秩次 Rij A BCD
2.7 2.9 3.3 3.5
3
4
7 11
2.4 3.2 3.6 3.6
2 5.5 12.5 12.5
2.2 3.2 3.4 3.7
χ 2 12
R
2 i
3(N1)
N(N1) ni
χ2
12 14(14 1)
152
4
152 3
37.52 4
37.52 3
3(14
1)
χ 2 9.375
χ
2 c
1
χ2
(t
3 j
t
j
)
n3 n
1
(23
9.375 2) (33 3) (23
143 14
2)
9.50
四、随机区组设计资料的秩和检验 (Friedman test)
正态近似法
如果n1或n2-n1超出附表的范围,可按下式 计算u值:
u | T n1(N 1) / 2 | 0.5 n1n2 (N 1) / 12
在相同秩次较多时,应用下式进行校正:
uC u / C
C 1
(t
3 j
t
j
)
/(N
3
N)
tj为第j组相同秩次的个数
频数表资料(或等级资料)两样本资料比较
xi (2) 86 71 77 68 91 72 77 91 70 71 88 87
12 对双胞胎兄弟心理测试结果
后出生者得分 差 值
社会统计学 第十一章_非参数检验

R1=l+2+4+5+6+7+9+11+14+17=76
R2=3+8+10+12+13+15+16+18+19=114
代入下两式得
所以检验统计量U=min(U1,U2)=U2=2l 由α=0.05查附表10得
Uα(n1 ,n2)=U 0.05(10 ,9)=20<2l 所以不否定零假设,说明在0.05的水平上,不能认为专科类院
2020/8/28
6
[例] 假设我们观测15个相配的对,获得两个差为零和13个差不为 零,其中有11个正号,2个负号,试在2.5%的显著性水平上进行单 侧检验。
[解] H0:p=0.5 H1:p (+)>p (―)
由α=0.025确定否定域,查二项分布表(附表2) P (13;13,0.5)=0.000 P (12; 13,0.5)=0.002 P (11; 13,0.5)= 0.010 P (10; 13,0.5)=0.035
本科院校环境质量的名次(秩)为: 1,2,4,5,6,7,9,11,14,17 (n1=10)
专科院校环境质量的名次(秩)为:
3,8,10,12,13.15.16,18,19 (n2=9)
2020/8/28
21
[解] H0:专科类院校和本科类院校的环境质量无差异 H1:专科类院校和本科类院校的环境质量有差异
如此,这些很容易理解的方法还可以用于处理
2020等/8/28级的资料和定性的信息。
3
很显然,如果把从一个正态总体中抽取的数据用分布 自由来处理,其效果肯定不如相应的参数检验有力。我们 一般用下述指标来确定非参数检验的“效率” 。
非参数检验

第九章非参数检验知识引入比较两个总体间的差异,我们比较熟悉的是可依据总体方差是否已知,选择使用正态Z检验或t检验法。
但如果有明显的证据表明,这些参数型检验法不能使用时又该如何呢?非参数检验法对此提供了解决方案。
作为参数检验的一种推广,非参数检验有何特点?它的使用有什么样的要求?本章首先对非参数检验进行概述,接着按照和参数检验对应的原则分别介绍用于两组比较的非参数检验法和用于多组比较的非参数检验法。
第一节非参数检验概述假设检验分为参数检验和非参数检验。
参数检验是在已知总体分布的条件下(一般要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验,有时还要求某些总体参数满足一定条件。
如独立样本的T检验和方差分析不仅要求总体符合正态分布,还要求各总体方差齐性。
教材第八章之前所介绍的统计方法都是参数检验法。
非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一般性假设(如总体分布的位置是否相同,总体分布是否正态)进行检验。
非参数检验方法简便,不依赖于总体分布的具体形式因而适用性强,但灵敏度和精确度不如参数检验。
一般而言,非参数检验适用于以下三种情况:①顺序类型的数据资料,这类数据的分布形态一般是未知的;②虽然是连续数据,但总体分布形态未知或者非正态,这和卡方检验一样,称自由分布检验;③总体分布虽然正态,数据也是连续类型,但样本容量极小,如10以下(虽然T检验被称为小样本统计方法,但样本容量太小时,代表性毕竟很差,最好不要用要求较严格的参数检验法)。
因为这些特点,加上非参数检验法一般原理和计算比较简单,因此常用于一些为正式研究进行探路的预备性研究的数据统计中。
当然,由于非参数检验许多牵涉不到参数计算,对数据中的信息利用不够,因而其统计检验力相对参数检验也差得多。
前面所学到的参数检验法在非参数法中都能找到替代的方法,因此按照和参数检验法相对应的原则可对非参数检验法进行如下分类:第二节非参数两组比较法该类方法实际上对应两总体比较的t检验法。
生物统计学:非参数检验

{ n+,n-}= n+=2 。
3、统计推断 当n=15时, 查附表11 得 临 界 值K0.05(15)=3 , K0.01(15) = 2 , 因 为 K = 2 = K0.01(15),P≤0.01,表明噪数与总体中位数比较的符号检验
1、建立假设 HO:样本所在的总体中位数=已知总体中 位数; HA :样本所在的总体中位数≠已知总体 中位数。 (若将备择假设 HA 中的“≠”改为“<” 或“>”,则进行一尾检验)
依赖于特定分布类型, 比较的是参数
优点:方法简便、易学易用,易于推广使用、应用范围广;可 用于参数检验难以处理的资料(如等级资料,或含数值 “>50mg”等)。 缺点:方法比较粗糙,对于符合参数检验条件者,采用非参数 检验会损失部分信息,其检验效能低;样本含量较大时,两者 结论常相同。
第一节 符号检验
非参数检验的弱点 可能会浪费一些信息 特别当数据可以使用参数模型的时候 大样本手算相对麻烦 一些表不易得到
参数检验 (parametric test)
非参数检验 (nonparametric test)
已知总体分布类型,对 未知参数进行统计推断
对总体的分布类型不作严 格要求 不受分布类型的影响, 比较的是总体分布位置
124.3 147.9 -15.7 7.9 +
1、提出无效假设与备择假设
HO :该地成年公黄牛胸围的平均数=140厘米, HA :该地成年公黄牛胸围的平均数≠140厘米。
2、计算差值、确定符号及其个数 样本各观测值与总体 平均数的差值及其符号列于表 11-2 ,并由此得 n+=6 ,n-=4 ,
非参数统计的名字中“非参数”意味着其方法不 涉及描述总体分布的有关参数;
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
目录第八章非参数检验 ________________________________________________________________________ 2第一节非参数检验概述 __________________________________________________________________ 3第二节单样本非参数检验 ________________________________________________________________ 3χ拟合优度检验__________________________________________________________________ 3一、2二、单样本K-S检验___________________________________________________________________ 5三、符号检验 _________________________________________________________________________ 6四、游程检验 _________________________________________________________________________ 7χ的独立性检验_________________________________________________________ 8第三节列联表与2第四节等级相关分析 ___________________________________________________________________ 10一、Spearman等级相关系数____________________________________________________________11二、Kendall等级相关系数 _____________________________________________________________ 12英文摘要与关键词 ______________________________________________________________________ 14习题 _________________________________________________________________________________ 15第八章非参数检验通过本章的学习,我们应该知道:1.非参数检验的优缺点2.常用的单样本非参数检验方法3.列联表与卡方的独立性检验4.S pearman和Kendall 等级相关系数的计算第一节 非参数检验概述非参数检验(nonparametric tests )是相对于参数检验而言的。
参数检验是一种适用于一些特定环境下的检验,如第六章中进行的均值检验就属于参数检验,首先它对总体作出了服从正态分布的假设,然后根据来自总体的样本资料对均值进行检验。
但在许多实际问题中,人们往往对总体的分布形式知之甚少,很难有正确的假定,这样就不能满足参数检验的条件,也就不能用参数检验方法了。
假定总体分布的具体形式未知,而是从样本数据本身来获得所需信息,对总体分布的类型和位置进行检验,这称为非参数检验。
非参数检验的特点是:1. 从非参数检验的前提条件看,仅要求“观测值是独立的”、“变量具有连续性”等简单假设,不要求确保样本所属的总体符合某种理论分布。
检验不受总体分布形状的限制,使得适用范围更为广泛。
2. 从非参数检验方法对原始数据的要求看,它不要求有很精确的计量值,可以使用分类数据和顺序数据,非参数检验的处理方法大都基于低精度数据,因而它几乎可以处理如何类型的数据。
3. 从非参数检验方法的效率看,虽然非参数检验的计算方法名目繁多,有时对某类数据的算法就有多种,但其表现形式一般比较简单并易于理解,依照不同类型数据的不同算法,效率也不同。
研究表明,多数常用的非参数检验方法的效能是参数检验方法的95%左右。
也就是说,通过95次独立观察获得的数据能够保证参数检验所要达到的精度,那么若用非参数检验方法,则需要100次的独立观察。
总之,非参数检验需要更大的样本容量来保证所要求的检验精度。
本章介绍单样本非参数检验(single-sample nonparametric test )的常用方法:2χ拟合优度检验、K-S 检验、符号检验和游程检验,以及列联表与卡方的独立性检验。
第二节 单样本非参数检验对获取的样本资料,往往最希望了解其所属总体的分布形态是否与已知的理论分布相吻合,或它们是否具有随机性。
人们可以通过绘图作粗略判断,但如果希望得到比较准确的结论,则需要用非参数检验。
下面介绍的方法中,2χ检验、K-S 检验和符号检验都属于拟合优度检验,即都是检验属于每一类别的观测数目与根据零假设所得到的期望数目之间是否有显著性差异;游程检验是用来对样本数据的随机性进行的检验。
一、2χ拟合优度检验2χ拟合优度检验(chi-square goodness-of-fit test )适用于具有明显分类特征的数据。
如要研究消费者对某种产品是否有“颜色”的偏好,可以将200位消费者按购买不同颜色的产品分类,得到各颜色购买者的人数。
根据这些样本数据来判断样本所属的总体分布与某一设定分布是否有显著差异,所谓设定分布可以是我们熟悉的理论分布,如正态分布、均匀分布等,也可以是任何想象的分布。
零假设0H 是:样本所属总体其分布形态与设定分布无显著差异。
在进行检验时需要构造下面的2χ统计量: ∑=-=ki ei ei i f f f 1202)(χ (8.1) 式中:k 是样本分类的个数,i f 0表示实际观察到的频数,ei f 表示设定频数,即理论频数。
可见,如果观察频数与设定频数越接近,则2χ值越小,根据皮尔逊定理,当n 充分大时,2χ统计量渐近服从于k-1个自由度的2χ分布。
我们可以计算出2χ统计量,判断有两种方法:一是依据2χ分布表,给出所对应的概率值,如果该概率值小于或等于给定的显著性水平α,则拒绝0H ,即样本所属的总体分布形态与设定的分布存在显著差异;如果该概率值大于给定的显著性水平α,则不能拒绝0H ,即没有理由认为样本所属的总体分布形态与设定分布有显著差异。
二是依据2χ分布表,给出α所对应的临界值2αχ,如果2χ统计量大于或等于临界值,则拒绝0H ,认为样本所属的总体分布形态与设定分布存在显著差异;如果2χ统计量小于临界值,则不能拒绝0H 。
由于奠定检验基础的皮尔逊定理要求样本是充分大,所以在搜集资料时必须要保证样本容量不小于50,同时每个单元中的期望频数不能太小,如果第一次分类时有单元中的频数小于5,则需要将它与相邻的组进行合并,如果20%的单元理论频数e f 小于5,则不能用2χ检验了。
【例8.1】某企业生产线上星期一至星期五的不合格产品数量如下表所示,试检验五个不同工作日的产品不合格率是否相同(α=0.05)?【解】0H :五个不同工作日的产品不合格数相同;1H :五个不同工作日的产品不合格数不相同。
由于不合格品数的实际数是134,所以其理论值为134÷5 = 26.8。
表8.1是相关数据的计算。
22χ统计量为16.2239,其对应的近似概率值为0.0027。
由于0.0027<0.05,故拒绝0H ,也就是说,五【例8.2】接上题,有人认为产品的不合格率与工人的情绪有关,星期一刚来上班情绪最不稳,不合格率为30%,星期二、五的不合格率次之,为25%,而星期三、四的不合格率仅为10%,这种观点有道理吗?以显著性水平α=0.05来检验这种说法的正确性。
【解】 0H :%25%,10%,10%,25%,3054321=====πππππ1H :至少有一个)5,4,3,2,1(=i i π与上述比例不同。
计算在各设定的比例为真的情况下,每天的不合格品数,如星期一的不合格品数为:134×30%=40.2,星期二的不合格品数为:134×25%=33.5,……,依次类推。
相关计算可借助Excel 数据表,结果见图8.1。
图8.12χ统计量的计算表 由于实际的2χ统计量1.2687小于α=0.05对应的临界值9.4877,或根据2χ统计量对应的概率0.8667大于α,所以不能拒绝0H ,即没有理由认为假想的比例是错的。
二、单样本K-S 检验单样本K-S 检验(1-sample K-S test )是以两位苏联数学家柯尔莫哥(Kolmogorov )和斯米诺夫(Smirnov )命名的。
K-S 检验是一种拟合优度检验,研究样本观察值的分布和设定的理论分布间是否吻合,通过对两个分布差异的分析确定是否有理由认为样本的观察结果来自所设定的理论分布总体。
设)(x S n 是一个n 次观察的随机样本观察值的累积概率分布函数,即经验分布函数;)(0x F 是一个特定的累积概率分布函数,即理论分布函数。
定义)()(0x F x S D n -=,显然若对每一个x 值来说,)(x S n 与)(0x F 十分接近,也就是差异很小,则表明经验分布函数与特定分布函数的拟合程度很高,有理由认为样本数据来自具有该理论分布的总体。
K-S 检验主要考察的是绝对差数)()(0x F x S D n -=中那个最大的偏差,即利用下面的统计量作出判断。
)()(max 0max x F x S D n -= (8.2)K-S 检验的步骤为:1. 提出假设:)()(:00x F x S H n =,)()(:01x F x S H n ≠2. 计算各个D ,找出统计量max D3. 查找临界值:根据给定的显著性水平α和样本数据个数n ,查《单样本K-S 检验统计量表》可以得到临界值αD (单样本K-S 检验统计量表见附录六)。
4. 作出判定:若max D ≥αD ,则在α水平上,拒绝0H ;若max D <αD ,则不能拒绝0H ;【例8.3】 随机抽取100名生产线上的工人,调查他们的日产量,资料情况如下表,判断生产线上工【解】0H :)(x S n 服从正态分布,1H :)(x S n 不服从正态分布。
根据所给的资料,借助Excel 进行相关的计算,见图8.2:图8.2 max D 统计量的计算表查表得136.010036.1==αD ,由于max D = 0.0430<αD ,所以,不能拒绝0H ,即生产线上工人的日产量服从正态分布。
比较2χ检验与K-S 检验:两者均属拟合优度检验,2χ检验常用于分类数据,而K-S 检验还可以运用于顺序数据。