第二讲-非参数统计检验
第二讲-非参数统计检验
第二讲非参数检验1.实验目的1.了解非参数假设检验基本思想;2.会用SAS软件中的proc npar1way过程进行非参数假设检验和proc freq过程进行列联表的独立性检验。
2. 实验要求1.会用SAS软件建立数据集,并进行统计分析;2.掌握proc npar1way过程进行非参数假设检验的基本步骤;3.掌握proc freq过程进行列联表的独立性检验的基本步骤。
3.实验基本原理3.1 符号检验两种方法的处理效果无显著性差异令统计量表示新方法的处理效果优于对照方法的配对组总数。
若新方法的处理效果显著的优于对照方法,则的值应明显偏大。
因此,若对给定的置信水平,有,则拒绝。
为真时,(1)服从二项分布。
拒绝域为:(2)由中心极限定理可知,当的零分布趋于标准正态分布。
拒绝域为:3.2 Wilcoxon秩和检验(1)单边假设检验两种方法的处理效果无显著性差异 as :新方法优于对照方法。
用于检验的统计量为:若对给定的置信水平,有,则拒绝。
且的分布列为:根据观测结果计算的观测值,计算检验的p值:然后将值与显著水平作比较,若,则拒绝,否则接受。
(2)双边假设检验给定的显著水平应该满足:仅由上式还不能唯一确定,当我们对两种方法谁优谁劣不得而知时,通常取若利用p值进行检验,设,计算概率值由对称性可知,检验的p值为上述两概率中小于1/2的那一个的2倍。
例如则。
求出p值后,若p<a,拒绝,否则接受。
(3)列联表的独立性检验方法的处理效果无显著性差异:表示格子概率,表示三维列联表中事件发生的理论频数。
将概率用相应的频率频率去估计。
令其中:将样本数据代入统计量进行检验。
然后将P与显著水平作比较,若,拒绝,否则接受。
4. 实验相关SAS知识(1)独立样本的秩检验——proc npar1way过程proc npar1way过程的基本语句形式为proc npar1way [options];class variables;(proc npar1way过程不可缺少的语句)exact;(求出检验的精确p值)var variables;其中“options”可包含以下选项的部分或全部:①DATA=数据集名:指定要分析的数据集。
统计学0712非参数检验
参见拟合优度检验
基本思路是在总体分布未知的情况下,要求根据样本来检验关于总体分布的假设。
检验统计量为:例3:19世纪,生物学家孟德尔按颜色与形状把豌豆分为四类:黄而圆的、青而圆的、黄而有角的、青而有角的。
孟德尔根据遗传学的理论指出,这四类豌豆个数之比这9:3:3:1。
他在556颗豌豆中,观察到这四类豌豆的个数分别为:315、108、101、32。
检验孟德尔理论是否正确。
显著水平为0.05
由于X 2是表示观察频数n i 和理论频数np i 的相对差异的总和,所以当H 0成立时,X 2的值应比较小。
则H 0的拒绝域为:
但在使用X 2拟合检验时,必须注意几点:
2、每个np i 不能太小,最好np i >5,否则应适当合并以满足要求。
1、n一定要足够大,最好n>50;
r 为待估计的参数个数;n i 为观察频数(实际频数p i 为理论概率;
np i 为理论频数(期望频数 )1(~)(212
2---=∑=r k np np ni k
i i i χχ)
1(12--≥-r k αχχ。
统计学中的非参数检验方法
统计学中的非参数检验方法统计学是一门应用广泛的科学领域,它的应用范围涉及到社会、经济、医学、科学等各个领域。
非参数检验方法是统计学中的一种基于数据分布情况的假设检验方法,它不仅可以应用于各个领域的研究中,也是数据分析领域中不可或缺的一部分。
什么是非参数检验非参数检验是一种基于统计数据分布情况做出判断的方法,在对特定类别的数据进行假设检验的时候,不依赖于数据分布的形状,而且它可以处理许多小样本或者没有熟知的总体参数的数据。
非参数检验方法的应用范围广泛,可以用于数据汇总、逻辑推理、实验设计以及其他数据分析中的问题。
非参数检验的优势传统的统计假设检验方法是基于大样本数据的总体参数进行推断的,其可以直接获得总体参数值,但是对于小样本数据而言,则需要使用比较多的假设、术语和统计量、偏差的值来判断出研究问题的可行性,而非参数检验则可以用较少的假设来完成数据分析,避免了数据误判,降低了数据分析的难度。
非参数检验的应用非参数检验方法在实际生活中的应用,主要表现在以下几个方面:1. 样本分布非正态:如果样本数据分布不满足正态分布,这时是可以应用非参数检验方法的。
2. 样本数据较少:如果样本数据较少,传统假设检验方法会有较高的错误率,可以使用非参数检验方法来避免这种情况。
3. 样本数据有异常值:若样本数据存在严重的异常值,应用传统的假设检验方法可能会导致数据误判,此时可以应用非参数检验方法进行数据分析。
常见的非参数检验方法常见的非参数检验方法有:1. Wilcoxon符号秩检验:适合偏差没达到正态分布的样本。
2. Mann-Whitney U检验:主要用于2组样本数据非独立的情况。
3. Kruskal-Wallis检验:用于3组及以上的样本比较,判断样本总体是否有差别。
4. Friedman秩和检验:主要用于分析多组数据的内部联系。
5. Kolmogorov-Smirnov拟合检验:用于检验给定的样本是否符合特定分布。
《医学统计学》教学课件-非参数检验
zc z / c; c 1
(t
3 j
t
j
)
/
N3 N
;
t j 为第 j个相同秩次的 个数
2020/8/6
23
(二)两组等级资料的秩和检验
表 9-4 针灸组与对照组疗效结果
疗效 针灸组 对照组 合计 秩次范围 平均秩次
⑴
⑵
治愈 24
显效
8
好转
2
无效
1
⑶
⑷
⑸
⑹
15
H0 : 171.2cm H0 : 1 2 k
2020/8/6
3
非参数检验(nonparametric test)
对数据的总体分布类型不作严格假定, 直接对总体分布作假设检验。 又称任意分布检验。
2020/8/6
4
第一节 非参数检验概述
一、非参数检验
表 9-1 参数检验与非参数检验的区别及优缺点
表 7-2 12 名工人尿氟含量测定结果
尿氟含量(mmol/L) (1)
差值 d (2)=(1)-2.15
秩次
2.15
0
2.10
-0.05
-2.5
2.20
0.05
2.5
2.12
-0.03
-1
2.42
0.27
4
2.52
0.37
5
2.62
0.47
6
2.72
0.57
7
2.99
0.84
8
3.19
1.04
9
3.37
2020/8/6
35
表 7-8 不同种系雌性大白鼠注射不同剂量雌激素后子宫重量(g)
参数检验与非参数检验
总体均值存在显著差异;相反,如果相伴概率值大于用户 心中的显著性水平,则不能拒绝原假设,可以认为两总体 均值不存在显著差异。
第二十三页,讲稿共七十二页哦
t ❖ (二)配对样本 检验在SPSS中的实现
第八页,讲稿共七十二页哦
❖ 5、Option选项
❖ 在主对话框中单击Option选项,展开Option对话框,如图52所示。
图5-2 Option对话框
第九页,讲稿共七十二页哦
❖ (1)Statistics选项框,选择统计量。
❖ (2)Statistics For First Layer框,对第一层每个控制变
❖ 2、选择检验统计量。单样本 计量。
检t验的检验统计量为 统
❖ 3、t计算检验统计量观测值和概率值。SPSS将自动计算
统计量的观测值和对应的概率 值。
❖ 4、给t定显著性水平,并作出决策 。给定显p著性水平,与
检验统计量的概率值作比较。如果概率值小于显著性水平,
则应拒绝原假设;反之,如果概率值大于显著性水平,则
❖
4、做出判断。研究者给定一个显著性水平,p如果相伴
概率值小于或等于用户给定的显著性水平,则拒绝原假设;
否则,不应拒绝原假设。
第四页,讲稿共七十二页哦
第二节 均值比较与参数检验
❖ 一、均值比较 ❖ (一)均值比较的概念和基本步骤 ❖ 统计分析常常采取抽样研究的方法,即从总体中随机
抽取一定数量的样本进行研究来推论总体的特性。能否 用样本均数估计总体均数?两个变量均数接近的样本是 否来自均值相同的总体?这就要进行均值比较。
量的分析。具体含义是:
统计学习理论中的非参数检验方法
统计学习理论中的非参数检验方法统计学习理论是一种研究如何通过数据来进行预测和决策的学科。
它提供了一种对数据进行分析和推断的方法,其中非参数检验方法起着重要的作用。
非参数检验方法是指不对总体分布做任何假设或者对总体分布进行某种特定形式的参数化约束的统计检验方法。
一、概述统计学习理论中的非参数检验方法是一种基于样本数据的统计推断方法,它不依赖于总体分布的具体形式,而是基于样本数据的经验分布进行推断。
与参数检验方法相比,非参数检验方法具有更广泛的适用性和更强的鲁棒性。
二、常用的非参数检验方法1. Wilcoxon秩和检验:Wilcoxon秩和检验是一种非参数的配对样本检验方法,用于比较两组相关样本的均值差异。
它基于样本数据的秩次来进行推断,不依赖于总体分布的具体形式。
2. Mann-Whitney U检验:Mann-Whitney U检验是一种非参数的独立样本检验方法,用于比较两组独立样本的均值差异。
它基于样本数据的秩次来进行推断,不依赖于总体分布的具体形式。
3. Kruskal-Wallis H检验:Kruskal-Wallis H检验是一种非参数的多组独立样本检验方法,用于比较多组独立样本的均值差异。
它基于样本数据的秩次来进行推断,不依赖于总体分布的具体形式。
4. Friedman检验:Friedman检验是一种非参数的多组配对样本检验方法,用于比较多组配对样本的均值差异。
它基于样本数据的秩次来进行推断,不依赖于总体分布的具体形式。
5. 卡方检验:卡方检验是一种非参数的拟合优度检验方法,用于检验观察值与理论值之间的偏差程度。
它适用于分类变量的分析,不依赖于总体分布的具体形式。
三、非参数检验方法的优缺点非参数检验方法具有以下优点:1. 不依赖于总体分布的具体形式,对数据的偏离程度不敏感;2. 适用性广泛,可以应用于不同类型的数据和问题;3. 无需对参数进行估计,简化了统计推断的过程。
然而,非参数检验方法也存在一些限制:1. 样本量要求较大,否则可能出现效果不稳定的情况;2. 结果的解释相对复杂,不如参数检验方法直观。
非参数检验
非参数检验非参数检验是一种统计方法,用于比较两组或多组数据的差异或关联性,它并不依赖于数据的分布假设。
相比于参数检验,非参数检验通常更为灵活,可应用于各种数据类型和样本量,尤其在数据不满足正态分布的情况下表现优势。
本文旨在介绍非参数检验的基本原理、应用领域以及常见方法。
首先,非参数检验的基本原理是依赖于样本中的秩次,即将原始数据转化为秩次数据进行统计分析。
秩次是数据在全体中的相对位置,将数据转化为秩次可以消除异常值对统计结果的影响,并使数据的分布不再成为限制因素。
非参数检验的应用领域广泛,包括但不限于以下几个方面。
一、假设检验非参数检验可用于假设检验,比如检验两组样本的中位数是否存在差异。
常见的方法有Wilcoxon符号秩检验、Mann-Whitney U检验等。
在实际应用中,如果数据的分布无法满足正态分布假设,非参数检验则是一种理想的选择。
二、相关性分析非参数检验可用于判断两个变量之间的关联性。
常见的方法有Spearman秩相关系数检验、Kendall秩相关系数检验等。
这些方法的核心思想是将原始数据转化为秩次数据,通过秩次数据之间的比较来判断两个变量之间是否存在显著相关。
三、分组比较非参数检验可用于比较多个样本之间的差异。
常见的方法有Kruskal-Wallis检验、Friedman检验等。
这些方法可用于比较三个以上的样本组之间的差异,而不依赖于数据的分布假设。
在实际应用中,非参数检验需要注意以下几个问题。
一、样本容量非参数检验对样本容量的要求相对较低,适用于小样本和大样本。
然而,在样本容量较小的情况下,非参数检验可能会产生较大的误差,因此应根据实际情况选择合适的方法。
二、数据类型非参数检验可应用于各种数据类型,包括连续型数据和离散型数据。
但对于有序分类数据、定序数据和名义数据,非参数检验相较于参数检验有更好的适用性。
三、分布假设非参数检验不需要对数据的分布做出假设,这使得它更加灵活。
但是,如果数据满足正态分布假设,参数检验也是一种较为有效的选择。
非参数检验
非参数检验的优点:
①适用范围广,不论样本来自的 总体分布形式如何,都可适用;
②某些非参数检验方法计算简便, 研究者在急需获得初步统计结果时可 采用;
的总体分布不同。 α=0.05
2.混合编秩
依据两组数值由小到大编秩,结果 见上表。
3.求秩和并确定检验统计量T
把两组秩次分别相加求出两组的秩 和值,R1=315.5,R2=149.5。因乳 酸钙组样本含量较小,故 T=R2=149.5。
4.确定P值和作出推断结论 以较小样本含量为n1,n1=14, n2n1=2,查附表6,两样本比较秩和检验 用T界值表(双侧)。
当n1>20或(n2-n1)>10时,附表6 中查不到P值,则可采用正态近似法求u 值来确定P值,其公式如下:
u T n1(N 1) / 2 0.5 n1n2(N 1) 12
上式中T为检验统计量值,n1、n2 分别为两样本含量,N=n1+n2,0.5这 连续性校正数。上式为无相同秩次时使 用或作为相同秩次较少时的近似值。当 两样本相同秩次较多(超过总样本数的 25%)时,应按下式进行校正,u经校 正后可略增大,P值则相应减小。
式中,Ri为各组的秩和,ni为各组 样本含量,N为总样本含量。
当各组相同秩次较多时,可对H值进 行校正,按下式求值。
Hc H c
C 1
(t
3 j
t
j
)
(N3 N)
4.确定P值和作出推断结论
当组数K=3,每组样本含量ni≤5时, 可查附表7(H界值表)得到P值。若 k>3或ni>5时,H值的分布近似于自 由度为k-1的χ2分布,此时可查附表 4χ2界值表得到P值。最后按P值作出 推断结论。
非参数统计讲义
秩 9.5 14.0 12.0 21.0 7.5 9.5 2.0 17.5 7.5 14.0 17.5 24.0
Histogram
For GROUP= Group2
6
5
4
3
2
Frequency
1 0 0.0 5.0 10.0 15.0 20.0 25.0
Std. Dev = 9.17 Mean = 14.8 N = 15.00
定义(连续分布) 定义(连续分布)
假定X ~ f ( x), 令0 < p < 1, 满足等式F ( x)=p( X < m p ) = p 的唯一根m p 称为F ( x)的分位数。
二、秩统计量 1、秩统计量 设X1,X2,X3,…,Xn 来自总体的样本,记Ri为样本 点Xi 的秩,即样本中小于或等于Xi 的样本点的个数, n 即
44 33 22 8 47 31 40 30 33 35 18 21 35 28 22
26.0 19.5 5.5 1.0 27.0 16.0 25.0 14.0 19.5 22.5 3.0 4.0 22.5 11.0 5.5
Histogram
For GROUP= Group1
6
RANK of SCORE
注意:非参数统计的名字中的“ 注意:非参数统计的名字中的“非参数 (nonparametric)” (nonparametric) 意味着其方法不涉及描述总 体分布的有关参数;它被称为和分布无关 体分布的有关参数;它被称为和分布无关 (distribution—free) free), (distribution free),是因为其推断方法和 总体分布无关;不应理解为与所有分布( 总体分布无关;不应理解为与所有分布(例如有 关秩的分布)无关. 关秩的分布)无关. 什么是非参数统计? 什么是非参数统计? 不假定总体分布的具体形式, 不假定总体分布的具体形式,从数据本身获得 所需要的信息, 所需要的信息,通过推断方法得到相关结论的 一种分析方法。 一种分析方法。
非参数检验
➢ 编秩:数据相等则取平均秩,
➢ 求秩和
➢ 计算检验统计量H值
H 12 N(N 1)
Ri2 3( N 1) ni
出生体重(kg)xij ABCD
相应秩次 Rij A BCD
2.7 2.9 3.3 3.5
3
4
7 11
2.4 3.2 3.6 3.6
2 5.5 12.5 12.5
2.2 3.2 3.4 3.7
χ 2 12
R
2 i
3(N1)
N(N1) ni
χ2
12 14(14 1)
152
4
152 3
37.52 4
37.52 3
3(14
1)
χ 2 9.375
χ
2 c
1
χ2
(t
3 j
t
j
)
n3 n
1
(23
9.375 2) (33 3) (23
143 14
2)
9.50
四、随机区组设计资料的秩和检验 (Friedman test)
正态近似法
如果n1或n2-n1超出附表的范围,可按下式 计算u值:
u | T n1(N 1) / 2 | 0.5 n1n2 (N 1) / 12
在相同秩次较多时,应用下式进行校正:
uC u / C
C 1
(t
3 j
t
j
)
/(N
3
N)
tj为第j组相同秩次的个数
频数表资料(或等级资料)两样本资料比较
xi (2) 86 71 77 68 91 72 77 91 70 71 88 87
12 对双胞胎兄弟心理测试结果
后出生者得分 差 值
统计学非参数检验
非参数检验的弱点
可能会浪费一些信息 特别当数据可以使用参数模型
的时候 大样本手算相当费事 一些表不易得到
参数检验
〔parametric 总体分t布es类t〕型,对未知
➢ 在参数检验和非参数检验都可以使用的情况下, 非参数检验的成效〔power〕要低于参数检验方 法。
以下情况下应当首选非参数方法
➢ 参数检验中的假设条件不满足,从而无法应用。例 如总体分布为偏态或分布形式未知,且样本为小样 本时。
➢ 检验中涉及的数据为定类或定序数据。 ➢ 所涉及的问题中并不包含参数,如判断某样本是否
在非正态总体小样本的情况下,假如要对总体 分布的位置进展推断,由于t检验不适用,也 可使用符号检验的方法。
在数据呈偏态分布的情况下,我们可能对总体 的中位数更感兴趣,希望对总体的中位数作出 推断,这时可以使用符号检验的方法。
例6.3 在某地区随机调查了60个家庭的月收入。 〔数据文件:家庭月收入.sav〕。根据样本数 据能否认为总体中家庭月收入的中位数等于 5000元〔显著性程度a=0.05〕?
c2统计量的分布与自由度有关; c2统计量描绘了观察值与期望值的接近程度
拟合优度检验〔goodness of fit test〕
用c2统计量进展统计显著性检验的重要内容之 一;
根据总体分布状况,计算出分类变量中各类别 的期望频数,与分布的观察频数进展比照,判 断期望频数与观察频数是否有显著差异,从而 到达对分类变量进展分析的目的。
非参数统计的名字中的“非参数(nonparametric) 〞意味着其方法不涉及描绘总体分布的有关参 数;
参数统计和非参数统计
tJ是有相同秩号的数据个数
例8-4 39名吸烟工人和40名不吸烟工人的碳氧血红蛋白HbCO(%) 含量见表8-6。问吸烟工人的HbCO(%)含量是否高于不吸烟工人 的HbCO(%)含量?
表 8–6 吸烟工人和不吸烟工人的 HbCO(%)含量比较
含量 吸烟工人 不吸烟工人 合计 秩范围 平均秩
(1) 很低 低 中 偏高 高 合计 (2) 1 8 16 10 4 39(n1) (3) 2 23 11 4 0 40(n2) (4) 3 31 27 14 4 79 (5) 1~3 4~34 35~61 62~75 76~79 — (6) 2 19 48 68.5 77.5 —
数检验。 对于等级资料,若选行×列表资料的χ 2检验,只 能推断构成比差别,而选秩转换的非参数检验,可 推断等级强度差别。
秩次与秩和
秩次(rank),秩统计量 是指全部观察值按某种顺序排列的位序;
秩和(rank sum) 同组秩次之和。
编
秩
A组: - 、、+、+、+、++ B组: +、++、++、++、+++、+++
例8-2 已知某地正常人尿氟含量的中位数为45.30。今在 该地某厂随机抽取12名工人,测得尿氟含量见表8-2第 (1)栏。问该厂工人的尿氟含量是否高于当地正常人的 尿氟含量?
表 8-2 某厂 12 名工人的尿氟含量(μmol/L)与 45.30 比较
尿 含 氟 量
mol/L
(1) – 45.30 (2) -1.09 0.00 1.09 4.17 5.75 7.86 7.96 12.07 17.86 22.07 25.75 42.07
非参数检验的概念与过程
非参数检验的概念与过程导言在统计学中,非参数检验是一种不依赖于总体分布假设的方法,用于对数据进行统计推断。
与参数检验相比,非参数检验更加灵活,适用于各种数据类型和样本量的情况。
本文将介绍非参数检验的基本概念及其应用过程。
什么是非参数检验?在传统的统计推断中,我们通常需要假设数据的总体分布满足某种特定的参数化模型(如正态分布)。
然而,在实际应用中,我们并不总是了解或能够准确描述数据的分布。
此时,非参数检验成为一种有力的工具。
非参数检验不依赖于总体分布的假设,而是在不对数据做过多假设的情况下,通过对样本数据的排序、秩次转换等操作,进行统计推断。
非参数检验的应用场景非参数检验广泛应用于多个领域,特别是当数据不满足参数化分布假设时。
下面列举几个常见的应用场景:1. 样本量较小在样本量较小的情况下,参数化方法可能对数据分布的假设过于苛刻,导致结果不够准确。
而非参数检验则不对数据分布做过多要求,能够更灵活地处理小样本数据。
2. 数据不满足正态分布假设正态分布假设是很多参数检验方法的基础前提。
但在实际问题中,数据往往并不服从正态分布。
非参数检验不需要对数据做分布假设,因此更适用于处理不满足正态分布假设的数据。
3. 数据有序或等级性质对于无法直接度量或比较数值大小的数据,如排名数据、生活满意度评价等,非参数检验提供了一种适用的方法。
通过对数据的秩次进行比较,我们可以推断出两组数据是否存在显著差异。
非参数检验的基本过程非参数检验通常包括以下几个基本步骤:1. 建立原假设和备择假设在进行非参数检验之前,我们需要明确所研究的问题,并建立原假设(H0)和备择假设(H1)。
原假设通常是指两组样本没有显著差异,而备择假设则相反。
2. 选择合适的非参数检验方法根据实际问题和数据类型的特点,选择合适的非参数检验方法。
常用的非参数检验方法包括Wilcoxon秩和检验、Mann-Whitney U检验、Kruskal-Wallis单因素方差分析等。
一多元统计分析讲座非参数检验
文然件后中 分类别别计 1算代非两表组D参样BB本方数秩式的,检累类计别验频2数代并和表累D非B计方频式要率);。取代参数检验,而是作为参数检验的一 个有力的补充。 Cochran Q检验的基本思路为:当n个样本在k个指标上没有显著差异时,“1”和“0”应当随机分布在各行各列中,各行各列中“1”的数量
一多元统计分析讲座非参数检 验
1
2
非参数检验基本原理 单样本非参数检验 两独立样本非参数检验 多独立样本非参数检验 两相关样本非参数检验 多相关样本非参数检验 非参数检验SPSS实例
4
非参数检验是相对于参数检验而言的,是指在总体分布未 知或知之甚少时,利用已知样本数据对总体分布形态做出 推断的方法。
非参数检验主要是利用样本数据之间的大小比较及大小顺 序,对两个或多个样本所属总体的分布是否相同进行检验, 而不对总体分布的参数如平均数、标准差等进行统计推断。
5
相对于参数检验,非参数检验的优点包括: ✓对总体的假定相对较少,效率高,结果一般有较好的稳 定性; ✓不仅适用于定比数据和定距数据的检验,还适用于定类 数据和定序数据的检验,可以解决参数假设检验无法解 决的定性资料的检验问题; ✓思想容易理解,计算简单,尤其适用于小样本。
在一个连续符号排列中,所谓游程就是一个具有相同符号 的连续串,在它前后相接的是与其不同的符号或者完全没 有符号。
12
设 x1, x2 , , xm 和 y1, y2, , yn是分别来自同总体X和Y的随机样 本数据,将这两个样本合在一起,并按照从小到大的顺序 排列,得到次序统计量:z1, z2, , zmn 。如果将次序统计量 中来自于总体X的样本值记为0,来自于总体Y的样本值记 为1,仍然按照原顺序表示次序统计量,则得到了一个由0 和1构成的序列。将连续出现0(或者连续出现1)的一组 数分别称为0的游程(或者1的游程),一个游程中包含0 (或者1)的个数成为游程长度。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二讲 非参数检验1. 实验目的1.了解非参数假设检验基本思想;2.会用SAS 软件中的proc npar1way 过程进行非参数假设检验和proc freq 过程进行列联表的独立性检验。
2. 实验要求1.会用SAS 软件建立数据集,并进行统计分析;2.掌握proc npar1way 过程进行非参数假设检验的基本步骤;3.掌握proc freq 过程进行列联表的独立性检验的基本步骤。
3. 实验基本原理3.1 符号检验0:H 两种方法的处理效果无显著性差异令10i i I i ⎧=⎨⎩第个个体中新方法优于对照方法第个个体中新方法劣于对照方法1,2,,i N =L 统计量1NN i i S I ==∑N S 表示新方法的处理效果优于对照方法的配对组总数。
若新方法的处理效果显著的优于对照方法,则N S 的值应明显偏大。
因此,若对给定的置信水平α,有 {}N P S c α≥<,则拒绝0H 。
0H 为真时,(1)N S 服从二项分布1(,)2b N (),()24N N N N E S Var S ==。
拒绝域为:{}N N S Sc >(2)由中心极限定理可知,当2,1N N S N -→∞的零分布趋于标准正态分布。
拒绝域为:N S u α⎧⎫⎪⎪⎪⎪>⎨⎬⎪⎪⎪⎪⎩⎭3.2 Wilcoxon 秩和检验(1)单边假设检验0:H 两种方法的处理效果无显著性差异 as 1:H :新方法优于对照方法。
用于检验0H 的统计量为:1ns i i W I ==∑若对给定的置信水平α,有 {}s P W c α≥<,则拒绝0H 。
且s W 的分布列为:0#{;,}{}H s w n m P W w N n ==⎛⎫ ⎪⎝⎭根据观测结果计算s W 的观测值0s W ,计算检验的p 值:00{}{}s H s s H s k w p P W w P W k ≥=≥==∑然后将p 值与显著水平α作比较,若p α<,则拒绝0H ,否则接受0H 。
(2)双边假设检验给定的显著水平21,c c 和α应该满足:ε=≥+≤}{}{2100c W P c W P A H A H仅由上式还不能唯一确定21c c 和,当我们对两种方法谁优谁劣不得而知时,通常取2}{}{2100α=≥=≤c W P c W P A H A H若利用p 值进行检验,设A A W ω的观测值为,计算概率值}{}{00A A H A A H W P W P ωω≤≥或由对称性可知,检验的p 值为上述两概率中小于1/2的那一个的2倍。
例如21W P 0A A H 0}<{ω≥≤则}{20A A H W P p ω≥=。
求出p 值后,若p<a ,拒绝0H ,否则接受。
(3)列联表的独立性检验0:H 方法的处理效果无显著性差异ijk π:表示格子概率,ijk ijk m n π=表示三维列联表中事件发生的理论频数。
将概率用相应的频率频率去估计。
令222111ˆ()~()ˆr s tijk ijk i j k ijk n m Q f m χ===-=∑∑∑ 其中:(1)()f rst =--为检验特定独立性所需要独立估计的概率数目 将样本数据代入统计量进行检验。
然后将P 与显著水平α作比较,若p α<,拒绝0H ,否则接受0H 。
4. 实验相关SAS 知识(1)独立样本的秩检验——proc npar1way 过程proc npar1way 过程的基本语句形式为proc npar1way [options];class variables;(proc npar1way 过程不可缺少的语句)exact;(求出检验的精确p 值)var variables;其中“options ”可包含以下选项的部分或全部:①DATA=数据集名:指定要分析的数据集。
②ANOVA :对原始数据执行标准的单因素方差分析。
③WILCOXON :进行wilcoxon 型秩和检验。
当有两种处理方法时,进行的是wilcoxon 秩和检验;当有多种处理方法时,进行Kruskall-Wallis 检验。
④EDF :进行基于样本经验分布函数的非参数检验,包括Smirnov 检验。
若省略这些选项,SAS 系统将给出所有基于秩以及经验分布函数的非参数检验方法的分析结果。
(2)列联表的独立性检验proc freq 过程的基本语句形式为proc freq [options];tables variable1*variable2*……/options;weight variable;其中“options ”可包含以下选项的部分或全部:①DATA=数据集名:指定要分析的数据集。
②chisq:要求对生成的每个二维列联表的独立性作2χ检验,并计算依赖于2χ统计量的关联度。
③cellchi2:要求输出每个格子对总2χ统计量的贡献。
④expected:在独立性假定下输出各格子的期望频数。
⑤deviation:要求输出每个格子上的频数与期望频数之差。
⑥nocol:不输出二维列联表各格子的列百分数。
⑦norow: 不输出二维列联表各格子的行百分数。
⑧nofreq:不输出格子频数。
⑨nopercent:不输出各格子的百分数。
⑩noprint:不输出列联表,但允许输出各分析结果。
5. 实验举例5.1 Wilcoxon 秩和检验(单边和双边假设检验)例 1 为了解一种新的术后护理方法和原护理方法相比是否可以显著缩短病人手术后的恢复时间,随机的将做完某种手术的18位病人分为两组,每组9人,按不同方法护理,观测到他们的恢复时间(单位:天)如下:原方法:20,21,24,30,32,36,40,48,54新方法:19,22,25,26,28,29,34,37,38在05.0=α下检验新方法是否显著的缩短了病人手术后的恢复时间。
Wilcoxon 秩和单边假设检验SAS 程序如下:data a1;input method $ time@@;cards ; a 20 a 21 a 24 a 30 a 32 a 36 a 40 a 48 a 54 b 19 b 22 b 25 b 26 b 28 b 29 b 34 b 37 b 38 ;proc npar1way data =a1 wilcoxon ;class method;exact ;run ;结果显示α>=2181.0p ,故接受原假设0H ,即认为病人手术后采用新旧护理方法对其恢复时间无显著差异。
5.2.Smirnov 检验例2(数据见教材)SAS 程序如下:data a1;input group $ time@@;cards ; a 6.8 a 3.1 a 5.8 a 4.5 a 3.3 a 4.7 a 4.2 a 4.9 b 4.4 b 2.5 b 2.8 b 2.1 b 6.6 b 0.0 b 4.8 b 2.3 ;proc npar1way data =a1 edf ;class group;exact ;var time;run ;运行结果显示p=0.0879>0.05,即认为两种止痛药效果无显著差异;但在0.1水平上可认为两者有显著差异。
5.3.Wilcoxon 符号秩检验例3(见教材例题2.8)SAS 程序如下:data a;input id product1 product2;cards ;1 459 4142 367 3063 303 3214 392 4435 310 2816 342 3017 421 3538 446 3919 430 40510 412 390;data b;set a;diff=product1-product2;proc univariate data=b;var diff;run;运行结果显示:符号秩和检验的p值为0.1094>0.05,故认为两复合肥无显著差异;而Wilcoxon秩和检验的p值为0.0488<0.05,故认为新复合肥能显著提高小麦的产量。
5.4 多种处理方法比较的Kruskal-Wallis检验例4(见教材例题2.10)SAS程序如下:data a;input group $ weight@@;cards;a 164 a 190 a 203 a 205 a 206 a 214 a 228 a 257b 185 b 197 b 201 b 231c 187 c 212 c 215 c 220 c 248 c 265 c 281d 202 d 204 d 207 d 227 d 230 d 276;proc npar1way data=a wilcoxon;class group;(不要加入exact语句,运行非常耗时!)var weight;run;运行结果显示Pr > Chi-Square =0.2394>0.05,故认为四种食谱的营养效果无显著差异。
5.5 Friedman检验例5(见教材例题2.12)SAS程序如下:data a;input person $ emotion $ v@@;cards;p1 e1 23.1 p1 e2 22.7 p1 e3 22.5 p1 e4 22.6p2 e1 57.6 p2 e2 53.2 p2 e3 53.7 p2 e4 53.1p3 e1 10.5 p3 e2 9.7 p3 e3 10.8 p3 e4 8.3p4 e1 23.6 p4 e2 19.6 p4 e3 21.1 p4 e4 21.6p5 e1 11.9 p5 e2 13.8 p5 e3 13.7 p5 e4 13.3p6 e1 54.6 p6 e2 47.4 p6 e3 39.2 p6 e4 37.0p7 e1 21.0 p7 e2 13.6 p7 e3 13.7 p7 e4 14.8p8 e1 20.3 p8 e2 23.6 p8 e3 16.3 p8 e4 14.8;proc freq;tables person*emotion*v/scores=rank cmh noprint;run;运行结果显示p值为0.0917>0.05,故认为在催眠状态下,受试者对4种情绪状态的反应无显著差异。
5.6 列联表的独立性检验例6(数据见教材例题)SAS程序如下:data penalty;input p $ d $ count@@;cards;y w 19 y b 17 n w 141 n b 149;proc freq data=penalty;tables p*d/chisq expected nocol norow nopercent;weight count;run;6. [ 本次实验]为了研究两种化学添加剂对电池寿命的影响,对13个同类型的电池,随机的抽取6个加入甲种添加剂,其余7个加入乙种添加剂,各组电池寿命如下(单位:小时):甲组:18 24 25 27 30 35乙组:20 21 28 32 34 38 40对α=0.10,检验两种添加剂下电池的寿命是否有显著差异。