非参数检验
第6章 非参数检验
3 1
17
8.5
8 4
5 2
13 6
7 3
19 10
8+9 = 8.5 2
中央财经大学统计学院 37
Wilcoxon符号秩检验:基本原理 符号秩检验: 符号秩检验
分别计算出差值序列中正数的秩和以及负 数的秩和。 显然,如果零假设成立,W+与W-应该比较 接近。如果二者过大或过小,则说明零假 设不成立。 将正数的秩和或者负数的秩作为检验统计 量,根据其统计分布计算p值,从而可以得 出检验的结论。
中央财经大学统计学院 38
特别说明
符号检验在匹配数据分析应用中只用到差 值的符号,而对差值数值的大小未能考虑, 因而失去了部分信息。Wilcoxon符号秩检 验既考虑差值的符号,又考虑差值的大小, 因此在所需的假设条件满足时其功效比符 号检验高。 Wilcoxon符号秩检验也可以用于单样本中 位数的非参数检验,这时只需要将第二个 样本的值设为零假设中的数值即可。
中央财经大学统计学院 33
符号检验
对于差值序列中正数的个数和负数的个数 按照符号检验的方法进行假设检验
中央财经大学统计学院
34
Wilcoxon符号秩检验:基本原理 符号秩检验: 符号秩检验
计算差值绝对值的秩 。 将差值绝对值从小到大排序,其位次就是 的秩(rank),等于0值不参与排序。
中央财经大学统计学院
中央财经大学统计学院 18
软件操作
在SPSS软件中打开数据文件,选择“分析” “非参数检 验” “1样本K-S”,在弹出的对话框中将“时间”设定为 检验变量;检验分布为默认的“常规”(正态分布)。单 击 “确定”
中央财经大学统计学院
19
结果分析
非参数检验
非参数检验的概念
非参数检验又称为任意(不拘) 非参数检验又称为任意(不拘)分布检验 distributiontest), ),这类方法 (distribution-free test),这类方法并不依赖总
非 参 数 检 验
体分布的具体形式,应用时可以不考虑研究变量 体分布的具体形式, 为何种分布以及分布是否已知,进行的是分布之 为何种分布以及分布是否已知, 间而不是参数之间的检验,故又称非参数检验
参数检验的特点
分析目的:对总体参数(µ π)进行估计或检验。 进行估计或检验。 分析目的:对总体参数(
非 参 数 检 验
分布:要求总体分布已知, 分布:要求总体分布已知,如:
•连续性资料——正态分布 连续性资料——正态分布 •计 数 资 料——二项分布、POISSON分布等 ——二项分布 POISSON分布等 二项分布、
序号 (1) 1 2 3 4 5 6 7 8 9 10 11 12
数据 (2) 39 42 45 43 52 45 22 48 40 45 40 49
排秩 ( 3)
非 参 数 检 验
非 参 数 检 验
疗效
A组 (1 ) 15 11 20 8
B组 (2 ) 12 3 7 4
排秩
平均秩次
控制 显效 有效 近控
参数检验方法的局限
非 参 数 检 验
t检验 成组t 成组t检验要求:正态、方差相等、个体独立 配对t 配对t检验要求:差值正态、个体独立 方差分析 单因素多水平比较方差分析要求:正态、方差 相等、个体独立 多个分析因素时方差分析要求:分布、方差、 个体独立性
定性无序分类资料
非 参 数 检 验
两组性别结构是否相同? 两组某种不良反应的发生率是否相同? 多组发生率是否相同? 多组构成是否相同?
T检验与非参数检验
02
t检验的种类
单样本t检验
总结词
用于检验一个样本均值与已知的某个值或某一组值的差异是否显著。
详细描述
单样本t检验是用来比较一个样本的均值与已知的某个值或某一组值的差异是否显著的统计方法。它通常用于检 验一个样本的平均值是否显著不同于某个特定的标准值,或者是否显著不同于另一个已知的样本均值。
配对样本t检验
与参数检验相比,非参数检验在假设 较少的情况下仍能提供有效的推断依 据。
非参数检验的适用范围
当总体分布未知或不符合正态分布时 ,非参数检验是一个合适的选择。
当数据不符合正态分布或总体分布未 知时,参数检验可能无法得出准确的 结论,而非参数检验不受这些限制。
非参数检验的特点
灵活性
非参数检验不依赖于特定的总体分布,因此可以应用 于多种不同类型的数据和情境。
详细描述
1. 正态分布
2. 独立性
3. 方差齐性
t检验的前提假设包括正 态分布、独立性和方差 齐性。
在应用t检验时,需要满 足以下前提假设
样本数据应来自正态分 布的总体,或至少可以 近似为正态分布。
两组样本数据应相互独 立,即一个样本的数据 不影响另一个样本的数 据。
两组样本的方差应具有 齐性,即它们的波动程 度相似。如果不能满足 方差齐性的假设,可能 需要使用其他统计方法 ,如Welch's t检验或 Satterthwaite's近似法 。
t检验的适用范围
总结词
t检验适用于检验两组独立或配对样本的均值差异,常用于小样本数据或总体分布不明 确的情况。
详细描述
t检验适用于比较两组独立样本的均值,例如在不同条件下选取的两个样本。此外,它 也适用于比较同一总体选取的两个配对样本的均值,例如同一对象在不同时间点的测量
8非参数检验
②正态近似法:
u | T n0 ( N 1) / 2 | n1n2 ( N 1) / 12
本例u 2.205 0.05/ 2 1.96
N3 N ; 3 3 N N (ti ti )
i
*校正公式(当相同秩次较多时)
uc u c; c
ti为第i个相同秩号的数据个数
假定:两组样本的总体分布形状相同
如果两总体 分布相同
基本思想
两样本来自同一总体 任一组秩和不应太大或太小
T 与平均秩和 n0 (1 N ) / 2 应相差不大
较小例数组的秩和, n1 n2 T min( R1 , R2 ), n1 n2
N n1 n2 n0 min( n1 , n2 )
控制 显效 有效 近控
65 18 30 13 126
107 24 53 24
1-107 108-131 132-184 185-208
54 119.5 158 196.5
编号 1 2
病情 单纯型 单纯型合并肺气肿
疗效 控制 显效
3
4 … 206 207
单纯型合并肺气肿
单纯型 … 单纯型 单纯型合并肺气肿
10 12(12 1) / 4 | R n(n 1) / 4 | u 2.275 n(n 1)(2n 1) / 24 12(12 1)(2 12 1) / 24
查标准正态分布表,得 P 值 校正公式: (当相同秩次个数较多时)
u
| R n(n 1) / 4 | n(n 1)(2n 1) / 24 (ti3 ti ) / 48 10 12(12 1) / 4
第一节 非参数检验的概念
非参数检验
200
取显著性水平为0.05,查 2 分布表得临界值
2 0.05
(4)
9.488
,由于
2统计量大于临界值,所以应该拒
绝原假设,即认为消费者对各种品牌茶叶的偏好是有差
别的。
二、符号检验
1. 单样本位置的符号检验
一个随机样本,有 n 个数据
x1,x2,…,xn,其实际的总体中位数为
M,假定的中位数是某个特定值,记 做 M0 。位置检验是检验真实的中位 数和假定的中位数的关系:大于、等 于还是小于。
品牌,每一种只标上A、B、C、D、E,随机抽取1000消费 者,每人都品尝五种茶叶,然后把最偏好的茶叶的字母 写下来。下表是整理后的消费者偏好的频数分布。要求 判断消费者对这几种品牌茶叶的偏好有没有差异?
各种品牌茶叶爱好者的频数分布
喜欢的品牌
A B C D E
合计
人数
220 302 175 80 223
一、 检验
属于拟合程度检验,它是利用随机 样本对总体分布与某种特定
分布拟合程度 的检验 。
检验步骤:
① 确立原假设和备择假设。 ② 按照“原假设为真”的假定,导出 一组期望频数或理论频数。 ③ 计算 2 统计量 。
2 k ( fi ei )2
i1
ei
若统计量的值较大,拒绝原假设。
【例10.14】假定有五种不同牌号的茶叶,但都未标明
市场调查
【例10.15】领导者的领导水平是可以训练的吗?
根据人的聪明程度、人品、受教育状况等,随机抽取30 人配成15对,每对中有一人随机选择受训,另一人不受 训。经过一段时间后,按被设计好的问题评价他们的领 导水平,结果如下表所示。
领导水平评价表
SPSS数据分析教程-第6章-非参数
Median test
独立样本检验举例
➢ 一个公司把他们的销售代表随机分到三个 不同的组中,进行不同的培训。两个月后 对销售进行考察,我们想通过非参数检验 比较不同组别的销售代表考试得分是否有 显著性差异。这里,不同组别的考试得分 是相互独立的,因此为独立样本数据,我 们采用独立样本非参数检验。
➢
独立样本包括两个独立样本或者两个以上的独 立样本。
➢ SPSS提供的独立样本非参数检验的方法有:
两个独立样本分布的比较
Mann-Whitney U
Kolmogorov-Smimov
Wald-Wolfowitz K个独立样本分布的比较
Kruskal-Wallis
Jonckheere-Terpstra 比较全矩
➢ Wilcoxon符号秩检验用于检验样本所来自的 总体的中位数和所给的值是否有显著区别。 该检验适用于连续型数据(或者尺度数 据),它把观测值和原假设的中心位置之 差的绝对值的秩分别按照不同的符号相加 作为其检验统计量。
➢ Wilcoxon符号秩检验的假设为:
样本所来自的总体的中位数等于给定的数值。
游程检验
➢ 游程检验用于检验某一变量的两个值的出 现顺序是否随机,对于连续型变量的随机 性检验也可以转化为只有两个取值的分类 变量的随机性的检验。游程检验通过对样 本观测值的分析,用来检验该样本所来自 的总体序列是否为随机序列(又称为白噪 声序列)。它也可以用来检验一个样本的 观测值之间是否相互独立。
二项式检验
➢ SPSS的二项式检验通过样本数据检验样本 来自的总体是否服从指定的二项分布。例 如,现代社会男、女的比例是否为1.01:1; 工厂的次品率是否为1%等都可以通过二项 式检验完成。
非参数检验
非参数检验非参数检验是一种统计方法,用于比较两组或多组数据的差异或关联性,它并不依赖于数据的分布假设。
相比于参数检验,非参数检验通常更为灵活,可应用于各种数据类型和样本量,尤其在数据不满足正态分布的情况下表现优势。
本文旨在介绍非参数检验的基本原理、应用领域以及常见方法。
首先,非参数检验的基本原理是依赖于样本中的秩次,即将原始数据转化为秩次数据进行统计分析。
秩次是数据在全体中的相对位置,将数据转化为秩次可以消除异常值对统计结果的影响,并使数据的分布不再成为限制因素。
非参数检验的应用领域广泛,包括但不限于以下几个方面。
一、假设检验非参数检验可用于假设检验,比如检验两组样本的中位数是否存在差异。
常见的方法有Wilcoxon符号秩检验、Mann-Whitney U检验等。
在实际应用中,如果数据的分布无法满足正态分布假设,非参数检验则是一种理想的选择。
二、相关性分析非参数检验可用于判断两个变量之间的关联性。
常见的方法有Spearman秩相关系数检验、Kendall秩相关系数检验等。
这些方法的核心思想是将原始数据转化为秩次数据,通过秩次数据之间的比较来判断两个变量之间是否存在显著相关。
三、分组比较非参数检验可用于比较多个样本之间的差异。
常见的方法有Kruskal-Wallis检验、Friedman检验等。
这些方法可用于比较三个以上的样本组之间的差异,而不依赖于数据的分布假设。
在实际应用中,非参数检验需要注意以下几个问题。
一、样本容量非参数检验对样本容量的要求相对较低,适用于小样本和大样本。
然而,在样本容量较小的情况下,非参数检验可能会产生较大的误差,因此应根据实际情况选择合适的方法。
二、数据类型非参数检验可应用于各种数据类型,包括连续型数据和离散型数据。
但对于有序分类数据、定序数据和名义数据,非参数检验相较于参数检验有更好的适用性。
三、分布假设非参数检验不需要对数据的分布做出假设,这使得它更加灵活。
但是,如果数据满足正态分布假设,参数检验也是一种较为有效的选择。
非参数检验
非参数检验的优点:
①适用范围广,不论样本来自的 总体分布形式如何,都可适用;
②某些非参数检验方法计算简便, 研究者在急需获得初步统计结果时可 采用;
的总体分布不同。 α=0.05
2.混合编秩
依据两组数值由小到大编秩,结果 见上表。
3.求秩和并确定检验统计量T
把两组秩次分别相加求出两组的秩 和值,R1=315.5,R2=149.5。因乳 酸钙组样本含量较小,故 T=R2=149.5。
4.确定P值和作出推断结论 以较小样本含量为n1,n1=14, n2n1=2,查附表6,两样本比较秩和检验 用T界值表(双侧)。
当n1>20或(n2-n1)>10时,附表6 中查不到P值,则可采用正态近似法求u 值来确定P值,其公式如下:
u T n1(N 1) / 2 0.5 n1n2(N 1) 12
上式中T为检验统计量值,n1、n2 分别为两样本含量,N=n1+n2,0.5这 连续性校正数。上式为无相同秩次时使 用或作为相同秩次较少时的近似值。当 两样本相同秩次较多(超过总样本数的 25%)时,应按下式进行校正,u经校 正后可略增大,P值则相应减小。
式中,Ri为各组的秩和,ni为各组 样本含量,N为总样本含量。
当各组相同秩次较多时,可对H值进 行校正,按下式求值。
Hc H c
C 1
(t
3 j
t
j
)
(N3 N)
4.确定P值和作出推断结论
当组数K=3,每组样本含量ni≤5时, 可查附表7(H界值表)得到P值。若 k>3或ni>5时,H值的分布近似于自 由度为k-1的χ2分布,此时可查附表 4χ2界值表得到P值。最后按P值作出 推断结论。
第十讲 非参数检验
分析完全随机设计的多样本计量资料时,若多样本观察指标不满足正态性和方差齐性, 不能进行方差分析, 以及多样本观察指标为等级 (有序分类) 资料, 宜采用 Kruskal-Wallis H 秩和检验。
14
第二节秩和检验 —完全随机设计多样本的秩和检验
【例11-4】某医生在研究再生障碍性贫血时, 测得不同程度再生障碍性贫血患者血清中可溶 性CD8抗原水平(U/ml),结果见表11-5,问不 同程度再生障碍性贫血患者血清中可溶性CD8抗 原水平有无差别?
通常规定,当 n1 n2 时,取较小样本的秩和作为检验统计量 T ;当 n1 n2 时,取秩和 较小者作为检验统计量 T 。
9
第二节秩和检验 —成组设计资料的秩和检验
【例11-2】某医院某医生对28例糖尿病早期微血管病 变的患者,按年龄、性别、病程、中医证候评分、生存 质量量表评分、饮食控制等情况,随机分为两组,试验 组采用西药加中药联合治疗方法,对照组采用西药加安 慰剂治疗方法,治疗4周,测定24小时尿蛋白改变量, 结果见表11-3,问该中药对糖尿病患者早期微血管病变 有无疗效?
16
第二节秩和检验 —完全随机设计多样本的秩和检验
【例11-5】探讨中药联合NB-UVB治疗寻常性银 屑病的临床疗效。95例患者分为3组,治疗组35 例给予NB-UVB照射,同时中药浴疗;对照1组33 例予NB-UVB照射,对照2组30例给予中药浴疗。 结果见表11-6,试比较三组疗效是否有差异?
4
第一节 非参数检验简述
表 11-1 参数检验与非参数检验的区别 非参数检验 推断总体分布,如中位数是否相等,是 否符合某种分布 参数检验 推断总体的参数,如算数均数、方 差、率是否相等 已知总体分布:如正态分布、二项 分布、poission 分布
非参数检验
➢ 编秩:数据相等则取平均秩,
➢ 求秩和
➢ 计算检验统计量H值
H 12 N(N 1)
Ri2 3( N 1) ni
出生体重(kg)xij ABCD
相应秩次 Rij A BCD
2.7 2.9 3.3 3.5
3
4
7 11
2.4 3.2 3.6 3.6
2 5.5 12.5 12.5
2.2 3.2 3.4 3.7
χ 2 12
R
2 i
3(N1)
N(N1) ni
χ2
12 14(14 1)
152
4
152 3
37.52 4
37.52 3
3(14
1)
χ 2 9.375
χ
2 c
1
χ2
(t
3 j
t
j
)
n3 n
1
(23
9.375 2) (33 3) (23
143 14
2)
9.50
四、随机区组设计资料的秩和检验 (Friedman test)
正态近似法
如果n1或n2-n1超出附表的范围,可按下式 计算u值:
u | T n1(N 1) / 2 | 0.5 n1n2 (N 1) / 12
在相同秩次较多时,应用下式进行校正:
uC u / C
C 1
(t
3 j
t
j
)
/(N
3
N)
tj为第j组相同秩次的个数
频数表资料(或等级资料)两样本资料比较
xi (2) 86 71 77 68 91 72 77 91 70 71 88 87
12 对双胞胎兄弟心理测试结果
后出生者得分 差 值
统计学非参数检验
非参数检验的弱点
可能会浪费一些信息 特别当数据可以使用参数模型
的时候 大样本手算相当费事 一些表不易得到
参数检验
〔parametric 总体分t布es类t〕型,对未知
➢ 在参数检验和非参数检验都可以使用的情况下, 非参数检验的成效〔power〕要低于参数检验方 法。
以下情况下应当首选非参数方法
➢ 参数检验中的假设条件不满足,从而无法应用。例 如总体分布为偏态或分布形式未知,且样本为小样 本时。
➢ 检验中涉及的数据为定类或定序数据。 ➢ 所涉及的问题中并不包含参数,如判断某样本是否
在非正态总体小样本的情况下,假如要对总体 分布的位置进展推断,由于t检验不适用,也 可使用符号检验的方法。
在数据呈偏态分布的情况下,我们可能对总体 的中位数更感兴趣,希望对总体的中位数作出 推断,这时可以使用符号检验的方法。
例6.3 在某地区随机调查了60个家庭的月收入。 〔数据文件:家庭月收入.sav〕。根据样本数 据能否认为总体中家庭月收入的中位数等于 5000元〔显著性程度a=0.05〕?
c2统计量的分布与自由度有关; c2统计量描绘了观察值与期望值的接近程度
拟合优度检验〔goodness of fit test〕
用c2统计量进展统计显著性检验的重要内容之 一;
根据总体分布状况,计算出分类变量中各类别 的期望频数,与分布的观察频数进展比照,判 断期望频数与观察频数是否有显著差异,从而 到达对分类变量进展分析的目的。
非参数统计的名字中的“非参数(nonparametric) 〞意味着其方法不涉及描绘总体分布的有关参 数;
非参数检验
若n>50,超出附表9的范围,可用正态近似法作u检验,按 下式计算u值。
对秩的差值,省略所有差值为0的对子数,令余下的有效对子数
为n;最后按n个差值编正秩和负秩,求正秩和或负秩和。但对 于等级资料,相同秩多,小样本的检验结果会存在偏性,最好 用大样本。
的多个独立样本所来自的多个总体分布是否有差别。在理论
上检验假设H0应为多个总体分布相同,即多个样本来自同一 总体。由于H检验对多个总体分布的形状差别不敏感,故在实
际应用中检验假设H0可写作多个总体分布位置相同。对立的
备择假设H1为多个总体分布位置不全相同。
1.原始数据的多个样本比较
方法步骤见例8-5.
样本所来自的两个总体中位数是否有差别。方法步骤见例8l。
例8-1 对12份血清分别用原方法(检测时间20分钟)和新 方法(检测时间10分钟)测谷-丙转氨酶,结果见表8-1的(2)、 (3)栏。问两法所得结果有无差别?
血清谷-丙转氨酶不知是否符合正态分布,本例为小样 本资料,其配对差值经正态性检验得0.1<P<0.2,虽可用配对t 检验,为保守起见,现用Wilcoxon符号秩检验。
用于推断计量资 料或等级资料的两个独立样本所来
自的两个总体分布是否有差别。
在理论上检验假设H0应为两个总体分布相同,即 两个样本来自同一总体。由于秩和检验对于两个总体分布 的形状差别不敏感,对于位置相同形状不同但类似的两个 总体分布,如均数相等、方差不等的两个正态分布,推断
不出两个总体分布(形状)有差别,故对立的备择假设Hl不
非参数检验相比于参数检验的缺点
非参数检验相比于参数检验的缺点
1. 较低的功效:在样本容量较小或者总体分布相对简单的
情况下,非参数检验的功效通常会比参数检验低。
这意味着非参数检验可能会更难发现存在的显著差异。
2. 需要更多的数据:为了能够产生可靠的结果,非参数检验可能需要比参数检验更多的样本数据。
3. 难以确定效应大小:与参数检验相比,非参数检验往往难以确定效应的大小。
当我们使用参数检验时,我们可以根据参数的估计值计算效应大小。
但是,在非参数检验中,我们通常需要使用基于排名或任意单位的统计量,这使得效应大小的确定更加困难。
4. 不适用于某些问题:一些问题可能需要特定类型的参数
检验。
例如,当我们需要测量两个总体均值之间的差异时,T检验或方差分析通常比非参数检验更适合。
5. 理解和解释结果可能更困难:与参数检验相比,非参数检验可能更难理解和解释其结果。
这是因为非参数检验通常使用一些非常抽象的统计量,这些统计量难以解释其实际意义。
在这种情况下,解释结果可能需要更深入的统计知识和分析
技能。
生物统计学:非参数检验
{ n+,n-}= n+=2 。
3、统计推断 当n=15时, 查附表11 得 临 界 值K0.05(15)=3 , K0.01(15) = 2 , 因 为 K = 2 = K0.01(15),P≤0.01,表明噪数与总体中位数比较的符号检验
1、建立假设 HO:样本所在的总体中位数=已知总体中 位数; HA :样本所在的总体中位数≠已知总体 中位数。 (若将备择假设 HA 中的“≠”改为“<” 或“>”,则进行一尾检验)
依赖于特定分布类型, 比较的是参数
优点:方法简便、易学易用,易于推广使用、应用范围广;可 用于参数检验难以处理的资料(如等级资料,或含数值 “>50mg”等)。 缺点:方法比较粗糙,对于符合参数检验条件者,采用非参数 检验会损失部分信息,其检验效能低;样本含量较大时,两者 结论常相同。
第一节 符号检验
非参数检验的弱点 可能会浪费一些信息 特别当数据可以使用参数模型的时候 大样本手算相对麻烦 一些表不易得到
参数检验 (parametric test)
非参数检验 (nonparametric test)
已知总体分布类型,对 未知参数进行统计推断
对总体的分布类型不作严 格要求 不受分布类型的影响, 比较的是总体分布位置
124.3 147.9 -15.7 7.9 +
1、提出无效假设与备择假设
HO :该地成年公黄牛胸围的平均数=140厘米, HA :该地成年公黄牛胸围的平均数≠140厘米。
2、计算差值、确定符号及其个数 样本各观测值与总体 平均数的差值及其符号列于表 11-2 ,并由此得 n+=6 ,n-=4 ,
非参数统计的名字中“非参数”意味着其方法不 涉及描述总体分布的有关参数;
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
成组设计多个样本比较的 秩和检验基本思想:
• 如果H0成立,则各样本来自分布相同 的总体,各样本的平均秩次T1/n1、 T2/n2、 T3/n3……应相等或接近,且 都和总体的平均秩次(N+1)/2相差很 小,代公式计算H值越小, H< H0.05 ,P>0.05;
表5.3 四组鼠脾脏DNA的含量(mg)秩和计算表
所来自的两个总体分布是否有差别。
例5.3
• 对无淋巴转移与有淋巴转移的胃癌 患者,观察其生存时间如表,问两 组患者的生存时间是否不同?
表5.2 两组胃癌患者的生存时间(月)比较
无淋巴结转移组
12 25 27 29 38 42 46 46 56 60
有淋巴结转移组
5 8 12 12 12 17 21 24 29 30 34 36 40 48
当H0成立时,随着n增大,T分布逐渐逼 近均数为n(n+1)/4,方差为 n(n+1)(2n+1)/24的正态分布,当n>50 时,T分布已较好地近似正态分布,可采 用正态近似法。
(1)建立检验假设,确定检验水准
H0:Md=0 H1:Md≠0
α=0.05
(2)求统计量T值:
求差值、依差值的绝对值从小到大编 秩,按差值的正、负给秩次冠上符号。 求正秩和、负秩和,统计量T值为3。
n1=10
n2=14
分析步骤
(1)建立检验假设,确定检验水准 H0:两总体分布相同 H1:两总体分布不同 α=0.05 (2)编秩次,求秩和,统计量T值:
编秩方法:
把两个样本数据混合从小到大编秩, 遇两样本有相同数据者取平均秩次, 以例数少的为n1,其秩和(T1)为T;例数 多的为n2。 若两样本例数相同,可取任一样本 的秩和(T1或T2)为T。
第五章 非参数检验
nonparametric test
参数检验的特点
1.分布:要求总体分布呈正态分布或 近似正态分布,对其总体参数做假设 检验,如t检验和方差分析。 2.有严格的适用条件: ①正态分布 ②总体方差齐 ③相互独立样本
条件不满足时—采用非参数检验的方法
非参数检验的概念
又称为任意分布检验(distributionfree test)不考虑总体的参数和总体的 分布类型,应用时可以不考虑研究变 量为何种分布以及分布是否已知,进 行的是总体的分布或分布位置之间的 检验,而不是参数之间的检验,故称 非参数检验。
16.9 17.3 17.4
n1=8
29
30 31 32
T1=216
13.5
13.5 14.8
23
24 27
11.7
12.0 12.3 12.4 13.6
15
16 18 20 25
T3= 123.5
10.5
10.9 11.0 11.5
n4=8
7
9 10 12
T4= 54.5
n2=7
T2=134
n3=9
88.57 80.00 123.72 39.03 24.37 92.75 121.57 89.76 -
48.54 - 17.13 43.40 13.71 4.76 78.25 71.94 45.20 -
6 -3 4 2 1 8 7 5
T- =3 T+ =33
分析步骤:
(1)建立检验假设,确定检验水准 H0:差值的总体中位数 Md=0 H1:差值的总体中位数 Md≠0 α=0.05 (2)求差值,编秩次,求秩和, 统计量T值:
表9.3 两组患者的生存时间(月)比较
无淋巴转移 生存时间 秩次 有淋巴转移 生存时间 5 8 12 秩次 1 2 4.5
12 25 27
4.5 10 11
29
38 42 46 46 56
12.5
17 19 20 21 23
12
12 17 21 24 29
4.5
4.5 7 8 9 12.5
60
24
12 R H N N 1 ni
2 i
3 N 1
若相同秩次较多,应进行校正。
HC 1
H 3 (t j t j ) N N
3
(3)确定P值和推断结论:
当组数k为3,每组例数不超过5时, 查H界值表 如H<H0.05 ,P>0.05; H≥H0.05 ,P≤0.05 当组数k>3或每组例数>5时,则H统 计量近似服从ν=k-1的χ2 分布,查 χ2界值表。
3 j
• 如果相同秩次较多,采用校正公式:
uc
Wilcoxon符号秩和检验的基本思想
T的概率分布是对称的非连续分布, T++T-=n(n+1)/2。当H0成立时,T+与T不会相差很远,都应接近n(n+1)/4, T 值应在界值范围内; 若T值在界值上或范围外,则H0成立的 可能性很小,因此拒绝H0,接受H1。
是否等于零。
例5.1
• 某医生研究白癜风病人的白介素 IL-6在白斑部位与正常部位有无差 异,调查的资料如表5-1:
表5-1 白癜风病人的不同部位IL-6(pg/ml)
编号 白班部位 正常部位 差值d 秩次
1 2 3 4 5 6 7 8 合计
40.03 97.13 80.32 25.32 19.61 14.50 49.63 44.56 -
主要内容
• 配对资料的符号秩和检验 • 完全随机设计两样本比较的秩和检验 • 完全随机设计多个样本比较的秩和检 验
一、配对资料的符号秩和检验
配对设计差值比较的符号秩检验由
Wilcoxon 1945年提出,又称Wilcoxon 符号秩检验(Wilcoxon signed rank
test),常用于检验差值的总体中位数
10.5
10.9 11.0 11.5
n4=8
n2=7
n3=9
分析步骤:
(1)建立检验假设,确定检验水准 H0:各总体分布相同 H1:各总体分布不同或不全相 α=0.05 (2)编秩次,求秩和,统计量H值: 编秩方法:把各组样本数据从小到大 统一编秩,遇来自不同组的相同数据时 取平均秩次,分别计算各组的秩和Ri。
非参数检验方法:
秩和检验 Ridit分析 游程检验……
非参数检验的适用范围
①偏态分布或分布状态不明的计量资料 ②等级资料,目的是推断等级强度差别。 ③开口型资料 ④各总体方差不齐
非参数检验的优点:
它不受总体分布的限制,适用范围广。
非参数检验的缺点:
没有充分利用资料的信息, 检验效能 (1-β)降低。
两样本比较秩和检验的基本思想:
如果H0成立,则两样本来自分布相 同的总体,两样本的平均秩次T1/n1与 T2/n2应相等或接近,且都和总体的平 均秩次(N+1)/2相差很小。取例数较 小的秩和为T,T与n1(N+1)/2应很接近, 即在界值范围内;若T值超出了界值范 围,则H0成立的可能性很小,因此拒绝 H0,接受H1。
表5-4 两组人痰液嗜酸性粒细胞数比较
嗜酸 性粒 细胞 数 人数 健康人 病人 合 计 秩次 范围 平均 秩次 秩和 健康人 病人
+ ++
5 18 16
11 10 3
16
1~16
8.5 30.5 4.0
42.5 549 864
93.5 305.0 162.0
28 17~44 19 45~63
+++
(1)建立检验假设,确定检验水准 H0:四组鼠脾脏DNA含量的总体分布相同 H1:四组鼠脾脏DNA含量的总体分布不同或 不全相 α=0.05 (2)编秩次,求秩和,统计量H值:
2162 1342 123.52 54.52 12 H 332 1 3232 1 10 10 10 8 19.94
(3)确定P值和推断结论:
ν=4-1=3,查χ2界值表,得P<0.005, 按α=0.05水准,拒绝H0,接受H1,差异 有统计学意义,四组鼠脾脏DNA含量的 总体分布不同或不全相同。
四、等级资料的秩和检验
例5.4
• 44例健康人与24例慢性支气管炎病人 痰液嗜酸性粒细胞的检测值(×106 /L)整理成表5-4,问健康人与慢性支 气管炎病人痰液嗜酸性粒细胞数有无 不同?
编秩方法: 依差值的绝对值从小到大编秩。 编秩时注意:遇差值为0者,舍去不计; 差值的绝对值相等,符号不同者应取平 均秩次编秩后,按差值的正负给秩次 冠上符号。
• 求差值为正或负的秩和 差值为正的秩和以T+表示 差值为负的秩和以T-表示。 T++T- = n(n+1)/2 以绝对值较小者作为统计量T值
5
0
5
49
64~68
—
66.0
—
330 T2 = 1785.5
0.0
合 n2=44 计
n1=24
T 1= 560.5
⑴H0:两总体分布相同 H1:两总体分布不同 α=0.05 ⑵求T值,计算u值:
uc T n1 N 1 2 0.5 n1n2 3 3 N N ti ti 12N ( N 1)
(3)确定P值和推断结论:
当5≤n≤50时,查T界值表。若统计量T 值在界值范围内,P>相应概率水平;T在 界值范围外(包含界点),P≤相应概率 水平。
• 当n≥50时,用正态近似法做u检验。
u
T n(n 1) / 4 0.5 nn 12n 1 24
T nn 1 4 0.5 nn 12n 1 t t j 24 48
正常组
测定值 秩次
自发性白血病组
测定值 秩次
移植白血病甲组
测定值 秩次