spss秩和检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

秩和检验
前面介绍的均数的区间估计及假设检验,都是要求个体变量值服从正态分布,或根据中心极限定理,当样本较大时,样本均数服从正态分布。

这种要求样本来自总体分布型是已知的,在此基础上对总体参数进行估计或检验,称为参数统计(parametric statistics)。

但在医学研究中,许多数据不符合参数统计的要求,这时有两种处理的方法。

一是,进行数据转换,使其符合参数统计方法的要求。

二是,选择非参数检验方法,非参数检验(non-parametric test)方法是对样本来自的总体分布不作要求(如不要求样本来自正态分布)的一类假设检验方法。

非参数检验的主要优点是对样本的总体分布不作要求,适用的范围广,尤其是当变量中有不确定数值时,如<0.5mg,可用非参数检验。

同时,非参数检验方法存在其致命的缺点,其检验功效低于相应的参数统计方法。

因此,如果数据符合参数统计的要求首选参数统计方法;如果数据不符合参数统计的要求有两个选择,一是选择非参数检验方法。

下面介绍了属于非参检验的两种秩和检验(rank sum test)方法。

二是,将数据经过变换使其符合参数统计方法,再选择参数统计方法,本节介绍了几种数据变换方法。

应用条件
①总体分布形式未知或分布类型不明;
②偏态分布的资料:
③等级资料:不能精确测定,只能以严重程度、优劣等级、次序先后等表示;
④不满足参数检验条件的资料:各组方差明显不齐。

⑤数据的一端或两端是不确定数值,如“>50mg”等。

一、配对资料的Wilcoxon符号秩和检验(Wilcoxon signed-rank test)
例1对10名健康人分别用离子交换法与蒸馏法,测得尿汞值,如表9.1的第(2)、(3)栏,问两种方法的结果有无差别?
表1 10名健康人用离子交换法与蒸馏法测定尿汞值(μg/l)
样品号(1)离子交换法
(2)
蒸馏法
(3)
差值
(4)=(2) (3)
秩次
(5)
1 0.5 0.0 0.5 2
2 2.2 1.1 1.1 7
3 0.0 0.0 0.0 —
4 2.3 1.3 1.0 6
5 6.2 3.4 2.8 8
6 1.0 4.6 -3.6 -9
7 1.8 1.1 0.7 3.5
8 4.4 4.6 -0.2 -1
9 2.7 3.4 -0.7 -3.5
10 1.3 2.1 -0.8 -5
T+=+26.5
T-=-18.5
差值先进行正态性及方差齐性检验,看是否可以做参数检验,其检验效能高于非参数检验。

(下同)
H0:Md(差值的总体中位数)=0 H1:Md≠0 α=0.05
T++T-=1+2+3+…n=n(n+1)/2
①小样本(n≤50)--查T界值表
基本思想:如果无效假设H0成立,则正负秩和的绝对值从理论上说应相等,都等于n(n+1)/4,既使有抽样误差的影响正负T 值的绝对值相差也不应过大。

反过来说,如果实际计算出的正负T 值绝对值相差很大,我们只能认为H0成立的可能性很小。

界值的判断标准
若下限<T<上限,P 值>表中概率值
若T ≤下限或T ≥上限,则P 值≤表中概率值 ② 大样本时(n>50),正态近似法(Z 检验)
基本思想:假定无效假设H0成立,则正负秩和的绝对值应相等,随着n 增大T 逐渐趋近于均数等于n(n+1)/4、方差为n(n+1)(2n+1)/24的正态分布。

所以可用近似正态法计算Z 值。

即:
24
)
12)(1(5
.0|4/)1(|++-+-=
n n n n n T Z
*校正公式:当相同秩次个数较多时
48
)
(24)12)(1(5.0|4/)1(|3
j j
t t n n n n n T Z -∑-
++-+-=
tj :第j 个相同秩次的个数 SPSS: 建立变量名:
录入数值:
统计分析:
分析——非参数检验——两相关样本(配对样本)
结果分析:
表一:第一行:b-a的负秩(Negative Ranks)有5个(右上角的a在表下方有注释),平均秩次为5.3,负秩和为26.5。

第二行:正秩,正秩的个数,平均秩次,正秩和。

表二:可用正秩和18.5或负秩和26.5计算,习惯上用较小的秩和计算Z值。

p=0.635大于0.05,不拒绝H0,还不能认为两种方法有差别。

二、两个独立样本比较的Wilcoxon秩和检验(Wilcoxon rank sum test)
1.原始数据的两样本比较
例2某实验室观察局部温热治疗小鼠移植肿瘤的疗效,以生存日数作为观察指标,试检验两组小鼠生存日数有无差别?
实验组对照组
生存日数秩次生存日数秩次
10 9.5 2 1
12 12.5 3 2
15 15 4 3
15 16 5 4
16 17 6 5
17 18 7 6
18 19 8 7
20 20 9 8
23 21 10 9.5
90以上22 11 11
12 12.5
13 14
n1=10 T1=170 n2=12 T2=83 时间资料不服从正态分布
H0:两总体分布位置相同H1:两总体分布位置不同a=0.05
记n较小组秩和为T,样本量n1。

如果n1=n2,可取任秩和①查表法:
查T界值表:n1≤10,n2 n1≤10
界值的判断标准:
若下限<T<上限,P值>表中概率值
若T ≤下限或T ≥上限,则P 值≤表中概率值 ② 正态近似法
当n1或n2-n1超出T 界值表的范围时,随n 增大,T 的分布逐渐逼近均数为n(n+1)/4、方差为n(n+1)(2n+1)/24的正态分布,所以可用近似正态法计算Z 值。

即:
12
/)1(5
.0|2/)1(|2111+-+-=
N n n N n T Z
*校正公式(当相同秩次较多时)
c Z Z C /=
∑=)
-/()-(-13
3N N t t C j j SPSS 建立变量名:
录入数值:
Z值为-3.630,p<0.001,拒绝H0
2. 频数表资料(或等级资料)的两样本比较
例320名正常人和32名铅作业工人尿棕色素定性检查结果见下表。

问铅作业工人尿棕色素是否高于正常人?
结果(1)
人数秩次
范围
(5)
平均秩次
(6)
秩和
正常人
(2)
铅作业工人
(3)
合计
(4)
正常人
(7)=(2)(6)
铅作业工人
(8)=(3)(6)
- 18 8 26 1-26 13.5 243 108
2 10 12 27-38 32.5 65 325
++ 0 7 7 39-45 42.0 0 294 +++ 0 3 3 46-48 47.0 0 141 ++++ 0 4 4 49-52 50.5 0 202 合计
n 1=20
n 2=32
52
-
-
T 1=308
T 2=1070
取n 较小组的秩和为T 值,用校正公式计算。

即:
12
/)1(5
.0|2/)1(|2111+-+-=
N n n N n T Z c Z Z C /= ∑=)
-/()-(-13
3N N t t C j j SPSS : 建立变量名:
录入数值:
统计分析:
结果分析:同两个独立样本比较的Wilcoxon秩和检验Mann-Whitney Test
P<0.001,拒绝H0
三、多个样本比较的秩和检验(Kruskal-Wallis H test)
1.原始数据法
例4某研究者测定正常人、单纯性肥胖、皮质醇增多症者各10人的血浆总皮质醇含量见下表,问这三组人的血浆总皮质醇含量有无差别?
三组人的血浆总皮质醇含量测定值(μg/L)
正常人单纯性肥胖皮质醇增多症测定值秩次测定值秩次测定值秩次
0.4 1 0.6 2 9.8 20
1.9 4 1.2 3 10.2 21
2.2 6 2.0 5 10.6 22
2.5 8 2.4 7 1
3.0 23
2.8 9
3.1 10.5 1
4.0 25
3.1 10.5
4.1 14 14.8 26
3.7 12 5.0 16 15.6 27
3.9 13 5.9 17 15.6 28
4.6 15 7.4 19 21.6 29
6.0 18 13.6 24 24.0 30
R i n i 96.5
10
117.5
10
251
10
H0::三组人的血浆总皮质醇含量总体分布位置相同
H 1:三组人的血浆总皮质醇含量总体分布位置不全相同 a=0.05
)1(3)1(12
2+-∑+=N n R N N H i i 1-=k ν
SPSS 建立变量名
录入数值:
统计分析:
结果分析:
若g(组数)=3且最小样本例数大于5或g>3时,H或H C近似服从自由度为g-1的卡方分布。

H=18.130,自由度=2,P<0.001,拒绝H0,三组总体分布位置不全相同,需做两两比较。

2.频数表法:
例5
(单向有序分类变量的多个样本比较)
用A、B、C三种药物治疗单纯性慢性支气管炎,结果见表第(1)~(5)栏, 问三种药物的总体疗效是否不同。

表三种药物疗效比较的秩和检验计算过程
疗效药物秩次平均秩和R1秩和R2秩和R3
(1)
A
(2)
B
(3)
C
(4)
合计
(5)
范围
(6)
秩次
(7)
(8)=
(2) ⨯(7)
(9)=
(3)⨯ (7)
(10)=
(4)⨯ (7)
治愈17 5 3 25 1~2513.0 221.065.039.0
显效51 11 17 79 26~10465.0 3315.0715.01105.0
好转33 52 47 132 105~236170.5 5626.58866.08013.5
无效7 24 26 57 237~293265.0 1855.06360.06890.0
合计108 92 93 293 ——11017.516006.016047.5
检验步骤如下:
(1) 建立检验假设
H0: 三种药物疗效的总体分布相同
H1: 三种药物疗效的总体分布不同或不全相同
α=0.05
(2) 编秩
用各疗效等级的合计值排序确定秩次范围,如表第(6)栏所示,A、B、C三种药物总的治愈人数是25,他们的秩次范围是1~25。

同理疗效为“显效”组的秩次范围是26~104,以此类推。

再对第(6)栏秩次范围的上下限求和取平均值得各等级的平均秩次,如第(7)栏所示,疗效为“治愈”组的平均秩
次为1+25
2=13。

(3) 求秩和
分别用第(2)~(4)栏各等级的频数与(7)栏平均秩次相乘再求和,如第(8)~(10)栏所示。

(4) 计算统计量H值
将第(8)~(10)栏的总秩和ΣT1、ΣT2、ΣT3代入公式(11.15)计算H值。

若各样本相同秩次较多时(如超过25%),由公式(11.15)计算所得H值偏小,应按公式(11.16)和公式(11.17)对H值作校正计算H c
H =
12
N (N+1)(

R i2
n i) -3(N+1)
H =
12
293 (293+1)(
(11017.5)2
108+
(16006.0)2
92+
(16047.5)2
93) -3(293+1) = 48.23
C =1-∑(t j3-t j) / (N3-N)
C = 1-∑ (253-25) (793-79) (1323-132) (573-57) /(2933-293) = 0.9086
H c =H/C
H c = 48.23/0.9086=53.08 (5) 确定P 值和作出统计结论
若组数k =3, 每组例数均小于或等于5,可查附表H 界值表,得出P 值。

本例各组例数均大于5,已超出附表的范围,则H 值近似服从ν=k-1的χ2分布,可查附表的χ
2
界值表。

故按ν=3-1=2,查χ
2
界值表得χ
2
0。

05(2)=5.99,因为
53.08>5.99,故P <0.05。

按α= 0.05水平拒绝H 0,接受H 1认为三种药物的疗效不同或不全相同。

用SPSS 统计软件中的nonparametric tests —K Independent Samples — Kruskal-Wallis H 程序做秩和检验得到H c 统计量。

)1(3)1(12
2+-∑+=N n R N N H i
i
c H H c =
∑---=)()(13
3N N t t C j j
1-=k ν
四、Friedman 秩和检验
用于随机区组设计的非参数方法,分别在每个区组内编秩。

秩和检验方法要点和注意事项
检验方法
方法要点
注意事项
配对样本的 1. 依差值大小编秩,再冠以差值编秩时若差值绝对值相同符号相
符号秩检验的符号,任取T+、T-作为T,
查附表9,T界值表。

T>T界
值,P>α。

2.n>50,用z检验。

反,取平均秩次。

0差值省略。

两独立样本的秩和检验(分布位置)1.按两组数据由小到大统一编
秩,以n1较小者为T,查附
表10 T界值表。

T在界值范
围内,P>α。

2.n1>10或n1- n2>10时,用z
检验。

1.编秩时若相同数据在不同组,
取平均秩次。

2.当相同秩次较多时,使用校正
公式。

成组设计多样本比较的秩和检验(K-W检验) 1.将k组数据由小到大统一编
秩,求各组秩和R i。

2.计算H值,用ν=k-1查χ2界值
表,确定P值。

3.拒绝H0时,应作多个样本两
两比较的秩和检验。

1.编秩时若相同数据在不同组,
取平均秩次。

2.当相同秩次较多时,使用校正
公式。

相关文档
最新文档