第4章秩和检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
操作步骤:
1.建立检验假设 H0 :各组总体的等级分布相同; H1 :各组总体的等级分布不同或不全相同。 =0.05。
2.计算检验统计量H值
①编秩求秩和:三组观察值分别由小到大排列,统一编秩。
表 5-5 不同程度再障患者血清中 CD8 抗原水平(U/ml)
正常组 秩次 轻度组 秩次 重度组 秩次
式中tj(j=1,2,…) 为第j个相同秩次的个数。如编 秩时,有3个秩次同为10, 6个秩次同为22.5,
则 Σ(t3j - tj)= (33-3) + (63-6).
一、成组设计两小样本秩和检验
---原始数据的两样本比较
试验组
生存日数
秩次
10
9.5
12
12.5
15
15
15
16
16
17
17
18
18
23
合计
n 1=182
n2=221
403
先为例题编秩:
表 5-3 复方猪胆胶囊治疗两型老年性慢性支气管炎疗效比较
人数
秩和
疗效 喘息 型
单纯 型
合计
秩次范围 平均秩次
单喘纯息型型
喘单息纯型型
(1) (2) (3) (4) (5)
( 6)
(7)
(8)
治愈 23 60 83
1~ 83
42
966
2520
显效 83 98 181 84~264
H0 : 差值总体的中位数为 0 0.05
H1 : 差值总体的中位数不为 0
如N>50时,超过T界值表(附表6)的范围(n最大为 50),可用下式作正态近似法的u检验。
(因为随着n增大,T的分布逐渐逼近均数为n(n+1)/4,方差为n (n+1)(2n+1)/24的正态分布)
如果相同秩次较多(不包括0),用上式计算的u值偏小,可用下式校正!
174
14442
17052
好转 65 51 116 265~380 322.5
20962.5
16447.5
无效 11
12
23 381~403
392
4312
4704
合计 n1=182 n 2=221 403
T1=40682.5 T2=40723.5
喘息型平均秩和: T1 = 40682.5 / 182= 223.5 单纯型平均秩和: T2 = 40723.5/221= 184.3
例题 用复方猪胆胶囊治疗老年性慢性支气管炎患者403例,疗效见 表5-3第(1)-(3)栏。问该药对此两型支气管炎疗效是否相同?
表 5-3 复方猪胆胶囊治疗两型老年性慢性支气管炎疗效比较
疗效
喘息型
人数 单纯型
合计
(1)
(2)
(3)
(4)
控制
23
60
83
显效
83
98
181
好转
65
51
116
无效
11
12
资料和方差分析条件不能满足的数值变量资料。
操作步骤:
1)建立假设,确定检验水准 2)计算统计量
先对所有数据编秩,求各组秩和,然后 计算统计量H ;
3)确定P值,做出统计推断
当样本含量较少时查H界值表,当样本 含量较大时,H分布近似自由度为样本数-1的 2 分布。
一、普通成组设计多个样本比较的秩和检验
19
20
20
23
21
90以上
22
n1=10 T1=170
表5-2 两组小白鼠发癌后生存日数
对照组
生存日数
秩次
2
1
3
2
4
3
5
4
6
5
7
6
8
7
9
8
10
9.5
11
11
12
12.5
13
14
n2=12
T2=83
样本含量符合查表法(附表6;p337):
查表得: T0.05, (10,2) = 84-146; T0.01, (10,2)76=-154
例题:
建立检验假设
H0:两型老慢支疗效分布相同 ;
H1:两型老慢支疗效分布不同;
=0.05。
检验统计量
n1=182, n2=221,检验统计量T=40682.5 。
因样本含量较大,采用 Z(u) 检验:
u T n1 (N 1) / 2 0.5 n1n2(N 1) / 12
相同秩次较多时需要校正:
n1=10 T1=170 n2=12 T2=83
判断标准:若两组例数不等, 以样本例数较少组的秩和为统计量T。 如果它的秩和在界值之外,则可拒绝H0。
本例 T = 170 所以P < 0.01
结论:两组小白鼠生存天数具有非常显著差 异,即实验组小鼠的生存天数较对照组长。
二、成组设计两大样本秩和检验(正态近似法)
0.01 < P<0.05
第二节 成组设计两样本比较的秩和检验
(Wilcoxon两样本比较法)
与之对应的参数检验方法:独立样本t检验或独立样本u检验
本法的基本思想:
假定样本含量分别为N1和N2的两个样本,来自同一个总体(分布相 同的两个总体),则样本含量为n1样本秩和T与平均秩和一般不会相差 很大,若超出了界值范围,则拒绝原假设。
差异有统计学意义。可认为复方猪胆胶囊治疗老年
性慢性支气管炎喘息型与单纯型的疗效有差别。
结论:单纯型的疗效好于喘息型!
第三节 成组设计多个样本比较的秩和检验
(Kruskal-Wallis法、K-W检验、H检验)
本方法利用多个样本的秩和来推断各秩和分别代 表的总体分布有无差别。
相当于“参数方法”的方差分析,适用于有序分类
------原始数据的多个样本比较(教材标题)
该方法的编秩过程与前者相同,但其统计量的名
称和计算方法不同。
统计量 H
12
Ti2
H = ————(∑——)—3(N+1)
N(N+1) ni
式中Ti为各组的秩和;n为各组的对应例数;N=Σn
【例题】 某医生在研究再生障碍性贫血 时,测得不同程度再生障碍性贫血患者血清中可溶 性CD8抗原水平(U/ml)【结果见附表5-4】,问不 同程度再生障碍性贫血患者血清中可溶性CD8抗原水 平有无差别?
计量资料差值不服从正态分布时,推断其是否来自总体中位 数为零的总体,还可用于单一样本与总体中位数的比较。
与之对应的参数检验方法为配对t检验 (注意:配对的对子数不能少于6对)。
一、配对设计的两样本秩和检验 (一)本法的基本思想
如果两个总体的分布相同,每个配对数值的差应服从以0为中心的 对称分布。即将差值按照绝对值的大小编秩(排顺序)并给秩次加上 原来差值的符号后,所形成的正秩和与负秩和在理论上是相等的(满 足差值总体中位数为0的假设),如果二者相差太大,超出界值范围, 则拒绝原假设。
(三)通过例题说明该方法的应 用 下表为用两种方法测定铁血蛋白的结果,试比较两者测定结果有无差别?
对象号
1 2 3 4 5 6 7 8 9 10 11 12 合计
表 5-1 A法
30.6 59.9 46.0 23.0 20.3 48.6 25.0 23.4 44.1 399.8 25.9 535.6 ——
u uC C
其中:C 1
(
t
3 j
tj
)
N3 N
式中tj为第j个相同秩次的个数,说明同前!
u T n1 ( N 1 ) / 2 0.5 n1n2( N 1 ) / 12
40682.5 182( 403 1 ) / 2 0.5
( 182 )( 221 )( 403 1 ) / 12
(1)
42 51
98 141
141
318 382 408 620
Ri ni
(2)
1 2 3 4 5 6 7 8 13.5 49.5 9
(3)
448 555
585 620
712
753 758 845 896
(4) 9 10 12
13.5 17.5 19 20 23 25.5
149.5 9
(5)
562 631
(1)查表法:当n 50 时 ⑵ 正态近似法:当n >50 时
2
T界值表(附表6;教材P337) 计算公式同前面公式!
为什么秩和检验的编秩在不同符号组间 出现相同数据要取“平均秩次”;而在相同符号 组内,出现相同的数据可以“顺序编秩”?
因为在不同符号组间(正号或负号),不 取平均秩次会增大或减小某一组的秩和;而在同 一符号组内,出现同一数据,不取平均秩次,秩 和不受影响。
将两样本观察值按照从小到大顺序统一编秩,若大
小相同的观察值不在同一样本内,取其平均秩次,两样本
秩和之和应为N(N+1)/2。
计算方法:
⑴ 查表法:当样本量较小,查两样本比较的T界值表(附表9;p364)。
利用两样本含量:较小n 和 差值(较大n - 较小n)
⑵ 正态近似法:当样本量较大时,按以下公式计算。
两种方法尿铁蛋白(ug /L)结果
B法
差值 d 正秩
负秩
30.6
0
--
--
63.1
-3.2
3
58.0
-12.0
6
10.9
12.1
7
33.7
-13.4
9.5
99.5
-50.9
11
24.40.6源自136.2-12.8
8
45.2
-1.1
2
404.1
-4.3
4
39.3
-13.4
9.5
544.8
-9.2
5
——
——
3.3669
c 1
(
t
3 j
tj
)
N3 N
833 83 1813 181 1163 116 233 23
1 4033 403
0.8766
uc u C 3.3669/ 0.8766 3.5961 u0.01
确定P值和作出推断结论
P<0.01,按 =0.05水准,拒绝H0 ,接受H1,
检验正负秩和之和是否应为:N(N+1)/2 11(11+1)/ 2 = 66
3.确定P值,做出结论 现T = 8 或 58
得:T0.05, 11 = 10-56,( T0.01, 11= 5-61) 现 T+ 或 T- 值落在T0.05, 11范围外,则 P < 0.05;
如果落在它的范围内,则 P > 0.05。
T n(n 1) / 4 0.5
u
n(n 1)(2n 1) / 24 1
48
(t
3 j
tj
)
二)操作程序
1.建立假设及确定检验水准
H0:差值总体水平为0。H1:差值总体水平不为0。 α=0.05 2.计算统计量(确定T值)
(1)求差:算出每对差值
(2)编秩:按差值绝对值大小从小到大编秩,并冠以原差值的正负号。
653 712
762
843 849 896 901
(6) 11 15 16 17.5 21 22 24 25.5 27
179 9
②计算H值
H 12
Ri2 3( N 1)
N (N 1) ni
ni为各组例数;N=Σni,为总例数
H 12 ( 49.52 149.52 1792 ) 3(27 1) 16.250
表 5-4 不同程度再障患者血清中 CD8 抗原水平(U/ml)
正常组
轻度组
重度组
(1)
42 51 98 141 141 318 382 408 620
(3)
448 555 585 620 712 753 758 845 896
(5)
562 631 653 712 762 843 849 896 901
A.若差值为0,可删去不计,不编秩,对子数n也相应减少。
B.若差值的绝对值相等,符号相反,则以平均秩次作为每一个差值
的秩次,保留原差值符号。
C.在差值相同符号组内,出现相同的数据可以“顺序编秩”,不必平均
。
3(.作3)出求统秩计和推、断确(定确T定值P:值将,正做负出秩结次论分)别正相加负,秩任和取之正和或负应秩为和:为nT(。n 1)
8
58
操作程序:
1.建立假设及确定检验水准
H0:差值总体水平为0。 H1:差值总体水平不为0。 α=0.05 2.计算统计量(T值即秩和值)
(1)求差:算出每对差值;
(2)编秩:按差值绝对值大小从小到大编秩,并冠以原差值的正负号;
(3)求秩和:将正负秩次分别相加,以秩和绝对值小则为T。
本例T=8
T+ 8 、 T- 58 = 66
27(27 1)
9
H近似服从 =k1的2分布。可直接查2表。
3. 确定P值和作出推断结论:
第四章 秩和检验
---非参数检验方法
本章学习要求:
1.理解秩和检验的基本概念及其优缺点; 2.掌握几种不同设计类型资料秩和检验的编秩
方法和统计量的选用。
例:T值、H值等
第一节 Wilcoxon符号秩和检验
(配对设计资料的符号秩和检验、Wilcoxon配对法)
该方法由Wilcoxon于1945年提出,可用于检验配对设计
即如果H0 成立,即两组分布位置相同, 则A组的实际秩和应接近理论秩和n1(N+1)/2;
B组的实际秩和应接近理论秩和n2(N+1)/2 或相差不大(差值很大出现的概率应很小)。 如果相差较大,超出了预定的界值,则可认为H0不成立。
判断标准:若两组例数不等,以样本例数较少组的 秩和为统计量T.
编秩原则:
附表9中较小 n 和(较大n - 较小n的差值) 都只有10,故n超过10时可采用“正态近似法” (附后)。
正态近似法公式:
u T n1 (N 1) / 2 0.5 n1 n2 (2n 1) /12
相同秩次较多时,计算出的u值偏小,应进行校正!
u u / C c
C 1
(t
3 j
t
j
)
N3 N