14章秩和检验
医学统计学09秩和检验

22
u=
|11186 − 88(216 + 1) / 2 − 0.5 128 × 88 × (216 + 1) /12
(t 3 − t j ) ∑ j (N 3 − N )
= 3.628
C = 1− = 1−
823 − 82 ) + ( 783 − 78 ) + ( 303 − 30 ) + ( 263 − 26 ) ( 216 − 216
9
秩和
A组: - 、±、+、+、+、 ++ 秩和: 1 2 4.5 4.5 4.5 8.5
TA=25
B组: +、++、++、++、+++、+++ 秩和: 4.5 8.5 8.5 8.5 11.5 11.5 TB=53
TA+TB=N(N+1)/2=78
10
秩次:在一定程度上反映了等级的高低; 秩和:在一定程度上反映了等级的分布位置。 对等级的分析,转化为对秩次的分析。 秩和检验就是通过秩次的排列求出秩和,对总 体的分布进行假设检验。
α =0.05。
编秩 ,求秩和T。 确定检验统计量T 若两样本例数不等,以例 数较少者为n1,检验统计量T=T1=560.5。 确定P值,作出推断结论
29
560.55 − 24 × (68 + 1) / 2 − 0.5 u= = 3.4265 24 × 44 × (68 + 1) / 12
(16 3 − 16) + ( 28 3 − 28) + (19 3 − 19) + (5 3 − 5) C = 1− 68 3 − 68
秩和检验【医学统计学】

568.4
14.0
384.6
3.0
556.2
13.0
369.1
1.0
435.7
7.0
377.8
2.0
574.8
15.0
436.7
8.0
468.7
12.0
662.9
19.5
433.4
6.0
582.8
16.5
442.3
10.0
438.1
9.0
426.1
5.0
n1 10
T1 101
n2 12
T2 152
2.求检验统计量T 值
①省略所有差值为0的对子数,观察单位数减去0对子数 的个数 ②按差值的绝对值从小到大编秩,绝对值相等的差值若 符号不同取平均值,并保持原差值的正负号;
③任取正秩和或负秩和为T,本例取T-=3。
3. 确定P 值,作出推断结论
2020/8/8
15
检验步骤
查附表12 • 本例T=3,n=10,
3 9 6 8 7 -1 10 4 -2 5
T 52 T 3
2020/8/8
10
配对符号秩检验基本思想
• 当H0(差值的总体中位数Md=0)成立,任一配对差值出现正号、负号的 机会均等,秩和T-与T+的理论数也应相等为n(n+1)/4
• 可以证明:
• H0为真时,秩统计量T是对称分布 • H0非真时,T呈偏态分布
单纯⑴虚寒型 ⑵3 ⑶6 ⑷25 ⑸26 13 ⑻ 73
喘息虚寒型
1
3 10
9
3 26
虚寒阻塞型 16 28 61 27 ⑹9 141
2020/8/8
21
秩和检验结果解读

秩和检验结果解读The interpretation of the results of the rank sum test is crucial in statistical analysis, especially when dealing withnon-parametric data. This test, also known as the Mann-Whitney U test or the Wilcoxon rank sum test, is used to assess whether two independent samples come from the same distribution. It does not assume that the data follow a specific distribution, making it a robust tool for a wide range of applications.秩和检验结果的解读在统计分析中至关重要,特别是在处理非参数数据时。
这种检验,也被称为Mann-Whitney U检验或Wilcoxon秩和检验,用于评估两个独立样本是否来自同一分布。
它不假设数据遵循特定的分布,这使得它成为众多应用场景下的强大工具。
The test's output typically includes a statistic value and a corresponding p-value. The statistic value, such as the U statistic in the Mann-Whitney U test, represents the sum of ranks for one of the samples. A low U statistic indicates that the values in one sample tend to be smaller than those in the other, suggesting a difference between the two groups.检验的输出通常包括一个统计量值和相应的p值。
7.秩和检验

uc
注意:仍为非参数检验
配对符号秩检验基本思想
当H0(差值的总体中位数Md=0)成立,任一配对差 值出现正号、负号的机会均等,因此秩和T-与T+的 理论数也应相等为n(n+1)/4。 可以证明: H0为真时,秩统计量T是对称分布,对称轴为 n(n+1)/4,多数情况下T与n(n+1)/4差值较小 (属抽样误差); H0非真时,T呈偏态分布,多数情况下T远离 n(n+1)/4。
第一节 配对设计资料的符号秩和检验
Wilcoxon 1945年提出,又称Wilcoxon符号 秩检验。 常用于检验差值的总体中位数是否等于零。
配对资料:
同对的两个受试对象分别接受不同处理 同一样品用两种不同方法测试 同一受试对象处理前后的比较或不同部位测 定值比较
配对设计资料的符号秩和检验 — Wilcoxon符号秩和检验
(t j t j )
3
N N
3
)
tj为第j个相同秩次的个数
二、两组有序分类变量资料的秩和检验
【例9-3】某医院用复方石苇冲剂治疗老年慢性支气管炎患者216例, 疗效见表9-3,问该药对两型支气管炎治疗效果是否相同?
表9-3 人 单纯型 复方石苇冲剂治疗两型老年慢性支气管炎疗效的比较 数 秩 和 合计 秩次范围 平均秩次 喘息型 单纯型 喘息型
10.5
12 14 15 16 17
0.24
0.29 0.33 0.44 0.58 0.63 0.72
2
3 4 5 6 7 8
0.87
1.01
10.5
13
n1=7 秩和=93.5
n2=10 秩和=59.5
医学统计学 9第九讲 秩和检验

7
2.20 0.05 2.5 2.99 0.84
8
2.12 -0.03 -1 3.19 1.04
9
2.42 0.27
4
3.37 1.22 10
2.52 0.37
5
4.57 2.42 11
1. 建立假设 H0:差值总体中位数为0 H1:差值总体中位数不为0;
α=0.05 2. 计算统计量: T+=62.5,T-=3.5
B组:1
2
4.5 4.5 4.5
+
8.5
++
++
++
+++
+++
6 8 9 10 11 12
4.5 8.5 8.5 8.5 11.5 11.5
秩和
A组: - 、、+、+、+、 ++ 秩和: 1 2 4.5 4.5 4.5 8.5
TA=25
B组: +、++、++、++、+++、+++ 秩和: 4.5 8.5 8.5 8.5 11.5 11.5
(4)将秩次冠以正负号,计算正、负秩和(T+,T-); T++T- =n(n+1)/2
(5)用不为“0”的对子数n及T(取绝对值小的秩和作为统
计量T)查T界值表,得到P值作出判断。
编秩
A组: - 、、+、+、+、++ B组: +、++、++、++、+++、+++
秩和检验

非参数统计的主要优点
①由于没有条件限制,适用范围广。它可适用于有序分类资料、 偏态分布资料、变异较大或方差不齐的资料、分布型不明的资 料及有特大、特小值或数据的某一端有不确定数值的资料。 ②搜集资料方便。由于非参数统计在搜集资料时可用“等级”或 “符号”来评定观察结果,因而搜集资料十分方便,更符合实 际情况。 ③具有较好的稳健性。参数检验是建立在严格的假定条件的基础 上,一旦不符合假定条件,其推断的正确性将受到质疑。非参 数检验则是带有最弱的假定,所受条件限制很少,稳健性好。
配对符号秩检验基本思想
H0为真时,T服从对 称分布,大多数情况下,T 在对称点n(n+1)/4附近。
H0为非真时,T呈
偏态分布,大多数的情 况下,T远离对称点为
n(n+1)/4。
符号秩检验的基本思想
可以证明:当H0(Md=0)成立时,任一配对的差值出现正号与负 号的机会均等,因此,秩和T+与T-的理论数(期望值)也应相等, 由T+与T-之和为n(n+1)/2可知,T+与T-的理论数为n(n+1)/4,当n 很大时,T近似服从均数T为n(n+1)/4,方差为n(n+1)(2n+1)/2 4的正态分布。 H0不成立时,统计量T呈偏态分布,并且在大多数情况下T远离n (n+1)/4 。 因此,在H0成立的情况下T远离n(n+1)/4为小概率事件,可认为 在一次抽样中是不会发生的,故当出现这种情况时推断拒绝H0。
第一节 配对设计资料的符号秩 和检验
(Wilcoxon signed-rank test)
一、基本思想 二、检验步骤
一、基本思想
符号秩和检验:是由Wilcoxon于1945年提出,又称 Wilcoxon 符号秩检验 常用于检验差值的总体中位数是否等于零 配对资料有: 同对的两个受试对象分别接受不同处理 同一样品用两种不同方法测试 同一受试对象处理前后的比较或不同部位测定值比较
秩和检验

某药对两种病情的老年慢性支气管炎患者的疗效
合 计 秩次范围 平均秩 次 秩 单纯性 和 肺气肿
控 制 显 效 有 效 无 效 合 计
65 42 107 1~107 18 6
54
3510 2151 4740
2268 717 3634
24 108~131 119.5 53 132~184 158
30 23 13 11
(2)大样本时,正态近似法:
| T n( n 1 ) / 4 | 0.5 u n( n 1 )( 2n 1 ) / 24
校正公式:(当相持个数较多时)
u | T n( n 1 ) / 4 | 0.5 ( t3 tj ) n( n 1 )( 2n 1 ) j 24 48
12 342 602 262 H 3(15 1) 6.32 15(15 1) 5 5 5
2 i
Hc H C
分子为H值,分母C为校正数,
tj C 1 N N 校正后,Hc>H,P值减小。
3 j 3
t
HC 1
H ( t3 tj ) j N3 N
此例n1=82,n2=126,n2-n1=44, 用正态分布法。求u值
计算校正的uc值,即:
8780.5 82 208 1 / 2 0.5 u 0.4974 82 126 208 1) 12 ( /
tj ( 3 107 243 24 533 53 243 24 107 )( )( )( ) C 1 1 0.8443 3 N N 208 208
3 j 3
t
0.4974 uc 0.541 0.8443
医学统计学学习与实习题集

医学统计学学习与实习题集医学统计学学习与实习题集⽬录第四章定量资料的统计描述2第五章定性资料的统计描述7第六章总体均数的估计10第七章假设检验13第⼋章 t检验16第九章⽅差分析20第⼗章⼆项分布和Poisson分布及其应⽤25第⼗⼀章2检验27第⼗⼆章秩和检验31第⼗三章双变量关联性分析35第⼗四章直线回归分析40第⼗五章⽣存分析43第四章定量资料的统计描述【思考与习题】⼀、思考题1.均数、中位数、⼏何均数的适⽤范围有何异同?2.同⼀资料的标准差是否⼀定⼩于均数?3.极差、四分位数间距、标准差、变异系数的适⽤范围有何异同?4.正态分布有哪些基本特征?5.制定医学参考值范围时,正态分布法和百分位数法分别适⽤于何种资料?⼆、案例辨析题某市抽样测定了150名健康成年男性的⾎清⽢油三酯(TG)含量(mmol/L),资料如下,据此资料计算集中趋势指标和离散程度指标。
0.23 0.84 1.16 1.39 1.64 1.76 1.89 2.04 2.18 2.280.34 0.85 1.24 1.39 1.68 1.78 1.91 2.05 2.21 2.290.49 0.86 1.25 1.41 1.70 1.79 1.91 2.06 2.21 2.300.57 0.87 1.30 1.41 1.71 1.81 1.91 2.06 2.21 2.300.62 0.91 1.30 1.43 1.71 1.82 1.92 2.06 2.22 2.320.62 0.95 1.33 1.44 1.71 1.83 1.93 2.10 2.24 2.330.65 0.96 1.33 1.47 1.72 1.83 1.94 2.10 2.24 2.350.67 0.99 1.34 1.53 1.73 1.83 1.96 2.10 2.25 2.360.68 1.04 1.35 1.56 1.74 1.84 1.97 2.12 2.25 2.360.71 1.08 1.35 1.58 1.74 1.84 1.98 2.14 2.25 2.370.71 1.08 1.36 1.58 1.74 1.86 2.00 2.15 2.25 2.380.72 1.09 1.36 1.58 1.75 1.87 2.01 2.15 2.26 2.390.78 1.14 1.37 1.60 1.75 1.87 2.01 2.15 2.27 2.390.80 1.15 1.39 1.60 1.75 1.88 2.02 2.16 2.27 2.400.80 1.16 1.39 1.61 1.75 1.89 2.03 2.17 2.28 2.41X=(mmol/L)计算结果为:集中趋势指标 1.6839离散程度指标0.5599S=(mmol/L)以上分析是否恰当,为什么?三、最佳选择题1. 频数分布的两个重要特征是A. 总体与样本B.集中趋势与离散程度C.统计量与参数D.标准差与标准误E. 样本均数与总体均数2. 描述⼀组正态分布资料的平均⽔平,宜选⽤的指标是A. CVB. 2SC. GD. SE. X3.数据分布类型⽆法确定时,描述集中趋势宜选⽤的指标是A.XB.MC.GD.S4.反映⼀组⾎清抗体滴度资料的平均⽔平,常选⽤的指标是 A. X B. M C. G D. R E. CV5. 以下资料类型中,适宜⽤均数与标准差进⾏统计描述的是 A.正偏态分布 B.负偏态分布 C.对称分布 D.正态分布 E.任意分布6. 当资料两端含有不确切值时,描述其变异度宜采⽤ A. R B.CV C. 2S D.SE.四分位数间距 7. CV 越⼤,表⽰ A.资料变异程度越⼤ B. 资料变异程度越⼩ C.均数越⼤ D. 样本含量越⼤ E.均数的代表性越好8. 正态分布曲线下( 2.58, 2.58)µσµσ-+范围内的⾯积(%)为 A .95 B .90 C .97.5E .99.59. 某地拟制定正常学龄前⼉童⾎铅值99%参考值范围,若正常学龄前⼉童⾎铅含量服从近似对数正态分布,宜采⽤ A .2.58X S + B .1lg lg lg ( 2.58)XX XS -+C . 4.84(mmol/L) 0.96(mmol/L)X S ,==D .1lg lg lg ( 2.32)XX XS -+E . 2.32X S + 四、综合分析题1.测定了176名燃煤型砷中毒患者的尿总砷含量(µg/L ),资料如下,0.0169 0.0262 0.3433 0.0505 0.2266 0.1690 0.0165 0.0356 0.0968 0.1628 0.0904 0.1059 0.05820.0211 0.0867 0.0318 0.0256 0.0267 0.1592 0.13640.0583 0.0275 0.2285 0.0246 0.0508 0.1076 0.0195 0.0400 0.06460.11090.0212 0.0164 0.1401 0.0646 0.0139 0.0377 0.0161 0.0121 0.0617 0.2686 0.0532 0.0724 0.1280 0.0143 0.0980 0.5678 0.0228 0.1279 0.0872 0.0675 0.0361 0.0680 0.0591 0.0821 0.1418 0.1051 0.0662 0.1033 0.11880.08870.0102 0.0154 0.1775 0.0223 0.0319 0.0986 0.1019 0.0419 0.0678 0.0347 0.0753 0.0532 0.0151 0.0219 0.11390.11240.0524 0.0290 0.0376 0.15100.1250 0.0339 0.0549 0.0974 0.0753 0.2902 0.0222 0.0204 0.1325 0.0462 0.3047 0.0464 0.1486 0.0271 0.3953 0.0288 0.1520 0.0559 0.1244 0.1264 0.0576 0.0112 0.0222 0.4085 0.1128 0.0463 0.1240 0.0226 0.0809 0.0371 0.0183 0.1430 0.0559 0.0353 0.1333 0.2383 0.0929 0.0209 0.2748 0.0189 0.4542 0.0782 0.0741 0.1460 0.1317 0.0456 0.0499 0.0317 0.0863 0.0505 0.2691 0.3570 0.0227 0.0392 0.0406 0.0596 0.0260 0.0906 0.1516 0.0695 0.0723 0.0389 0.0810 0.2326 0.0311 0.0174 0.0868 0.0516 0.0970 0.0372 0.0126 0.0678 0.2133 0.5265 0.4385 0.0357 0.3706 0.06210.2330 0.0947 0.1591 0.0636 0.1845 0.0445 0.0430 0.0236 0.04290.0134 0.5805 0.0600 0.0387 0.0392 0.0747 0.0470 0.0425 0.2218(1) 绘制频数分布图,简述分布类型和分布特征;(2) 计算适当的集中趋势指标。
秩和检验

j
j
N n n
1
2
频数表资料(或等级资料)的两样本比较
例: 某医生将老年慢性支气管炎按是否合并肺气肿分为两类,用某药治疗 这两类病人208人,疗效见下表,问该药对这两种病型的疗效有无不同?
疗效
病人数 未合并 合并 合计
控制 65 显效 18 有效 30 无效 13
42
107
6
24
23
53
11
24
查表11-2 T界值表 Page 333
(4)结论
正态近似法
随着n增大,T分布渐渐逼近均数为n(n+1)/4、方差为 n(n+1)(2n+1)/24的正态分布。若n>50, 可用正态近似法
T n(n 1) / 4 0.5 u
n(n 1)(2n 1) / 24
若相同秩次较多时:
T n(n 1) / 4 0.5
合计
(5)
秩次范围
(6)
平均秩次 方法1
(7) (8)=(2)(7)
秩和
方法2
方法3
(9)=(3)(7) (10)=(4)(7)
痊愈 175 5 显效 95 55 好转 64 6 无效 45 35
1 181 1~181 91.0 15925.0 455.0 5 155 182~336 259.0 24605.0 14245.0 30 100 337~436 386.5 24736.0 2319.0 6 86 437~552 479.5 21577.5 16782.5
1
146
18
118
11
104
7
93
4
120
13
85
3
秩和检验

自由度为(k-1)
当各区组间出现相同秩次时,需进行校正 校正公式为
2 c
c
2
c 1
(t
3 j
t j ) bk ( k
2
1)
b为区组个数,k为处理组个数
随机化区组设计资料的多重比较
检验假设 : H0:第i组与第j组所代表的总体中位数相等 H1:第i组与第j组所代表的总体中位数不等 样本含量较大时,计算Zij值
例: 四种疾病患者痰液内嗜酸性粒细胞的检查 结果见表。问四种疾病患者痰液内嗜酸性粒细 胞的等级分布有无差别?
四种疾病患者痰液内嗜酸性粒细胞等级比较
例 数 白细胞等 级 秩次范 围 平均 秩次 秩 和 合计
支气管扩 张
肺水肿
肺癌
病毒性呼吸 道感染
支气管扩 张
肺水肿
肺癌
病毒性呼吸 道感染
(1) + ++
(2) 0 2 9
(3) 3 5 5
(4) 5 7 3
(5) 3 5 3
(6) 11 19 20
(7) 1~11 12~30 31~50
(8) 6 21 40.5
(9) 0 42 364.5
(10) 18 105 202.5
(11) 30 147 121.5
(12) 18 105
+++
6
第三节 完全随机化设计多组独立样本的 秩和检验
检验步骤
1.建立检验假设 H0:各总体的分布位置相同 H1:各总体的分布位置不同或不全相同 α=0.05 2.编秩 将各组数据混合,由小到大排序并 编秩,如遇有相等数值则取平均秩次 3.求秩和 分别将各组秩次相加。 4.计算统计量
第十四章 重复测量的资料方差分析

编号
治疗前
治疗后
差值
1
130
114
16
2
124
110
14
3
136
126
10
4
128
116
12
5
122
102
20
6
118
100
18
7
116
98
18
8
138
122
16
9
126
108
18
10
124
106
18
X
126.2
110.2
16.0
S
7.08
9.31
3.13
比较
表3-3 两种方法对乳酸饮料中脂肪含量的测定结果(%)
SS
MS
F
P
总变异
14 0.5328
处理间
2 0.2280 0.1140 11.88 <0.01
区组间
4 0.2284 0.0571 5.95 <0.05
误差
8 0.0764 0.0096
2.重复测量设计区组内即同一受试者 的重复测量数据是高度相关的。例如,计 算表 12-3 中各时间点数据间的相关系数 结果见表 12-6。
表12-4 表 12-3数据的方差分析表
变异来源 自由度 SS MS F
P
总变异
31 5.751
区组(受试者)
7
2.828 0.361 27.77 <0.01
放置时间
3
2.959 0.986 75.85 <0.01
误差
21 0.264 0.013
表12-7 表12-3数据“球对称”检验结果
秩和检验

⑤ 个别数据偏大或数据一端或两端是不确定数值, (必选)
如“>50kg”等。
表 9-5 两组人痰液嗜酸性粒细胞的秩和计算 嗜酸性 粒细胞 ( 1) + ++ +++ 合计 健康人 ( 2) 5 18 16 5 44 例数 病人 (3) 11 10 3 0 24 合计 (4) 16 28 19 5 84 统一编秩 秩次范围 (5) 1—16 17—44 45—63 64—88 平均秩次 ( 6) 8.5 30.5 54.0 66.0 秩和 (病人组) ⑺=(3)×⑹ 93.5 305.0 162.0 0.0 T1=560.5
12
(1)建立检验假设,确定检验水准
• H0:两法测得结果相同,即差值的总体中位数Md=0 • H1:两法测得结果不相同,即差值的总体中位数Md≠0 α=0.05
单侧检验呢?
13
(2)求差值、编秩、求秩和并确定检验统计量:
①省略所有差值为0的对子数,并从观察单位数中减去0个数 ②按差值的绝对值从小到大编秩,若相同秩的符号不同则取平 均秩,符号相同可依次编秩。 ③任取正秩和或负秩和为T,本例取T+=15.5。
上表中:
单侧 1行 2行 3行 4行
2014-2-18
双侧 P=0.1 P=0.05 P=0.02 P=0.01
25
P=0.05 P=0.025 P=0.1 n1≥10则可用正态近似法:
| T n1 ( N 1) / 2 | 0.5 u n1n2 ( N 1) /12
秩和检验的原理

秩和检验的原理
秩和检验是一种用于比较两个样本的非参数性统计方法。
它的原理是基于对样本数据进行排序,计算出两个样本的秩和,然后通过比较秩和的大小来判断两个样本的总体分布是否有显著差异。
具体而言,秩和检验将样本数据排序后,按照排序后的位置进行秩次的赋值。
对于同样的观测值,将其排名的平均值作为秩次;对于出现连续相同观测值的情况,将其秩次取为连续区间的平均值。
然后,分别计算两个样本的秩和,并比较它们的大小。
通过比较秩和的大小,可以得出以下结论:
- 如果两个样本的秩和相差显著大,则说明两个样本的总体分布有显著差异,即两个样本来自于不同的总体分布。
- 如果两个样本的秩和相差不大,则说明两个样本的总体分布没有显著差异,即两个样本来自于相同的总体分布。
需要注意的是,秩和检验适用于两个独立样本的比较。
在实际应用中,可以使用不同的秩和检验方法,如Mann-Whitney U 检验、Wilcoxon秩和检验等。
这些方法的具体计算方式有所差异,但基本原理相同。
它们都是通过对样本数据排序和秩次赋值,来判断两个样本的总体分布是否有显著差异。
秩和检验

第十章基于秩次的非参数检验【教学要求】掌握:非参数检验的基本概念及其适用的资料类型;参数检验与非参数检验的区别;掌握配对设计、单样本设计、完全随机化设计两独立样本及多独立样本秩和检验的应用条件、实施方法。
熟悉:常用秩和检验方法的步骤、结果解释。
了解:完全随机设计多个独立样本间的多重比较;通过电脑实验了解不同设计类型的秩和检验和相应t 检验的功效问题。
【重点难点】(一)参数检验与非参数检验1、参数检验以特定的总体分布(如正态分布)为前提,对未知的总体参数(如总体均数)作推断的假设检验方法统称为参数检验,也叫参数统计。
2、非参数检验当样本所来自的总体分布不服从特定分布,或难以用某种函数式来表达,解决这类问题可用非参数检验方法。
非参数检验不依赖总体分布的具体形式,不受总体参数的限制,它检验的是分布,而不是参数。
(二)非参数检验的特点和适用范围1、特点(1)对样本所来自的总体分布形式没有要求。
(2)收集资料方便,可用“等级”或“符号”来记录观察结果。
(3)多数非参数检验方法比较简便,易于理解和掌握。
(4)缺点是损失信息量,适用于参数检验的资料用非参数检验会降低检验效能。
2、适用范围(1)等级资料。
(2)偏态分布资料。
当观察资料呈明显偏态分布而又未作变量变换,或经变量变换仍未达到正态或近似正态分布时,宜用非参数检验。
(3)方差不齐,且不能通过变量变换达到齐性。
(4)个体数据偏离过大,或一端或两端无界的资料。
(5)分布类型不明。
(6)初步分析。
有些医学资料由于统计工作量大,可采用非参数检验统计方法进行初步分析,挑选其中有意义者再进一步分析(包括参数统计内容)。
(三)配对设计差值的符号秩和检验(Willcoxon 配对法) 1、建立检验假设,确定检验水准 H 0:差值的总体中位数等于0 H 1:差值的总体中位数不等于0α=0.052、计算检验统计量T 值 (1) 求差值d(2)编秩:依差值的绝对值由小到大编秩。
秩和检验专题知识

一、配对设计旳两样本秩和检验
(一)本法旳基本思想
假如两个总体旳分布相同,每个配对数值旳差应服从以0为中心旳 对称分布。即将差值按照绝对值旳大小编秩(排顺序)并给秩次加上原 来差值旳符号后,所形成旳正秩和与负秩和在理论上是相等旳(满足差 值总体中位数为0旳假设),假如两者相差太大,超出界值范围,则拒 绝原假设。
(1)
42 51
98 141
141
318 3821 2 3 4 5 6 7 8 13.5 49.5 9
(3)
448 555
585 620
712
753 758 845 896
(4) 9 10 12
13.5 17.5 19 20 23 25.5
149.5 9
(5)
562 631
0.01 < P<0.05
第二节 成组设计两样本比较旳秩和检验
(Wilcoxon两样本比较法)
与之相应旳参数检验措施:独立样本t检验或独立样本u检验 本法旳基本思想:
假定样本含量分别为N1和N2旳两个样本,来自同一种总体(分布相 同旳两个总体),则样本含量为n1样本秩和T与平均秩和一般不会相差 很大,若超出了界值范围,则拒绝原假设。
12.5
15
15
15
16
16
17
17
18
18
19
20
20
23
21
90以上
22
对照组 生存日数
2 3 4 5 6 7 8 9 10 11 12 13
秩次 1 2 3 4 5 6 7 8 9.5 11 12.5 14
n1=10 T1=170
第十二章 秩和检验

第十二章秩和检验假设检验通常可划分为参数检验(parametric test)和非参数检验(nonparametri c test)两大类。
以特定的总体分布为前提,对未知的总体参数作推断的假设检验方法统称为参数检验。
前面章节介绍的t检验和方差分析均要求样本来自正态总体,属于参数检验。
非参数检验不以特定的总体分布为前提,也不对总体参数作推断,故也称为任意分布检验(distribution-free test)。
非参数检验具有广泛的适用性。
由于总体不必服从特定分布,无论资料总体分布形式如何,一端或两端无界,甚至分布未知,都能适用。
在非参数检验中,一般不直接用样本观察值做分析,统计量的计算是基于原始数据在整个样本中按大小所占的位次。
由于非参数检验没有利用观察值的具体数值,而只利用了其大小次序的信息,信息利用不够充分,故凡适合参数检验的资料,应首选参数检验。
但当总体分布不明确时,则应采用非参数检验。
尤其对于那些难以确定分布又出现少量离群值的小样本数据,非参数检验在剔除这些数据前后所得结论显示出了较好的稳健性。
非参数检验方法很多,有秩和检验(rank sum test)、符号检验、游程检验、等级相关分析等。
本章介绍在非参数检验中占有重要地位且检验功效相对较高的秩和检验。
第一节Wilcoxon符号秩和检验1945年Wilcoxon提出的Wilcoxon符号秩和检验(Wilcoxon singned-rank tes t),亦称符号秩和检验,可用于配对设计计量差值的比较,还可用于单一样本与总体中位数的比较。
一、配对设计的两样本比较(一) 本法的基本思想与步骤配对设计资料主要是对差值进行分析。
通过检验配对样本的差值是否来自中位数为0的总体,来推断两个总体中位数有无差别,即推断两种处理的效应是否不同。
现以例12.1说明其基本思想与步骤。
例12.1 某研究用甲、乙两种方法对某地方性砷中毒地区水源中砷含量(mg/L)进行测定,检测10处,测量值如表12.1的(2)、(3)栏。
秩和检验

生存时间 秩次 生存时间 秩次 生存时间 秩次 生存时间 秩次
25 34 44 46 46 n1=5
9.5 15 17 18 19 T1=78.5
15 15 16 17 19
1 2 3 4 5
21 21 23 25 27
6 7 8 9.5 11
28 28 30 35
20.05=7.815。 2> 20.05 ,P<0.05,故拒绝H0,
可以认为四种条件下测量结果差异有统计学意义。
秩和检验的重点:
秩和检验的优缺点。
不同设计类型资料秩和检验的检验假设, 编秩方法以及判断结果的方法。
例12.4 三批甘蓝叶样本分别在甲、乙、丙、丁 四种条件下测量核黄素浓度,试验结果如表 12.10所示。问四种条件下的测量结果的差异是 否具有统计学意义?
表12.10 甘蓝叶核黄素浓度测量值( 批次 1 2 3 Rj 测量条件 甲 27.2(2) 23.2(1) 24.8(2) 5 乙 24.6(1) 24.2(2) 22.2(1) 4 丙 39.5(4) 43.1(4) 45.2(4) 12 丁 38.6(3) 39.5(3) 33.0(3) 9 /g)
1. 建立检验假设
H0:四种测量条件下的测量结果的中位数相等; H1:四种测量条件下的测量结果的中位数不全 相等。 =0.05 2. 计算统计量:将同一批的四个测量结果由小到 大排秩,持平数据取平均秩次,计算与各测量条 件相应的秩和Rj,计算 统计量。 b=3,k=4,
3. 确定P值并判断结果: 给定=0.05,查阅 分布界值表,自由度为3时,
心位置或分布形态作检验。这类检验称非参数检验,
由于其对总体分布不作严格假定,所以又称任意分布
秩和检验原理

秩和检验原理
秩和检验是一种非参数统计方法,主要用于比较两组相关样本或配对样本的差异是否显著。
该检验方法不要求数据满足正态分布、方差齐性等假设,因此在某些情况下更为适用。
秩和检验的原理是基于秩次的比较。
对于两组相关或配对样本,首先将数据按照大小进行排序,并为每个数据赋予相应的秩次,然后计算两组样本秩次和的差值。
如果两组样本的差异并无显著性,那么这些差值在排序后应该是随机分布的。
因此,比较两组样本的秩次和差值的分布情况,可以得出样本差异是否显著。
在进行秩和检验时,首先计算两组样本的秩次和,然后计算秩次和差值的绝对值,并将其秩次,最后根据样本的大小和秩次之间的比较,计算出秩和的值。
根据秩和值,可以查找相应的临界值,从而判断样本差异是否显著。
若秩和值大于临界值,则可以拒绝原假设,即两组样本存在显著差异。
总之,秩和检验通过对样本的秩次进行比较,来评估两组样本或配对样本的差异是否显著。
它的原理简单,不要求数据满足特定的分布假设,因此在某些情况下是一种较为有用的统计方法。
练习题答案14

第十四章基于秩次的统计方法练习题一、最佳选择题1.以下统计分析方法中,不属于参数统计分析方法是()。
A. t检验B. 均数的区间估计C.方差分析D. Spearman相关E. 直线回归2. 成组设计两样本比较的秩和检验(n1≠n2),其检验统计量T是()。
A. 以秩和较小者为TB.以秩和较大者为TC.以例数较小者秩和为TD.以例数较大者秩和为TE.取任意一个秩和为T均可3. 样本1,2,3,5,6,5,6,9中数据5的秩是()。
A. 3.5B. 4.5C. 5.5D. 6.5E. 7.54. 满足参数统计分析方法条件的数据用非参数统计分析方法分析,下列哪一项是正确的()。
A. 增加一类错误B. 减少一类错误C. 减少二类错误D. 增加二类错误E. 两类错误都增加5.设配对设计资料的变量值为X1和X2,则配对资料的秩和检验()。
A.把X1与X2的差数绝对值从小到大编秩B.把X1和X2综合从小到大编秩C.把X1和X2综合按绝对值从小到大编秩D.把X1与X2的差数从小到大编秩E.把X1和X2分别按绝对值从小到大编秩二、问答题1. 什么叫做非参数检验?它和参数检验有什么区别?2. 什么叫做秩转换的非参数检验?它适用于哪些情况?3. 简述Spearman相关系数与Pearson相关系数的区别与联系。
三、计算题1.下表资料是10名健康人用离子交换法与蒸馏法测定尿汞值的结果,问两法测定结果有无差别?)10名健康人用离子交换法与蒸馏法测定尿汞值(g/L编号 1 2 3 4 5 6 7 8 9 10 离子交换法0.5 2.2 0.0 2.3 6.2 1.0 1.8 4.4 2.7 1.3 蒸馏法0.0 1.1 0.0 1.3 3.4 4.6 1.1 4.6 3.4 2.12. 某实验室观察局部温热治疗小鼠移植肿瘤的疗效,以生存日数作为观察指标,实验结果如下,问局部温热治疗小鼠移植肿瘤是否可延长小鼠生存日数?实验组10 12 15 15 16 17 18 20 23 >90对照组 2 3 4 5 6 7 8 9 10 11 12 133.身高由低到高排列的10 名女生的体重分别为:47,58,51,49,53,55,60,70,70,63,试计算身高与体重的相关系数,并检验之。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
显然,两组反映的信息是不同的,但由于两组的结构百分比无变化 (仅仅是位置不同),不改变检验结果。(χ2=5.224,P&g验
以表1为例。将无效、有效、显效三个疗效等级数量化, 数值用平均秩号,然后比较各组平均秩号的大小。
治疗组 无效 有效 显效 合计 6 19 35 60
109 8 9 3 129
228 17 10 7 262
1-228 229-245 256-262
114.5 13625.5 12480.5 237 259 2133 250.5 1036 17045 1896 2254.5 777 17408
246-255 250.5
• .H0:两组疗效相同;H1:两组疗效不同 • .取α =0.05 • .编秩,求各组秩和。
秩和检验(rank sum test)
秩次:将各原始数据从小到大排列, 分别给每个数据一个顺序号,也就是 秩次。 如: 9 6 7.5 13 秩次: 3 1 2 4 秩和检验:用各组秩和代替原始数据 进行假设检验的方法。
第一节 两独立样本差别的秩和检验 Wilcoxon
xs
A: B: 7 3 14 5 22 6 36 10 40 17 48 18 63 20 98 39 41.00+29.41 14.75+11.73
39 42 51 43 55 45 22 48 40 45 40 49
55 54 55 47 53 63 52 44 48 55 32 57
16 12 4 4 -2 18 30 -4 8 10 -8 8
10 9 3 3 1 11 12 3 6 8 6 6 68 R=10
• H0 : Md=0(两处理效应相同),H1 Md0 两处理效应不相同, α =0.05 编秩号 成对资料编秩号时较为复杂,要注意三点。 • (1)按差数的绝对值自小至大排秩号,但排好后秩号要保持原 差数的正负号;(2)差数绝对值相等时,要以平均秩号表示, 如表6-3中差数绝对值为4者共三人,其秩号依次应为2、3、4, 现皆取平均秩号3;(3)差数为0时,其秩号要分为正、负各半 ,若有一个0,因其绝对值最小,故秩号为1,分为0.5与-0.5, 若有两个0,则第二个0的秩号为2,分为1与-1等等。 • 求秩号和即将正、负秩号分别相加,本例得正秩号和为68,负秩 号和为10,正负秩号绝对值之和应等于n(n+1)/2 ,可用以核对, 如本例68+10=(12*13)/2=78,说明秩号计算正确。 • 检 验统计量R取较小一个秩号和,根据R值查附表12进行判断,该 表左侧为对子数,表身内部是较小秩号和,与上端纵标目之概率 0.05,0.01相对应,其判断标准是 R>R0.05时P>0.05, R0.05≥R>R0.01时 0.05≥P>0.01 P≤R0.01时 P≤0.01
• 例14-2 采用配对设计,用某种放射线的A、B两种方式分别局部照射家免的两 个部位,观察放射性急性皮肤损伤程度,见表14-3。试用符号秩和检验比较A、 B的损伤程度是否不同。
家兔号 ( 1) 皮肤损伤程度(评分) A 照射( 2) B 照射 差数 正( 5) 秩号 负 (6)
1 2 3 4 5 6 7 8 9 10 11 12 合计
表中 R1 取值的概率都是 1/20,归纳成 R1 在各种取值时的概率分布为: R 6 7 8 9 10 11 12 13 14 15 P(R1) 0.05 0.05 0.10 0.15 0.15 0.15 0.10 0.10 0.05 0.05
本法的基本思想
• 检验的基本思想是假定两个总体分布的中心位置 相同,中位数分别是Md1、 Md2,各抽出一个独立 的随机样本,各样本含量分别为n1,n2,且n1+n2=n。 • H0: Md1= Md2,即两总体分布位置相同, • H1:Md1 Md2,即两总体分布位置不同。 • 假若H0成立,两总体分布中心位置不存在差异, 则两样本的秩和在n1=n2时应大致相等;当n1 n2 时,则应与各样本含量成比例。反之,当两总体 分布不相同时,各组秩和将不与样本含量成比例。 但两种情况下都有R1+R2=n(n+1)/2。
0 1 2 3 3 4 4 5 5 6 6 7 7 8 9 10
0 1 2 3 3 4 4 5 5 4 4 3 3 2 1 0
0.0625 0.0625 0.0625 0.125 0.125 0.125 0.125 0.125 0.0625 0.0625 0.0625
附表10中只列有n≤25时的临界值。理论研究表明,当n 大于10时,检验统计量R经转换近似服从标准正态分 布:0.05>P>0.01 , 在α=0.05水准上拒绝H0 , 接受H1 , 结论与查表法相同
结论:
两组疗效的构成百分比差异无统
计学意义。
两组的疗效无差别。 (×)
注意:
一般的 χ2 检验不适用于有序
分类资料——“等级”、“程度”、
“优劣”的比较分析。因为检验只
利用了两组构成比提供的信息,损
失了有序指标包含的“等级”信息。
例如,假定两组的显效例数和有效例数互换,见表2。
表 2 治疗组与对照组疗效比较 组别 治疗组 对照组 例数 60 58 例 数 无效 6 14 有效 35 24 显效 19 20 百分比(%) 无效 10.00 24.14 有效 58.33 41.38 显效 31.67 34.48
• 大样本时,R值作如下变换后服从标准正态分布:
u
R n0 ( N 1) / 2 1 n1 n2 ( N 1) 12
二 等级/频数资料的秩和检验
例 14-1 分别用5%咪奎莫特软膏和氟尿嘧啶 软膏治疗尖锐湿疣的随机双盲临床研究 的疗效观察结果见表14-2,试比较两种 药物治疗尖锐湿疣的疗效。
第十四章 基于秩次的统计方法
• 参数检验:一是假定随机样本来自某种
已知分布(如正态总体),二是 该总体 分布依赖于若干参数,故称为参数检验。
• 非参数检验(nonparametric test):对
总体分布不作严格假定,又称任意分布 检验(distribution--free test), 即不必依 赖专门的总体分布的统计方法,与参数 无关,这时比较分布而不是比较参数, 称为“非参数检验”。
• H0 : 两样本来自同一总体(样本的每个观察值来自两总 体的概率均为0.5) • H1 : 两样本来自不同总体(样本的每个观察值来自两总 体的概率不等)
表 6-1 A 样本 观察值 7 14 22 36 40 48 63 98 秩和 秩号 4 6 10 11 13 14 15 16 R1=89 两独立样本秩和检验计算表 B 样本 观察值 3 5 6 10 17 18 20 39 秩号 1 2 3 5 7 8 9 12 R2 =47
• 1.建立检验假设H0、H1 • 2.给定检验水平α • 3 .统一编秩号,分组求秩和R1 、 R2 ,若 n1,n2 不等,则求较小例数组的秩和, 如 n1=n2 , T=min(R1 、 R2) 。计算检验统 计量R • 4 . 查附表9 , 得检验界值(如果R位于(
Rα (1) , Rα (2))区间内,P>α 接受H0 ;否则,拒 绝H0,接受H1)
R1 119114.5 9 237 1 250.5 4 259 17045
R2 109114.5 8 237 9 250.5 3 259 17408
当存在相同秩次时,必须对14-2的公式进行较正
c 1
3 ( t i ti ) i
对照组 14 20 24 58
合计 20 39 59 118
秩次范围 平均秩次 1-20 21-59 60-118 10.5 40 89
计算两组秩号并进行秩和检验
两组的平均秩号分别为: 治疗组:R1= (6×10.5+19×40+35×89)/60 =65.6 对照组:R2=(14×10.5+20×40+24×89)/58=53.1 经秩和检验,u=2.169,P<0.05,两组疗效差异有 统计学意义,因为治疗组平均秩号大于对照组,所以治 疗组疗效好。
概率 P
1,2,3,4 2,3,4 1,3,4 1,2,4 3,4 1,2,3 2,4 1,4 2,3 1,3 4 1,2 3 2 1 ---
--1 2 3 1,2 4 1,3 2,3 1,4 2,4 1,2,3 3,4 1,2,4 1,3,4 2,3,4 1,2,3,4
10 9 8 7 7 6 6 5 5 4 4 3 3 2 1 0
Asymp. Sig. Value Pearson Chi-Square Likelihood Ratio Linear-by-Linear 5.046 Association N of Valid Cases 118 1 .025 5.244 5.346 df (2-sided) 2 2 .073 .069
者的性别、年龄、病程无显著性差异,治疗结果见表1。
表 1 治疗组与对照组疗效比较 组别 治疗组 对照组 例数 60 58 例 数 无效 6 14 有效 19 20 显效 35 24 百分比(%) 无效 10.00 24.14 有效 31.67 34.48 显效 58.33 41.38
卡方检验
分析结果:
228 173 17 7 3 7 c 0.5836 3 N N uc u / c 1.242 1.96, 故P 0.05
3
228 1
N3 N
卡方与秩和检验区别
实例 考察硝苯地平治疗老年性支气管炎的疗效,治疗组 60人,用硝苯地平治疗,对照组58人,常规治疗,两组患
非参数分析方法的优缺点
• 优点:不受总体分布条件的限制,适用范 围广,某些不便准确测定,只能以严重程 度,好坏优劣,次第先后等作记录的资料 也可应用。 • 缺点:适用于参数检验的资料,如用非参 数检验会造成信息的丢失,导致检验功效 的下降。即当0假设不真时,非参数检验将 不如参数检验能较灵敏地拒绝0假设,犯第 二类错误的概率要比参数检验法大。