医学统计学 秩和检验
医学统计学秩和检验
对统计分析的结果进行解释和报告,包 括显著性水平、效应大小等。
医学统计学秩和检验的优势
1 非参数方法
医学统计学秩和检验不需要假设数据服从特 定的分布,更适用于真实世界的数据。
2 强大的统计推断
医学统计学秩和检验能够进行假设检验、置 信区间估计和相关分析等多种统计推断。
3 对异常值的鲁棒性
由于基于秩次而不是原始数据,医学统计学 秩和检验对异常值具有较好的鲁棒性。
3 基本原理
医学统计学秩和检验基于 非参数统计方法,不依赖 于数据的分布情况,更适 用于小样本和偏态数据。
医学统计学秩和检验的应用
药效试验
用于评估不同药物的疗效,判断药物之间的差异。
生存分析
用于分析患者的生存时间和生存率,评估不同因 素对生存的影响。
配对设计研究
用于比较两种相关观察结果之间的差异,如治疗 前后的数据比较。
相关分析
用于分析两个变量之间的相关程度,评估它们的 线性关系。
医学统计学秩和检验的步骤
1
收集数据
收集与研究目的相关的数据,并确保数
将数据转换为秩次
ห้องสมุดไป่ตู้
2
据质量和完整性。
对数据进行排序,将其转换为秩次,以
便进行后续的统计分析。
3
应用适当的秩和检验方法
根据研究设计和研究问题选择合适的秩
解释和报告结果
4
和检验方法。
4 广泛适用性
医学统计学秩和检验适用于不同类型的数据, 包括定量数据、定性数据和顺序数据。
医学统计学秩和检验的案例
临床试验
通过医学统计学秩和检验,研究 人员可以评估新药的疗效和安全 性。
流行病学调查
医学统计学秩和检验可以用于分 析调查数据,研究疾病的发病率 和风险因素。
医学统计学09秩和检验
22
u=
|11186 − 88(216 + 1) / 2 − 0.5 128 × 88 × (216 + 1) /12
(t 3 − t j ) ∑ j (N 3 − N )
= 3.628
C = 1− = 1−
823 − 82 ) + ( 783 − 78 ) + ( 303 − 30 ) + ( 263 − 26 ) ( 216 − 216
9
秩和
A组: - 、±、+、+、+、 ++ 秩和: 1 2 4.5 4.5 4.5 8.5
TA=25
B组: +、++、++、++、+++、+++ 秩和: 4.5 8.5 8.5 8.5 11.5 11.5 TB=53
TA+TB=N(N+1)/2=78
10
秩次:在一定程度上反映了等级的高低; 秩和:在一定程度上反映了等级的分布位置。 对等级的分析,转化为对秩次的分析。 秩和检验就是通过秩次的排列求出秩和,对总 体的分布进行假设检验。
α =0.05。
编秩 ,求秩和T。 确定检验统计量T 若两样本例数不等,以例 数较少者为n1,检验统计量T=T1=560.5。 确定P值,作出推断结论
29
560.55 − 24 × (68 + 1) / 2 − 0.5 u= = 3.4265 24 × 44 × (68 + 1) / 12
(16 3 − 16) + ( 28 3 − 28) + (19 3 − 19) + (5 3 − 5) C = 1− 68 3 − 68
秩和检验【医学统计学】
568.4
14.0
384.6
3.0
556.2
13.0
369.1
1.0
435.7
7.0
377.8
2.0
574.8
15.0
436.7
8.0
468.7
12.0
662.9
19.5
433.4
6.0
582.8
16.5
442.3
10.0
438.1
9.0
426.1
5.0
n1 10
T1 101
n2 12
T2 152
2.求检验统计量T 值
①省略所有差值为0的对子数,观察单位数减去0对子数 的个数 ②按差值的绝对值从小到大编秩,绝对值相等的差值若 符号不同取平均值,并保持原差值的正负号;
③任取正秩和或负秩和为T,本例取T-=3。
3. 确定P 值,作出推断结论
2020/8/8
15
检验步骤
查附表12 • 本例T=3,n=10,
3 9 6 8 7 -1 10 4 -2 5
T 52 T 3
2020/8/8
10
配对符号秩检验基本思想
• 当H0(差值的总体中位数Md=0)成立,任一配对差值出现正号、负号的 机会均等,秩和T-与T+的理论数也应相等为n(n+1)/4
• 可以证明:
• H0为真时,秩统计量T是对称分布 • H0非真时,T呈偏态分布
单纯⑴虚寒型 ⑵3 ⑶6 ⑷25 ⑸26 13 ⑻ 73
喘息虚寒型
1
3 10
9
3 26
虚寒阻塞型 16 28 61 27 ⑹9 141
2020/8/8
21
秩和检验【医学统计学】
2020/8/8
5
二、秩和检验
秩和检验:是用数据的秩次代替原始数据进行假设 检验。秩次(rank)是按照数值大小排序设定的编码。 秩和(rank sum)指同组秩次之和。 基本思想:先将原始资料在不分组别的情况下从小 到大编秩,然后按分组将秩次相加。若比较组之间的 秩和接近,则认为各组间没有差别;反之,如果各组 间的秩和相差悬殊,则认为各组间存在差别。
2020/8/8
6
注 意:
• 符合或经过变换后符合参数检验条件, 最好用参数检验。
• 资料不具备参数检验的条件,非参数检 验是一种有效的分析方法。
2020/8/8
7
可应用秩和检验的情况
1.不满足正态和方差齐性条件的小样本资料; 2.总体分布类型不明的小样本资料; 3.一端或两端是不确定数值(如<0.002、>65等)的资料(必选); 4.单向有序列联表资料;
8
3.19
1.04
9
3.37
1.22
10
4.57
2.42
11
T+=62.5
T-=3.5
2020/8/8
18
第三节 完全随机设计 资料的秩和检验
2020/8/8
19
一、完全随机设计两样本比较的秩和检验
分析完全随机设计的两样本计量资料时,若两样本 数据不能满足正态性和方差齐性进行检验的要求,以及 两样本观察指标为有序分类变量资料时,可采用 Wilcoxon Mann-Whitney U秩和检验。
参数检验
非参数检验
区别
已知总体分布为假定条件,对总体 不依赖总体分布的具体形式,比较分布的位 参数进行区间估计或假设检验。 置,根据分布形状而不是总体参数做出推论。
医学统计学 秩和检验讲解
表 10-5 脾淋巴细胞对 HPA 刺激的增值反应(测量指标 3H 吸收量 cpm)
A组
秩次
B组
秩次
C组
秩次
(1)
(2)
(3)
(4)
(5)
(6)
3012
11
2532
8
8138
15
9458
18
4682
12
2073
6
8419
16
2025
5
1867
4
9580
19
2268
7
885
2
13590
21
2775
9
实验组
对照组
生存日数
秩次
生存日数
秩次
(1)
(2)
(3)
(4)
10
9.5
2
1
12
12.5
3
2
15
15
4
3
15
16
5
4
16
17
6
5
17
18
7
6
18
19
8
7
20
20
9
8
23
21
10
9.5
90以上
22
11
11
12
12.5
13
14
n1=10
T1=170
n2=12
T2=83
1、建立假设 H0:两组小鼠生存日数总体分布相同 H1:两组小鼠生存日数总体分布不同 =0.05 2、编秩。先将两组数据放在一起,从小到大统一秩次范围。
3、计算检验统计量 先求秩和,见(7)、(8)栏合计。
医学统计学Ch08秩和检验
相同秩次多时校正
Nn1n2
uc u/ c
C1 (tj3 tj)(N3 N)
4 0 6.5 8128(4201 3)/20.5
u
3.3 6 6 9
(1 8)2 (22)4 (101 3)/1 2
C1(t3 j tj)1807410.887866
(N3N) 65450424
医学统计学Ch08秩和检验
➢ 未解决的:
➢ 数值变量资料在严重不满足正态性(极度偏态、数据不规则), 对平均水平进行比较。
➢ 数值变量资料在方差相差悬殊,无法利用变量变换达到方 差齐性时,对平均水平进行比较。
➢ 等级资料的分析,欲充分利用次序信息,比较组间等级差 异。
医学研究中的等级资料
➢ 疗 效:痊愈、显效、有效、无效、恶化 ➢ 化验结果:-、、+、++、+++ ➢ 体格发育:下等、中下、中等、中上、上等 ➢ 心功能分级:I、II、III ➢ 文化程度:小学、中学、大学、研究生 ➢ 营养水平:差、一般、好
➢ 检验假设
➢ H0 :三药疗效总体分布相同; ➢ H1 :三药疗效总体分布不同或不全相同。
➢ =0.05。
➢ 编秩 先计算各等级合计人数,再确定秩次范围,计 算平均秩次。
H 12 (93270232531.5210701.52)3(5221) 522(5221) 382 101 39
H 12 Ri23(N1) N(N1) ni
H 的校正与2近似
➢ 当有相同秩次时,H 需校正:
HCH/C
C1 (t3j tj)/[N3N)]
➢ 当 n 较大时, H 近似服从 = k – 1 的 2 分布。 故可按 2 分布获得概率 P,作出统计推断。
医学统计学--秩和检验
4、求秩和并确定检验统计量T
(1)分别求正、负秩次之和T+、T本例:T+=3.5 ;T- =41.5 (2)以绝对值较小的秩和为检验统计量T,本例 T=T-=3.5 n( n 1) 注:总秩和= 2 而 9(9 1) 45 2 , 本例T++ T_=45,
5、确定P值 (1)查表法 当n≤50时,查附表6: T界值表 (配对比较的符号秩和检验) 以例数n确定查哪一行,然后自左向右用T与 每一 栏界值相比。 T在界值范围之内,P值大于表上方相应概率 T在界值范围之外,P值小于表上方相应概率 (往右移一栏继续查) 本例 n=9,T=3.5,在双侧P=0.05的界值 范围(5~40)之外,在双侧P=0.02的界值范 围(3~42)之内,故 0.02< P <0.05
uc= u/ c df=∽的t值, 就是u值! C=1-∑(t3j-tj)/(N3-N) =1-[(1073-107)+(243-24)+(533-53)+ (243-24)]/(2083-208) =0.8443 查u值表 uc=0.4974/ 0.8443 =0.5413 uc=0.5413<u0.5, =0.6745,P>0.5 5、推断结论 本例P>0.5, 在α=0.05水准上,不拒绝H0,差别 无统计学意义,尚不能认为该药对两种支气管炎 的疗效不同。
低蛋白组平均秩和
蛋白组增重较多。
T2 =44.5/7=6.4,故可认为高
二、正态近似法: 当n1或/和n2-n1超出附表7范围
时,可计算u值,确定P值 。
| T n1 ( N 1) / 2 | 0.5 u n1n2 ( N 1) / 12
而当相同秩次较多(超过25%)时,需计算校正u值。
医学统计学 9第九讲 秩和检验
7
2.20 0.05 2.5 2.99 0.84
8
2.12 -0.03 -1 3.19 1.04
9
2.42 0.27
4
3.37 1.22 10
2.52 0.37
5
4.57 2.42 11
1. 建立假设 H0:差值总体中位数为0 H1:差值总体中位数不为0;
α=0.05 2. 计算统计量: T+=62.5,T-=3.5
B组:1
2
4.5 4.5 4.5
+
8.5
++
++
++
+++
+++
6 8 9 10 11 12
4.5 8.5 8.5 8.5 11.5 11.5
秩和
A组: - 、、+、+、+、 ++ 秩和: 1 2 4.5 4.5 4.5 8.5
TA=25
B组: +、++、++、++、+++、+++ 秩和: 4.5 8.5 8.5 8.5 11.5 11.5
(4)将秩次冠以正负号,计算正、负秩和(T+,T-); T++T- =n(n+1)/2
(5)用不为“0”的对子数n及T(取绝对值小的秩和作为统
计量T)查T界值表,得到P值作出判断。
编秩
A组: - 、、+、+、+、++ B组: +、++、++、++、+++、+++
医学统计学秩和检验
在医学研究中,秩和检验常用于比较两种或多种治疗方案的效果,如药物、手术等。通过 对秩和的统计分析,可以得出哪种方案更有效的结论。
疾病流行病学研究
在疾病流行病学研究中,秩和检验可用于分析不同人群或地区的发病率或死亡率差异。通 过对这些数据的分析,可以评估不同因素对疾病发生的影响。
临床决策支持
秩和检验在临床决策支持系统中也得到广泛应用。通过对病人的各种指标进行统计分析, 医生可以更好地了解病人的病情,从而制定更有效的治疗方案。
生物领域的应用
01
基因表达分析
在基因表达分析中,秩和检验可用于比较不同样本之间的基因表达谱
差异。通过对基因表达谱的统计分析,可以找出与特定疾病或生理过
程相关的关键基因。
根据样本数据计算检验统计量的值。
确定显著性水平
确定在假设检验中拒绝零假设的最小显著 性水平。
假设检验的推断与解释
推断
根据计算出的p值或其他统计指标,推断样 本数据所来自的总体的特性或参数。
解释
解释推断结果,考虑研究的假设和目的, 结合其他相关信息做出科学结论。
05
秩和检验的实际应用与案例 分析
医学领域的应用
社会科学研究
在社会科学研究中,秩和检验常用于比较不同群体或地区的经济社会指标差异。通过对这些数据的统计分析,可以评估不同 因素对社会发展的影响。
公共政策评估
秩和检验可用于评估公共政策的效果。通过对政策实施前后的数据进行统计分析,可以得出政策是否有效的结论,从而为 政策制定者提供参考。
市场调研
在市场调研中,秩和检验可用于比较不同产品或品牌的市场占有率差异。通过对这些数据的统计分析,可以帮助企业了解 市场状况,从而制定更有效的市场策略。
医学统计学等级资料的秩和检验
在某些情况下,可以排除异常值以提高检验的稳定性。但应谨慎处理,确保不会排除对 总体分布有重要影响的值。
稳健统计方法
采用稳健统计方法可以在一定程度上减少异常值对检验结果的影响,如使用中位数、众 数等稳健统计量进行秩和检验。
06
秩和检验的展望
秩和检验的发展趋势
广泛应用
秩和检验作为一种非参数统计方法,在医 学、生物学、环境科学等秩和,判断 两组数据的优劣或差异性,从而 进行假设检验。
适用范围
适用于等级资料和连续变量资料, 尤其适用于小样本和不服从正态 分布的数据。
秩和检验的步骤
01
数据整理
对等级资料进行排序,并赋予相应 的秩。
确定检验统计量
根据秩和计算出检验统计量,如Z值、 H值等。
03
02
计算秩和
在蛋白质组学研究中,秩和检验 用于分析蛋白质表达水平在不同 样本之间的差异。
在其他领域的应用
环境卫生研究
在环境卫生研究中,秩和检验用于评估不同暴露水平对健康的影响。
心理学研究
在心理学研究中,秩和检验用于比较不同干预或实验条件下的心理状态或行为差异。
05
秩和检验的注意事项
样本量的问题
样本量过小
当样本量过小时,无法充分反映总体分布情况,可能导致 检验结果不准确。
等级资料
按照事物的属性特征进行等级划分所得的数据,如 疗效评价中的治愈、显效、好转、无效等。
计量资料
通过度量衡等方法获得的数据,如身高、体重等。
等级资料的特点
有序性
等级资料具有有序性,不同等级之间存在一定的顺序 关系。
差异性
不同等级之间存在差异,同一等级内的数据具有相似 性。
相对性
医学统计学8秩和检验
4.6
15
7.0
18
Ri —
ni
—
96.5 10
单纯性肥胖
测定值
秩次
0.6
2
1.2
3
2.0
5
2.4
7
3.1
10.5
4.1
14
5.0
16
5.9
17
7.4
19
13.6
24
—
117.5
—
10
皮质醇增多症
测定值
秩次
9.8
20
10.2
21
10.6
22
13.0
23
14.0
25
14.8
26
15.6
27
15.6
28
132~184
158
4740
3634
无效 13
11
24
185~208
196.5
2554.5
2161.5
合计 n2= 126 n1=82
208
—
—
T2=12955.5 T1=8780.5
例8.3 用某药治疗不同病情的老年慢性支气管炎病人,疗效见表83第(2)、(3)栏,问该药对两种病情的疗效有无差别?
两组工人血铅值的秩和
检验
秩次
铅作业组
秩次
(2)
(3)
(4)
1
0.82
9
2
0.86
10.5
3
0.96
12
4
1.20
14
5
1.63
15
6
2.06
16
7
2.11
17
… T1=59.5
医学统计学-秩和检验
(4)求秩和并确定检验统计量
求出T+ TT+=18.5 T-=36.5
Page 23
(5)确定p值和作出统计推断
n≤50时 查附表9得n=10时,双侧P=0.10界值
是10~45 而T+=18.5在其中, P>0.10 按双侧0.05水准,不拒绝H0,差异无统计学意
义,故尚不能认为两法测定血清中谷丙转氨 酶含量有差别。
合计
128
88
216
~
~
12250 11186
以样本含量小的为T T=11186 n=88
Page 38
正态近似法(n1,n2-n1超出表的范围时)
n1>10或n2-n1 >10时
u T n1(N 1) / 2 0.5 n1n2 (N 1) /12
相同秩次多时校正 N n1 n2
uc u / c
同组秩次之和
Page 12
编秩
A组: - ± + + + ++ 秩次 1 2 4.5 4.5 4.5 8.5
TA=25
B组: + ++ ++ ++ +++ +++ 秩次 4.5 8.5 8.5 8.5 11.5 11.5
TA+TB=N(N+1)/2=78
TB=53
Page 13
➢秩次:在一定程度上反映了等级的高低; ➢秩和:在一定程度上反映了等级的分布位置。
Page 4
非参数检验适用情况
①等级资料(有序分类资料) ②偏态分布资料 ③未知分布型资料 ④要比较各组变异度较大,方差不齐,且 变
换不能达到齐性的资料 ⑤一端或两端有不确定的资料
Page 5
医学研究中的等级资料
➢疗 效:痊愈、显效、有效、无效、恶化 ➢化验结果:-、、++、+++ ➢体格发育:下等、中下、中等、中上、上等 ➢心功能分级:I、II、III ➢文化程度:小学、中学、大学、研究生 ➢营养水平:差、一般、好
医学统计学之秩和检验
医学统计学之秩和检验什么是秩和检验?秩和检验(Wilcoxon rank-sum test),又称为Mann-Whitney U检验,是非参数假设检验的一种常用方法,用于比较两个独立样本的位置差异。
这个方法基于样本的秩次,而不依赖于数据的具体分布。
秩和检验的适用场景秩和检验通常用于以下情况:1.样本数据不满足正态分布假设;2.无法满足方差齐性假设;3.样本容量较小。
秩和检验是一种非常灵活的方法,适用于大部分类型的数据分布,甚至可以包括极端的离群值。
秩和检验的原理秩和检验的原理是将两个样本的观察值合并后,按照大小重新排列,并赋予秩次。
然后利用秩次之和来比较两个样本的位置差异。
1.对于两个独立样本,将两组数据合并为一个整体的样本。
2.对于每个观察值,分别计算出在整体样本中的秩次。
3.计算两组样本的秩和,比较其大小。
4.根据秩和的大小以及样本容量,查表或计算检验统计量的p-value。
秩和检验的步骤秩和检验的具体步骤如下:1.将两个样本合并为一个整体样本,并标记属于哪个样本。
2.对整体样本中的观察值进行排序,得到秩次。
3.计算秩和,并比较两个样本的秩和大小。
4.根据秩和大小以及样本容量,查找临界值。
5.根据临界值判断是否拒绝原假设,或者计算统计量的p-value。
6.根据p-value判断是否拒绝原假设。
秩和检验的示例假设我们有两个医学治疗方法A和B,想要比较其对病人治疗效果的差异。
我们随机选择了两组病人,分别给予方法A和B进行治疗,然后观察他们的疗效。
以下是我们观察到的结果:组A:8, 10, 12, 10, 14 组B:9, 11, 14, 12, 13我们可以按照秩次将两组数据合并,并计算秩和:组A:8(1), 10(3), 12(4), 10(3), 14(5) 组B:9(2), 11(4), 14(5), 12(4), 13(2)组A的秩和为16,组B的秩和为17。
然后,我们根据秩和的大小以及样本容量,在秩和表中查找临界值。
医学统计学秩和检验
Test Statisticsb
蒸馏法 - 离
子交 换法
Z
-.471a
Asymp. Sig. (2-tailed)
.638
a. Based on positive ranks.
b. Wilcoxon Signed Ranks Test
完全随机设计的两独立样本的秩和检验
• 基本思想 –如果H0成立,则两样本来自分布相同的总体, 两样本的平均秩次T1/n1与T2/n2应相等或很接 近,且都和总体的平均秩次(N+1)/2相差 很小,若T值偏离此值太远,H0发生的可能性 就很小,若偏离出给定的值时,即P< ,拒绝 H0.
Sh ap i ro-Wi lk
Stati sti c
df
.919
10
.748
16
Si g. .345 .001
• 两独立样本的秩和检验
– 数据合并 – 两独立样本的秩和检验
group
pr
1.00
2.00
T o ta l
Ranks
N 10 16 26
Mean Rank 18.35 10.47
Sum of Ranks 183.50 167.50
– 编秩次,求秩和 • 去掉d=0的对子,总的对子数也要相应减去; • 用绝对值︱d︳编秩次,如果出现绝对值相等时, 则将它们的平 均秩次值作为他们的秩次; • 把差值的符号标在秩上,如果d>0,则秩次为“+”,d<0,则秩 次为“-”; • 求正负秩次之和T+与T-,绝对值较小者,作为统计量T值。 • 当n>50时,可按近似正态分布,用U检验,公式为:
非参数检验方法
应用范围
• 样本所代表的总体分布不易确定 • 样本不服从正态分布 • 两端或一端无确定值 • 方差不齐 • 数据类型为等级资料
医学统计学第13讲 秩和检验
诸如此类只能用严重程度、优劣等级、时序先后 等形式表达的资料, 既非呈连续分布的定量资料, 也非仅按属性归类的无序分类资料, 它们对观察 指标的表达比“定量”粗, 而比一般的“定性” 细, 组成了有确定顺序差别的若干“阶梯”, 但毗 邻的阶梯之间既不能度量, 又非等距。
人们通常把该类介于定量与定性之间的资料称作 等级资料, 又称有序分类资料。
A组:
组1: 组2: 组: 组4: .5组: 组:
8.5
11.5
两组的秩和(T)分别为: TA=25, TB=53
设A组有n1例, B组有n2例, n1+n2=N例, 则
TA+TB=N(N+1)/2=78
秩次一定程度上反映了等级的高低; 秩和一定程度上反映了等级(各组秩次) 的分布位置。
秩和检验是通过秩次的排列求出秩和, 从 而对总体的分布或分布位置进行假设检 验的方法。
15
653
16
712
17.5
762
21
843
22
849
24
896
25.5
901
27
-
179
⑴建立检验假设,确定检验水准 H0: 3个总体的分布位置相同 H1: 3个总体的分布位置不全相同
α=0.05
(2)计算检验统计量H
混合编秩, 相同数值, 取平均秩, 算得各组 的秩和R,
H
12 Ri2 3(N 1) N (N 1) ni
(4)
(5) (6)
(7)
(8)= (9) = (10)= (2)(7) (3)(7) (4)(7)
控制 36 4
1
41 1~41 21.0 756.0 84
21
医学统计学第七章秩和检验课件
分析影响患者生存时间的因 素
探究患者年龄、性别、病情等因素对患者生存时间 的影响,通过秩和检验判断各因素的影响程度。
评估患者预后及生存质量
通过对患者预后及生存质量相关指标的秩和 检验,了解患者的预后情况及生存质量。
05 案例分析与实践操作
案例一:某药物临床试验效果评价
试验设计
采用随机对照试验设计,将患者随机分为试验组和对照组,分别给予新药和传统药物治疗。
采用秩相关分析探讨生活方式因素( 如吸烟、饮酒、饮食等)与健康状况 (如高血压、糖尿病等)之间的关联 性。
03
结果解读
结果显示吸烟、饮酒等不良生活方式与 高血压、糖尿病等健康状况存在显著正 相关关系(P<0.05),提示改善生活 方式有助于降低慢性病风险。
案例三:生存分析差异性比较
数据来源
生存分析
感谢您的观看
医学统计学第七章秩和检验课件
目录
• 秩和检验基本概念 • 秩和检验方法 • 数据类型与预处理 • 秩和检验在医学研究中的应用 • 案例分析与实践操作 • 结果解读与注意事项
01 秩和检验基本概念
定义与原理
定义
秩和检验是一种非参数统计方法,用于推断两个或多个独立样本是否来自具有相同分布的总体。该方法基于样本 数据的秩次进行计算,不依赖于总体分布的具体形式。
提高结果准确性和可靠性建议
数据质量控制
确保数据的准确性和完整性,减少误差和偏倚。
多次重复实验
通过重复实验验证结果的稳定性和可靠性。
ABCD
选择合适的统计方法
根据数据类型和研究目的,选择合适的统计方法。
结合其他分析方法
如参数检验、非参数检验等,综合多种方法进行分析, 提高结果的准确性和可靠性。
35页卫生统计学:秩和检验
确定P值与结论
确定P值
根据统计量和样本量等参数,计算出相应的P值。
结论推断
根据P值的大小,判断差异是否具有统计学显著性,从而得出研究结论。一般来 说,P值小于0.05或0.01时,认为差异具有统计学显著性。
04
秩和检验的优缺点分析
优点分析
非参数性质
秩和检验是一种非参数统计方法,不需要假设数据符合特定的概率分 布,因此具有更广泛的适用性。
计算方法
将两个样本的秩次相加,并根据总数计算检 验统计量。
特点
对数据分布要求较低,能够处理非参数数据 。
等级相关秩和检验
适用范围
适用于等级资料或有序分类数据的关联性分析 。
计算方法
利用Spearman或Kendall等级相关系数计算秩 和检验统计量。
特点
能够分析有序分类变量之间的相关性,不受数据分布限制。
35页卫生统计学:秩和检验
• 秩和检验概述 • 秩和检验的基本类型 • 秩和检验的步骤与操作 • 秩和检验的优缺点分析 • 秩和检验的实例分析 • 结论与展望
01
秩和检验概述
定义与背景
秩和检验是一种非参数统计方法 ,用于比较两组或多组独立样本 来判断它们是否来自同一总体。
它基于对观察值进行排序,并利 用秩次(即观察值的顺序位置) 进行统计分析,适用于数据不服
对等级数据适应性有限
秩和检验主要适用于连续型数 据,对于等级数据(如评分等 级)的适应性相对有限。
对样本量要求较高
相对于其他参数检验方法,秩 和检验需要的样本量较大,在 小样本情况下可能不适用。
对数据关联性假设敏感
秩和检验依赖于独立同分布的假设 ,如果数据间存在相关性或集群效 应,可能会影响检验结果的准确性 。
医学统计学秩和检验讲解
实验组
对照组
生存日数
秩次
生存日数
秩次
(1)
(2)
(3)
(4)
10
9.5
2
1
12
12.5
3
2
15
15
4
3
15
16
5
4
16
17
6
5
17
18
7
6
18
19
8
7
20
20
9
8
23
21
10
9.5
90以上
22
11
11
12
12.5
13
14
n1=10
T1=170
n2=12
T2=83
1、建立假设 H0:两组小鼠生存日数总体分布相同 H1:两组小鼠生存日数总体分布不同 ? =0.05 2、编秩。先将两组数据放在一起,从小到大统一编秩。
T=13
.01 .02 .05 .10 .10 .05 .02 .01
7 9 13 17 61 65 69 71 (二) 基本思想: 假定从总体中随机抽取一个样本, 当重复所有可能组合的样本,得秩和 T+(或T-)的 分布。 T的分布为以均数为中心对称的非连续分布。 T的最小值为 0,最大值为 n(n+1)/2,均数为n(n +1)/4=22.5,当T值远离均数概率较小。
3、计算检验统计量 先求秩和,见(7)、(8)栏合计。
n1=38,n2=62,检验统计量T=2559。由于n1=38,超出附 表11的范围,故需用z检验。每个等级的人数表示相同秩
次的个数,即tj。由于相同秩次过多,故需用校正公式计 算zc值。
按公式10-4
医学统计学:第11章 秩和检验
Rank Sum Test
假设检验
参数假设检验 非参数假设检验
总体分布已知, 检验关于未知参数
的某个假设
总体分布未知时 的假设检验
非参数统计分析方法(non-parametric statistics) 不拘分布 (distribution-free statistics) 无分布形式假定 (assumption free statistics)
当ni较大时,H~c2(k-1),查附表8。
本例,c22,0.01=9.210,故Hc22, 0.01,得P<0.01,在 a=0.05水准上拒绝H0,接受H1 ,即认为三组小鼠脾淋巴 细胞对HPA刺激得增殖反应不全相同。
四. 多组间两两比较的秩和检验
方法(1):Wilcoxon检验-两两组间逐一分析 a a’ =a/k (k为比较次数)
表14-2 两种药物治疗尖锐湿疣疗效的秩和检验
5%咪 氟尿 合计 疗效 喹莫特 嘧啶 ti
(1) (2) (3)
秩号 范围
(4)
平均 秩次
(5)
秩和
5%咪喹 氟尿嘧 莫特(6) 啶(7)
治愈 显效 好转 无效 合计
119 109 228 1~228 114.5 13625.5 12480.5
9 8 17 229~245 237 2133 1896
在a=0.05水准上拒绝H0,接受H1。
若存在多个差数的绝对值相等,即
有相同的秩号:校正
u
n(n 1) / 4 | R |
n(n 1)(2n 1) / 24 ti3 ti / 48
本例,u 2.282 1.96 u 2.58,故0.05 P 0.01,
在a=0.05水准上拒绝H0,接受H1。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
=12955.5
单纯性合并肺气肿的慢性支气管炎组:
Ri=(42×54)+(6×119.5)+(23×158)+(24×196.5) =8780.5
此例n1=82,n2=126,n2-n1=44, 用正态分布法。求u值
计算校正的uc值,即:
8780.5 82 208 1 / 2 0.5 u 0.4974 82 126 208 1) 12 ( /
tj ( 3 107 243 24 533 53 243 24 107 )( )( )( ) C 1 1 0.8443 3 N N 208 208
3 j 3
t
0.4974 uc 0.541 0.8443
4. 确定P值,判断结果:
表11-1 某医院培训前后护理质量评分
秩次 (5) 9 6.5 — 3 9 -3 3 11 -3 9 6.5 — 3 T+=60,T-=6
护士编号 培训前评分 培训后评分 差 值 (1) (2) (3) (4)=(3)-(2) 1 7 10 3 2 7 9 2 3 7 7 0 4 6 7 1 5 7 10 3 6 7 6 -1 7 8 9 1 8 2 6 4 9 9 8 -1 10 6 9 3 11 4 6 2 12 6 6 0 13 6 7 1
五、多个样本间两两比较的秩和检验
1. 问题的提出:
前面学习了连续型资料样本均数差异的
假设检验方法。
小样本用t检验或方差分析,条件:变量
服从正态分布和方差齐。
大样本用u检验(中心极限定理)。
如果是小样本,变量的分布不清、 已知不服从正态分布或经数学转换后仍 不服从正态分布时,如何检验两个样本 或多个样本平均水平差异的统计学意义 呢? ★需要一种不依赖于分布假定的检验 方法,即非参数检验。
4. 确定P值,判断结果: 查表11-7,H界值表, H0.05 =5.78,按α=0.05水 准,得P<0.05,拒绝H0,故三种手术方法术后生
存月数不全相等。
(二)频数表法:
例11.5 比较不同孕周产妇的乳量。
表11-8 分娩时孕周与乳量的关系
秩 和 乳量 早产 足月产 过期产 合计 秩次范围 平均 秩次 早产 足月产 过期产 (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) 无 30 132 10 172 1-172 86.5 2595 11418 865 少 36 292 14 342 173-514 343.5 12366 100302 4809 多 31 414 34 479 515-993 754 23374 312156 25636 合计 97 838 58 993 38335 423876 31310
本例 uc=0.541, 0.541<0.675,故P>0.5, 按α=0.05水准,不拒绝H0。尚不能认为该疗 法对以上两种病情的慢性支气管炎患者的疗 效有差别。
第三节 多个样本比较的秩和检验
(Kruskal-Wallis法,即H检验)
(一)直接法:
例11-4 某医院外科用三种手术方法治疗肝癌 患者15例,每组5例,进入各组的患者系用随 机方法分配,每例术后生存月数如表11-6的第 ⑴、⑶、⑸栏。试问三种不同手术方法治疗肝 癌的效果有无差别。
如遇相同数值时,若相同数值在不同组内, 则取平均秩次。
表11-6 三种手术方法治疗肝癌患者的术后生存月数
甲法生存月数 ⑴ 3 7 7 6 2 Ri
Ni
秩次 ⑵ 4 10 10 7.5 2.5 34
5
乙法生存月数 ⑶ 9 12 11 8 5
秩次 ⑷ 13 15 14 12 6 60
5
丙法生存月数 秩次 ⑸ ⑹ 1 1 2 2.5 6 7.5 4 5 7 10 26
表11-1 某医院培训前后护理质量评分
护士编号 培训前评分 培训后评分 (1) (2) (3) 1 7 10 2 7 9 3 7 7 4 6 7 5 7 10 6 7 6 7 8 9 8 2 6 9 9 8 10 6 9 11 4 6 12 6 6 13 6 7
1.建立假设:H0:差值的总体中位数为0。 H1:差值的总体中位数不为0。 α=0.05 2.求差值: 3.编秩:差值的绝对值从小到大编秩,绝对值 相等,符号不相同时,取平均秩次;零差值 不参与编秩;将差值的正负标在秩次之前。
126 82 208
—
1.建立假设:
H0:两个总体疗效分布的中心位置相同。 H1:两个总体疗效分布的中心位置不同。 α =0.05
2. 编秩:
(1)求各级别合计数。 (2)确定秩次范围。 (各级别的频数与平均秩次相乘再求和。 单纯性慢性支气管炎组:
Ri=(65×54)+(18×119.5)+(30×158)+(13×196.5)
3. 秩和检验的基本步骤:
(1) 建立假设
(2) 由小到大编秩
(3) 分别求秩和
(4) 确定或计算检验统计量 (5) 确定P值
秩和检验 属非参数方法。 2检验对总体的分布没有任何要求,
也属非参数方法。
第一节 配对设计资料的符号秩和检验 (Wilcoxon配对法)
例11-1 某医院组织病人对护理质量作评 价,同时对护士进行再培训,问培训前 后的评分结果是否有显著性差异?
甲种香烟 乙种香烟 秩次⑵ 秩次⑷ (1) (3) 25 6 28 9.5 28 9.5 31 13 23 4 30 12 26 7 32 14 29 11 21 2 22 3 27 8 24 5 20 1 n1=6 T1=40.5 n2=8 T2=64.5
1.建立假设:
H0 :两总体分布相同或两总体分布中心 位置相同。 H1:两总体分布中心位置不同。
5
3.求各组秩和:
4.计算检验统计量H值:
12 R H 3( N 1) N ( N 1) ni
12 342 602 262 H 3(15 1) 6.32 15(15 1) 5 5 5
2 i
Hc H C
分子为H值,分母C为校正数,
表11-6 三种手术方法治疗肝癌患者的术后生存月数
甲法生存月数 ⑴ 3 7 7 6 2 乙法生存月数 ⑶ 9 12 11 8 5 丙法生存月数 ⑸ 1 2 6 4 7
1. 建立假设:
H0:三个总体分布的中心位置相同。 H1:三个总体分布的中心位置不全相同。 α =0.05
2. 编秩:将各组数据混合由小到大编秩次,
控 制 显 效 有 效 无 效 合 计
65 42 107 18 6 24 53 24
1~107
108~131 132~184 185~208
54 119.5 158 196.5 —
3510 2151 4740
2268 717 3634
30 23 13 11
2554.5 2161.5 12955.5 8780.5
第十一章 秩和检验
中山大学公共卫生学院 医学统计与流行病学系 林爱华
一、非参数检验的概念、优缺点 秩和检验的基本步骤 二.配对资料的符号秩和检验 (Wilcoxon配对法) 三.两样本比较的秩和检验 (Wilcoxon两样本比较法)
四.多个样本比较的秩和检验 (Kruskal-wallis法,即H检验)
α=0.05
2. 编秩:将两样本混合编秩次。若有相同 值,处于不同组,取平均秩次;处于同一 组,不必取平均秩次。
3. 求秩和:记样本量少的组为“1”组,其 样本量为n1 ,其秩和T1 为T。(如果量样本 量相同,则任取一个T)。本例n1=6,n2=8, 则T=40.5。
4. 确定P值,判断结果:
准不拒绝H0 ,尚不能认为两种香烟的
尼古丁含量有差别。
(2)正态近似法 (超出表114的范围时):
| T1 n1 ( N 1 ) / 2 | 0.5 u n1 n2 ( N 1 ) / 12
查标准正态分布表。 *校正公式: u u c
C
C 1 t 3 t j N 3 N j
1.建立假设:
H0:三个总体分布的中心位置相同。
H1:三个总体分布中心位置不全相同。
α =0.05 2.编秩(第5、6、7列)
3.求秩和(第8、9、10列)
4.计算检验统计量:
12 383352 4238762 313102 H 3(993 1) 14.3 993(993 1) 97 838 58
(1)查表法,用于小样本时: 基本思想:若总体分布相同,两组样本出自 同一总体,任一组的秩和不应太大或太小, 若某一组的秩和太大或太小,表明该组的总 体水平高于或低于另一组的总体水平。 若 下限<T1<上限,P值>表中概率值。 若T1下限或T1上限,则P值表中概率值。
本例:查表11-4, 当n1=6,n2-n1=8-6=2时,40.5在 31~59之间,得P>0.1,按α=0.05水
2. 基本概念:
前面介绍的检验方法称为参数检验 (parametric test),对总体的分布类型作某 种假定,基于这类假定的统计方法。
非参数检验:对总体的分布类型不作任何 要求的统计方法称非参数检验 (nonparametric test),由于其对总体分布 不作严格假定,所以又称任意分布检验 (distribution-free test)。
tj C 1 N N 校正后,Hc>H,P值减小。
3 j 3
t
HC 1
H ( t3 tj ) j N3 N
( t 3 t j ) ( 2 3 2) ( 2 3 2) j ( 3 3) 36
3
6.32 HC 6.39 36 1 3 15 15