第八章 统计秩和检验
医学统计学秩和检验课件课件
秩和检验适用于无法直接比较数据大小或数据不符合正态分 布的情况,具有较高的实用性和广泛的应用范围。
假设与前提
假设
秩和检验的前提假设包括独立性、样本的随机性和总体分布的近似性。
前提
满足上述前提假设的情况下,秩和检验能够有效地比较各样本之间的差异。
适用范围
适用范围
秩和检验适用于多个独立样本之间的比较,如配对设计、完全随机设计等。
基于秩和检验的统计推断
通过利用秩和检验的结果进行统计推断,可以得出有关总体分布、总体参数等的推断。例 如,可以利用秩和检验的结果进行假设检验、置信区间的计算等。
秩和检验的展望
改进现有秩和检验的效能
可以通过研究现有秩和检验的效能,发现其不足之处并加以改进。例如,可以研究如何提高秩和检验对异常值、离群值的稳 健性,或者如何提高其对小样本的精确度等。
多种样本的秩和检验
除了对两样本进行秩和检验外,还可以对多个样本进行秩和检验,如Kruskal-Wallis H检 验、Jonckheere-Terpstra检验等,以便同时比较多个样本。
多因素影响的秩和检验
通过引入多个因素,可以研究它们对秩和检验结果的影响。例如,可以研究不同因素对多 个样本秩和检验结果的影响,或者研究一个因素对不同样本秩和检验结果的影响。
注意组间数据的可比性,避免由于数据尺度或单位不 同导致的误差。
THANKS
感谢观看
不适用范围
对于不符合独立性的数据,如重复测量数据、等级资料等,秩和检验可能无法得 出正确的结论。
02
秩和检验的步骤和方法
配对秩和检验
1 2
适用情况
配对秩和检验适用于两个相关样本、完全随机 设计的两样本均数比较。
数据特点
秩和检验
编号 (1 ) 1 2 3 4 5 6 7 8 9 10 11 12 离子交换法 (2 ) 0.6 3.2 3.4 2.6 0.4 2.0 1.5 3.4 5.8 4.5 3.9 1.9 蒸馏法 (3 ) 0.1 2.1 2.4 3.3 0.4 5.6 2.4 3.6 3.0 5.3 2.7 1.2
3.确定检验统计量T并得出P值,判断结果:
此例n1=80>10,n2=100,n2-n1=20>10,使用正态近似法求Z值,确定P值。 又由于相持较多,计算校正的Zc值,即:
Z
7603 80 180 1 / 2 0.5 80 100 ( 180 1 ) / 12
3 j
(2)正态近似法。大样本 (n>50)
Z
| T μ T | 0.5
σT
| T n (n 1)/4 | 0.5
n (n 1)(2n 1)/24
校正公式:(当相持个数较多时)
Z
| T n(n 1) / 4 | 0.5
3 n(n 1)(2n 1) (t j t j ) 24 48
第八章 秩和检验
中山大学公共卫生学院 医学统计与流行病学系
凌莉 教授 lingli@
一、非参数检验的概念及其应用 二.配对资料的符号秩和检验 (Wilcoxon配对法) 三.完全随机设计两独立样本比较的秩和检验 (Wilcoxon两样本比较法) 四.完全随机设计多组独立样本比较的秩和检验 (Kruskal-Wallis法,即H检验) 五、随机区组设计资料的秩和检验 (M检验)
2. 编秩并求秩和:
(1)求各级别合计数。
医学统计学秩和检验课件课件
医学统计学秩和检验课件xx年xx月xx日CATALOGUE目录•秩和检验概述•秩和检验的类型与计算方法•秩和检验的数据分析步骤•秩和检验的实例分析•秩和检验的注意事项与建议•总结与展望01秩和检验概述秩和检验是一种非参数统计方法,它通过将原始数据转换为秩(即相对位置),并利用秩的分布来进行假设检验。
定义秩和检验基于这样一个原理,即在不同组别中,如果总体分布相同,则秩的平均数应该相等。
因此,通过比较各组的秩平均数,可以判断各组的分布是否存在显著差异。
原理定义与原理优点适用于小样本数据:在样本量较小时,秩和检验仍然能够有效地检验假设,不受分布形状的限制。
不受异常值影响:由于秩和检验关注的是相对位置而不是具体数值,因此即使存在异常值,也不会对检验结果产生太大影响。
缺点对数据条件要求较高:秩和检验要求数据满足独立性、正态性和方差齐性等条件,否则可能导致误判。
检验效能较低:相对于参数检验方法,秩和检验的检验效能较低,即需要更大的样本量才能达到相同的检验效果。
秩和检验的优缺点临床医学研究在临床医学研究中,常常需要比较不同治疗方案的效果,此时可以使用秩和检验对不同组别的疗效进行比较。
秩和检验的应用场景生物医学研究在生物医学研究中,常常需要对不同生物样本(如动物、人类等)的生理指标进行比较,此时可以使用秩和检验来分析指标的差异。
流行病学研究在流行病学研究中,需要对不同地区、不同人群的疾病发病率、患病率等进行比较,此时可以使用秩和检验来分析差异是否存在。
02秩和检验的类型与计算方法配对比较法也称为配对t检验,它是对同一研究对象进行两种不同的处理,然后比较它们的结果。
配对比较法定义适用于小样本数据,特别是无法确定总体分布或总体方差未知的情况。
适用范围首先对配对数据求差值,然后对这些差值进行t检验。
计算方法独立样本法定义01独立样本法也称为独立t检验,它是对两个不同的总体进行比较。
适用范围02适用于大样本数据,并且样本的总体分布是正态分布或近似正态分布的情况。
医学统计学秩和检验
在医学研究中,秩和检验常用于比较两种或多种治疗方案的效果,如药物、手术等。通过 对秩和的统计分析,可以得出哪种方案更有效的结论。
疾病流行病学研究
在疾病流行病学研究中,秩和检验可用于分析不同人群或地区的发病率或死亡率差异。通 过对这些数据的分析,可以评估不同因素对疾病发生的影响。
临床决策支持
秩和检验在临床决策支持系统中也得到广泛应用。通过对病人的各种指标进行统计分析, 医生可以更好地了解病人的病情,从而制定更有效的治疗方案。
生物领域的应用
01
基因表达分析
在基因表达分析中,秩和检验可用于比较不同样本之间的基因表达谱
差异。通过对基因表达谱的统计分析,可以找出与特定疾病或生理过
程相关的关键基因。
根据样本数据计算检验统计量的值。
确定显著性水平
确定在假设检验中拒绝零假设的最小显著 性水平。
假设检验的推断与解释
推断
根据计算出的p值或其他统计指标,推断样 本数据所来自的总体的特性或参数。
解释
解释推断结果,考虑研究的假设和目的, 结合其他相关信息做出科学结论。
05
秩和检验的实际应用与案例 分析
医学领域的应用
社会科学研究
在社会科学研究中,秩和检验常用于比较不同群体或地区的经济社会指标差异。通过对这些数据的统计分析,可以评估不同 因素对社会发展的影响。
公共政策评估
秩和检验可用于评估公共政策的效果。通过对政策实施前后的数据进行统计分析,可以得出政策是否有效的结论,从而为 政策制定者提供参考。
市场调研
在市场调研中,秩和检验可用于比较不同产品或品牌的市场占有率差异。通过对这些数据的统计分析,可以帮助企业了解 市场状况,从而制定更有效的市场策略。
医学统计学 秩和检验ppt课件
.
15
1 4 10 1112 13 14 15 80
2 3 5 6 7 8 9 16 56
123 45 6 7 8
9 10 11 12 13 14
.
15 16
16
Wilcoxon符号秩和检验
(Wilcoxon signed rank test)
21.5(T )
负差值秩次
(6) 2 3 - 5.5 - - - 4 9 -
23.5(T- )
.
23
(3)确定P值,并作出统计推断。
A. 当n≤50时,查附表10,T界值表。N=9
0.10 8-37 0.05 5-40 0.02 3-42 0.01 1-44 检验统计量T值在上、下界值范围内,其P值大于 相应的概率水平;若T值在上、下界值范围上或范围外, 则P值等于或小于相应的概率水平。原则:内大外小 本例 T=21.5
.
24
以差值不等于0的数值对子数n=9查附表10, 得 P>0.10, 按照=0.05水准,不拒绝H0,差别无统计学 意义。尚不能认为甲、乙两种方法测定水源中砷含 量有差别。
.
25
注意:
由附表10可知,当n<5时,配对符号秩和检验 不能得出双侧有统计学意义的概率,故样本含 量必须大于5。
当5<n<50时,根据附表10,T界值表(配对比 较的符号秩和检验用)确定P值。
n2 12
丙磺酸钠 秩次 1.5 8 12 13 14 15 16 17 18 20 21 22
T2 177.5
该资料为比值数据,不服从正态分布,现采用Wilcoxon秩和检验。
统计学课件之秩和检验
某研究者欲研究保健食品对小鼠的抗疲劳作用, 将同种属的小鼠按性别和年龄相同、体重相近配 成对子,共14对, 并将每对中的两只小鼠随机分 配到两个不同的剂量组,测量小鼠负重游泳时间 (分钟,负重5%体重)。试比较不同剂量组的小 鼠负重游泳时间有无差别。
小鼠对子 1 2 3 4 5 6 7 8 9 10 11 12 13 14
(H检验)
back
检验目的 配对设计两组资料的总体分布是否相同
(本质为考察差值的总体分布其中位数是否为0)
检验步骤
建立假设 H0:差值的总体中位数为0(Md=0) 编秩 按差值的绝对值从小到大编秩,再相应赋以
正负号;其中,①差值为0舍去;②若差值 绝对值相等且符号相同,则顺序编秩;③若 差值相等但符号相反,则取平均秩次。
计算统计量T 分别求T+与T-,并以绝对值较小者 作为最终统计量T 。
确定P值(T界值表或正态近似法),作出结论 back
检验目的 完全随机设计两组资料的总体分布位
置是否相同
检验步骤
建立假设 H0:两总体分布或分布位置相同 编秩 将两组数据从小到大统一编秩,其中 ①若
数值相等且在同一组,则顺序编秩; ② 若 数值相等但不在同一组,则取平均秩次。
中剂量组 14.00 13.00 15.00 17.00 13.00 18.00 17.50 10.20 10.00 10.50 13.80 3.03 15.20 16.50
高剂量组 15.20 5.50 14.00 6.50 5.50 13.50 10.00 10.20 10.00 9.50 6.80 3.48 5.50 9.00
3N
1
确定P值(
)2界,值作表 出结论
(注意:若经过检验,得到有显著性的结果,只能
秩和检验
自由度为(k-1)
当各区组间出现相同秩次时,需进行校正 校正公式为
2 c
c
2
c 1
(t
3 j
t j ) bk ( k
2
1)
b为区组个数,k为处理组个数
随机化区组设计资料的多重比较
检验假设 : H0:第i组与第j组所代表的总体中位数相等 H1:第i组与第j组所代表的总体中位数不等 样本含量较大时,计算Zij值
例: 四种疾病患者痰液内嗜酸性粒细胞的检查 结果见表。问四种疾病患者痰液内嗜酸性粒细 胞的等级分布有无差别?
四种疾病患者痰液内嗜酸性粒细胞等级比较
例 数 白细胞等 级 秩次范 围 平均 秩次 秩 和 合计
支气管扩 张
肺水肿
肺癌
病毒性呼吸 道感染
支气管扩 张
肺水肿
肺癌
病毒性呼吸 道感染
(1) + ++
(2) 0 2 9
(3) 3 5 5
(4) 5 7 3
(5) 3 5 3
(6) 11 19 20
(7) 1~11 12~30 31~50
(8) 6 21 40.5
(9) 0 42 364.5
(10) 18 105 202.5
(11) 30 147 121.5
(12) 18 105
+++
6
第三节 完全随机化设计多组独立样本的 秩和检验
检验步骤
1.建立检验假设 H0:各总体的分布位置相同 H1:各总体的分布位置不同或不全相同 α=0.05 2.编秩 将各组数据混合,由小到大排序并 编秩,如遇有相等数值则取平均秩次 3.求秩和 分别将各组秩次相加。 4.计算统计量
医学统计学秩和检验课件课件
它利用数据排序后的秩次(即数 据在排序后的位置)代替原始数 据,通过比较不同组别间秩次的 平均值来推断各组之间的差异。
适用范围
适用于总体分布不明 确或不符合正态分布 的情况。
可用于处理等级数据 、有序分类数据和无 序分类数据。
适用于小样本或样本 量不均衡的情况。
特点
01
秩和检验不受总体分布 限制,具有较好的稳健 性。
秩和检验无法处理含有缺失值的数 据,如果数据中存在缺失值,需要 进行适当的处理或剔除。
使用注意事项
选择合适的检验方法
在应用秩和检验时,需要根据数据的实际情况选择合适的检验方 法,如配对比较、独立样本或等级数据等。
注意数据的异常值和离群点
在应用秩和检验前,需要关注数据中的异常值和离群点,并进行适 当的处理。
数据清洗
对数据进行预处理,如缺 失值填充、异常值处理等 。
描述性统计
对数据进行描述性统计分 析,如均值、中位数、标 准差等,以了解数据的基 本特征。
秩和检验实施
根据数据类型和检验目的 选择适当的秩和检验方法 ,如Wilcoxon秩和检验或 Mann-Whitney U检验。
结果解释与结论
结果解释
根据秩和检验的结果,解释数据间的差异是否有统计学显著性。
考虑数据的分布情况
在应用秩和检验时,需要考虑数据的分布情况,如果数据不符合正 态分布,可能需要采用其他统计方法。
05
秩和检验的实例分析
实例选择与数据收集
实例选择
选择一组实际的临床数据或公共卫生数据,数据应具有代表性且符合正态分布 。
数据收集
确保数据来源可靠,收集过程严谨,避免数据误差和偏倚。
实例分析过程
03
医学统计学第八章-t检验
随机数:206 126
……
试验
对照
试验
对照
对照
试验
对子号
试验组
对照组
1
门诊6
门诊1
2
门诊4
门诊2
3
门诊3
门诊5
……
……
试验组与对照组的两个观察对象均按照一定的条件配成对子, 同一对子中的“混杂”因素在二者间几乎相同;而在不同对子 间这些“混杂”因素则有可能差别很大
01
02
03
单样本资料的t检验
单样本资料的t检验
P/ 2
P / 2
t39
0
-2.023
2.023
-1.294
1.294
1/2α
1/2 α
由于t=-1.294>t0.05/2,35=-2.023,因此虽然无法准确得出P值,但仍然可以推断P>0.05(经过计算机软件得出结果P=0.203 )
在a=0.05的水准上,不拒绝H0,尚不认为农村新生儿的出生体重与该地平均水平不同。
2
样本对应的总体均数等于3.36,仅仅是由于抽样误差所致这种差别;
3
非抽样误差,二者的确有别?
4
两种情况只有一个是正确的,且二者必居其一,需要我们作出推断。
单样本资料的t检验
H0:=3.36,农村新儿体重与该地平均水平相同
H1:≠3.36,二者不同 (有可能高也有可能低,总之不相等即可)
检验水准a=0.05(双侧)
02
假设检验与区间估计的关系
2.018
前面阐述了方差齐性的情况下,如何进行两个样本均数比较的t检验
如果方差不齐,很多学者建议在这样的情况下采用自由度校正的方法计算t分布的概率,或者直接采用非参数检验
第八章秩和检验
例表8-1配对资料秩和检验步骤
1.建立检验假设: H0:Md=0, (T +) =(T-),即两种方法测定 结果值相同 H1: Md≠0,或(T +) ≠ (T-) α=0.05 2.编秩,求正、负秩次的秩和(T) 3.任取(T) 查表确定秩和(T)的概率(p) (本例n=11<50)
B组平均秩次=54.5/6=9.08
第一节、配对样本比较的符号秩检验
( Wilcoxon signed rank test)
何时选用配对资料的秩和检验 1.配对设计等级资料的比较 2.两组配对计量数据, 变量差值(d)
不为正态分布,秩和检验效率高于参 数的配对t检验。
两种方法治疗扁平足效果观察
病例号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 原始记录 A 好 好 好 好 差 中 好 好 中 差 好 差 好 中 好 中 法 B 差 好 差 中 中 差 中 差 中 差 好 差 中 差 中 差 法 A 3 3 3 3 1 2 3 3 2 1 3 1 3 2 3 2 量化值 法 B 1 3 1 2 2 1 2 1 2 1 3 1 2 1 2 1 法 差 2 0 2 1 -1 1 1 2 0 0 0 0 1 1 1 1 值 秩 10 — 10 4 .5 -4 .5 4 .5 4 .5 10 — — — — 4 .5 4 .5 4 .5 4 .5 次
Ranks NMean Sum Rank of Ranks VAR00002 -Negative VAR00001 Ranks 2 5.75 11.50 Positiv e Ranks 9 6.06 54.50 Ties 1 Total 12
Test Statistics b VAR00002 VAR00001 -1.913 a .056
第八章秩和检验
SPSS统计软件
.75
.50
.25
数据点不为直线, 并未分布在线上, 提示本资料不为 正态.
.25 .50 .75 1.00
0.00 0.00
Observed Cum Prob
配对设计资料的秩和检验步骤
(Wilcoxcon signed-rank test)
方法: 1.将配对数据的差值(d)按绝对值大小转换 为秩,如差值为0舍去。 2.求差值的正、负秩和,记为(T+) 、 (T-) 。 3.用任意一个正或负秩和(T)做检验。 4.检验方法有: 1)查表法: (对子数n≤50)* 2)正态近似法,n>50时用公式(8-1)
Ranks N VAR00002 - VAR00001 Negative Ranks Positive Ranks Ties Total
Test Statisticsb VAR00002 VAR00001 -1.913a .056
2 9 1 12
Mean Rank 5.75 6.06
Sum of Ranks 11.50 54.50
10 — 10 4.5 -4.5 4.5 4.5 10 — — — — 4.5 4.5 4.5 4.5
讲义例8-1配对设计计量数据
编号 原法 1 60 2 142 3 195 4 80 5 242 6 220 7 190 8 25 9 212 10 38 11 236 12 95 新法 80 152 243 82 240 220 205 38 243 44 200 100
等级数据的两组比 例数较多(频数表形式)
表8-5肺癌病人与矽肺0期工人RD值比较
肺癌病人 观察值 秩号 2.78 1 3 .23 2.5 4.20 7 4.87 14 5.12 17 6.21 18 7.18 19 8.05 20 8.56 21 9.6 22 矽肺0期 观察值 秩号 3.23 2.5 3.5 4 4.01 5 4.15 6 4.28 8 4.34 9 4.47 10 总T=253 4.64 11 4.75 12 4.82 13 4.95 15 5.10 16
统计学秩和检验
案例展示:医学研究中应用秩和检验
案例一
某医学研究比较了两种不同治疗方法对患者疼痛程度的影响。由于疼痛程度为等级资料,且样本量较小,研究者 选择了Wilcoxon符号秩和检验进行分析。结果显示,两种治疗方法的疼痛程度存在统计学差异(P<0.05),表 明其中一种治疗方法在减轻患者疼痛方面更有效。
案例二
THANKS
感谢观看
适用于连续型数据,且两个样本相互独立的情况 。
多重比较与Kruskal-Wallis H检验
目的
用于比较多个独立样本所来自的总体的分布是否存在显著差异。
方法
将多个样本数据混合后按大小排序,计算每个样本的秩和,通过比较各组秩和的差异判 断多个总体分布是否存在显著差异。如果存在差异,可进一步进行两两比较。
基于模型的秩和检验
基于模型的秩和检验方法结合了参数模型和非参数检验的优点,通过建立适当的统计模型来描述数据 的分布规律,并利用模型参数进行假设检验,从而提高了检验的灵活性和准确性。
前沿动态及未来发展趋势
基于大数据的秩和检验
随着大数据时代的到来,基于大数据的秩和检验方法将具有更广阔的应用前景。这些方法 可以利用大规模数据集提供的丰富信息,通过挖掘数据间的关联性和规律性,进一步提高 秩和检验的效能和准确性。
• · 适用范围:秩和检验适用于等级资料、不满足参数检验前提的计量资料以及某些特殊情况下 的计数资料。例如,在临床医学中,常常用于评价两种治疗方法对患者生存时间的影响是否 存在差异;在生物学中,可用于比较不同基因型对某种表型的影响等。
适用范围及优缺点
优点:秩和检验的优点包 括
对异常值和离群点相对不 敏感;
03
适用范围
适用于连续型数据,且样本量较小的 情况。
医学科研中的统计方法(第八章)秩和检验
3. 查界值表。 此例较小n1 = 9, n 2 - n1 =2,查附表7(两样本秩和检验用T 界值 表),用双侧检验,可得: T0.05(9,2) 的范围为 (68,121) T0.01(9,2) 的范围为 (61,128) 本例T =117.5,在区间 (68,121) 之内,所以 P > 0.05。 4. 结论 因为P > 0.05,所以差异无统计学意义。
EG0802
例8.3 男性慢性气管炎病人与健康对照共272人, 其日吸烟量(支)的资料如表8.3, 试分析日吸烟量与慢性气管炎发病有无关系?
表 8.3 慢性气管炎病人与健康对照组吸烟量(支)的比较
日吸烟量 小(1~) 病人组 对照组 秩 号 平均秩次 22 24 1-46 23.5 中(10~) 大 量 ( 20 ~ ) 98 87 47-231 139 25 16 232-272 252 145 127 合 计
本例是等级有序分组资料(非四格表资料) 故要用秩和检验 EG0803
使用SPSS软件处理,得结果如下两表:
Ranks 分组 N Mean ห้องสมุดไป่ตู้ank Sum of Ranks
吸烟量 病人组 145
对照组 127 Total 272
140.96
131.41
20439.00
16689.00
Test Statisticsa 吸烟量 Mann-Whitney U 8561.000 Wilcoxon W 16689.000 Z -1.214 Asymp. Sig. (2-tailed) .225 a. Grouping Variable: 分组 结论 双侧检验P =0.225 〉0.05,差异无统计学意义。根据目前 资料尚不能认为吸烟多少与慢性气管炎发病有关。
秩和检验(卫生统计学课件)
(2)编秩次并求秩和统计量 首先求出各对数据的差值,见表的第(4)列;然后编秩次,按照差值绝对值由小 到大编秩,并按差值的正负给秩次加上正负号;若差值为“0”,舍去不计,总的对 子数也要减去此对子数(记为 n);若差值的绝对值相等,取其平均秩次。最后,分 别求正负秩次之和T+ 和 T- ,任取T+ 或 T- 为检验统计量 ,本例选取T=2 。
(t
3 j
t
j
)
24
48
实例说明
➢ 例2 指导28名有轻度牙周疾病的成年人进行良好的口腔卫生保健,6个月后,按照牙 周情况好转高低程度分别给予+3,+2,+1;牙周情况变差程度依次给予分数-1,-2,3;没有变化给予0分。数据如下表(表2所示),试对此项干预的结果进行评价。
表 2 实行良好口腔卫生习惯6个月后牙周情况的变化程度
➢ 【适用情况】 ➢ (1)配对设计的计量资料,—但不服从正态分布或分布未知 ➢ (2)配对设计的等级资料
实例说明
➢ 例1 临床研究白癜风病人的IL-6指标在白斑部位与正常部位有无差异,检测结果如下表 (表1所示) 。
表1 白癜风病人的不同部位白介素指标(pg/ml)
病人号 (1)
1 2 3 4 5 6 7 8 合计
(n1+n2+1)/2 与n2 (n1+n2+1)/2越明显,H0 检验假设成立的可能
性越小。
Frank Wilcoxon
实例说明 例1 观察有无淋巴细胞转移的胃癌患者的生存时间如下表,问两组患者的生
存时间是否不同?
表1 两组胃癌患者的生存时间(月)
无淋巴细胞转移
时间
秩次
12
统计学 秩和检验
相同秩次较多时需要校正
uC
u C
26
Biostatistics
u T n1 ( N 1 ) / 2 0.5 n1n2( N 1 ) / 12
40682.5 182( 403 1 ) / 2 0.5
( 182 )( 221 )( 403 1 ) / 12
3.3669
c 1
已知已知总体分布类型总体分布类型对未知参数进行统计推断未知参数进行统计推断依赖于特定分布类依赖于特定分布类型比较的是比较的是参数参数参数检验参数检验parametrictestparametrictest非参数检验非参数检验nonparametrictestnonparametrictest对总体的分布类型对总体的分布类型不作严格要求不作严格要求不受分布类型的影响不受分布类型的影响比比较的是总体分布位置总体分布位置优点
秩和(rank sum) 同组秩次之和。
6
Biostatistics
例1 编秩(page86)
尿白细胞:
A组: - 、、+、+、+、++ B组: +、++、++、++、+++、+++
A:- + + + ++ 1 2 4.35 4.45 45.5 87.5
B:
+ ++ ++ ++ +++ +++
等级资料的秩和检验
Rank Sum Test of Ranked Data
陈涛
Department of Epidemiology & Biostatistics, School of Public Health Nanjing Medical University
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
样品号 分光光度法 极谱法
1 2 3 4 5 6 7 8 9 10 0.52 0.32 0.32 0.33 0.21 0.07 0.03 0.37 0.40 0.18 0.49 0.33 0.34 0.32 0.16 0.16 0.09 0.24 0.67 0.69
非参数检验 (nonparametric test)
对总体的分布类 型不作任何要求
不受总体参数的影响,比较 的是分布或分布位置
适用范围广;可用于任何类型 资料(等级资料,或“>50mg” )
非参数检验的优缺点
⒈ 优点 ①不受总体分布的限制,适用范围广。 ②不受资料类型的限制,可以是计量资料、 等级资料以及一端或两端无确切数据的资料。
③求秩和:T+和T-,任一作为统计量T。 本例T=18.5。
以差值不等于0的数值对子数n=10查附表8, 10-45 0.10 8-47 0.05 5-50 0.02 3-52 0.01
n 10
0.01
0.02
0.05 0.10
3 5 8 10
45
47 50 52
基本思想
假定两种测定方法效应相同,则变量 差值的应服从以0为中心的对称分布,相当 于正或负的秩和应相近,即使有差别,也 只能是随机误差。如果差别太大,超出a检 验水准,就拒绝H0,接受H1。
uc
u c
c 1
ti3 ti (8-4)
n3 n
式中N= n1+ n2 ti 是第i 种相同秩的个数。
基本思想
两个样本(含量分别为n1和n2,且n1≤n2)来自同一总体或 分布相同的两个总体时,即假设检验H0成立时,n1样本的秩 和T与平均秩和n1(N+1)/2相差应该不大,此时u< u ;
2 .缺点 ① 对于符合参数检验条件的资料,如果用非参 数检验,没有充分利用资料提供的信息,检验 效能低于参数检验。
② 非参数检验一般犯第二类错误的概率β比参数 检验大,若要使β相同,非参数检验要比参数检 验需要更多的样本例数。
秩和检验
1. 秩(rank)
将数据从小到大排序,该序号在统计学上称为秩
双向无序R×C表
P100 :表7-5 、表7-7
1. 研究目的为多个率(构成)的比较,可 用行×列资料的卡方检验。
2.研究目的为分析两个分类变量之间有无 关联性,可用行×列资料的卡方检验。
单向有序R×C表
1. 分组变量是有序的,指标变量是无序的。 行×列资料的卡方检验
2.分组变量为无序,指标变量是有序。 P116:表8-5 秩和检验
理因素之间的差别有统计学意义。
例8-6
H0:三种不同饲料对小鼠肝脏中铁的含量 总体中位数相同
H1:三种不同饲料对小鼠肝脏中铁的含量 总体中位数不全相同
=0.05
计算统计量M值
(1) 编秩:先将各配伍组数据由小到大统一编秩,遇相同数值
取平均秩次。再将各处理组的秩次相加,得到各处
理组秩和 Ri。
27(27 1)
9
H统计量近似服从v=k-1的卡方分布,查卡 方界值表,P<0.005,按 a =0.05水准拒绝H0, 接受H1,差别有统计学意义,故可认为三组血 清中可溶性CD8抗原水平总体中位数不相同。
Hc
H c
(8-6)
c 1
ti3 ti
n3 n
随机区组设计的秩和检验
(2)计算
M
值:
M
12
833 1
92 152 242
383 1 14.25
以配伍组数 b=8 和处理组数 k=3 查附表 11, M 0.05,(7,4) =6.25,本例 M=14.25>6.25,
P<0.01。按 =0.05 水准拒绝 H0,接受 H1, 差别有统计学意义,故可以认为三种不同饲 料的小鼠肝脏中铁的含量不全相同。
分布近似法
当处理组数k或配伍组数b超出附表11的范围时,
2 1 2
bk (k 1)
R
2 i
3b ( k
1)
=k–1
思考题:
1. 对同一资料,又出自同一研究目的,用参数检验 和非参数检验所得结果不一致时,宜以何者为准?
2.配对比较两种方法治疗扁平足效果,请问哪种方法好?
11186 88216 1 / 2 0.5
u
3.628
86128216 1
12
823 82 783 78 303 30 263 26
c 1
0.8938
2163 216
uc
3.628 3.837 0.8938
若T与平均秩和n1(N+1)/2相差很大,则会有u≥ u,表示
抽得T如此大、以及比T更大的样本统计量的概率不大于检验 水准,因而拒绝检验假设H0
等级资料两样本比较
例8-3 某医院用复方石苇冲剂治疗老年性慢性支气管炎 患者216例,问该药对两型支气管炎治疗效果是否不同?
H0:两型支气管炎疗效总体分布相同 H1:两型支气管炎疗效总体分布不同 a=0.05
♀ ♂ ♀ ♀ ♀ ♂ ♂ ♀ ♀♂ ♂ ♂ 40 46 48 49 50 57 60 61 62 63 64 69 1 2 3 4 5 6 7 8 9 10 11 12
2.秩和(rank sum) ♀=1+3+4+5+8+9=30 ♂=2+6+7+10+11+12=48
3.秩和检验(rank sum test)
完全随机设计多个样本比较的 秩和检验
Kruskal-Wallis H检验
例8-4
某医院在研究再生障碍性贫血时,测得不同程度再
生障碍性贫血与对照组正常人血清中可溶性CD8抗原水平 (U/ml),问不同程度再生障碍性贫血患者与正常人血清中
可溶性CD8抗原水平是否不同?
H0:三组血清中可溶性CD8抗原水平总体中
常用于检验差值得总体中位数是否等于零。
例8-1 用过硫酸铵分光光度法和示波极谱法测定
水中锰得含量(mg/L),结果见表下表,问:两种 方法的测定结果有无差别?
H0:两种方法测得结果相同,即差值总体 中位数为零
H1:两种方法测得结果不相同,即差值总 体中位数不为零
α=0.05
计算统计量T的步骤为: ①算出各对数值之代数差 ②编秩
双向有序属性相同R×C表
2×2配对设计的扩展,即水平数>2的诊断 试验配伍设计。 如: 两种检测方法同时对同一批样品的测定结果。
Kappa检验
双向有序属性不相R×C表
1.研究目的为分析不同年龄组患者疗效之间有无 差别,视为单向有序行×列表,用秩和检验。 2.研究目的为分析两个有序变量之间是否有关系, 宜选用等级相关,行×列资料的卡方检验。
问题:
配对设计,两种处理效应比较的 秩和检验,当n>50,采用u检验,这时 检验是属于参数检验还是非参数检验, 为什么?
注意事项
1. n差值不为0的对子数 2. 便于记忆,秩次相同的皆取平均秩次 3. “内大外小”
完全随机设计 两样本比较的秩和检验
Wilcoxon秩和检验(Wilcoxon rank sum test)
表1 不同期次矽肺患者肺门密度级别分布
矽肺期次
Ⅰ Ⅱ Ⅲ 合计
肺门密度级别
+
++ +++
43
188
14
1
96
72
6
17
55
50
301
141
合计
245 169
78 492
原始数据两样本的比较
例8-2 某试验观察在缺氧条件下猫和兔的生存时间,试 检验在缺氧条件下猫和兔的生存时间是否有差别?
H0:猫和兔子在缺氧条件下生存时间总体 中位数相同
H1:猫和兔子在缺氧条件下生存时间总体 中位数不同
a=0.05
混合编秩 相等数值取平均秩 取较小样本的秩和记为T, 本例T=127.5 以n1及n2- n1查秩和检验临界值表(附表9)
0.01
0.02
0.05 0.10
3 5 8 10
45
47 50 52
P<0.01,按=0.05水准拒绝H0。 可以认
为猫和兔子在缺氧条件下生存时间不同,猫 的生存时间较兔子长。
正态近似检验,公式为:
u
T
n1N 1/ 2 0.5 n1n2 N 1/12
(8-3)
当相同秩次较多时, 应采用校正公式:
用数据排序的秩来代替原始数据进行 假设检验,这种方法称为秩和检验。
秩(rank) → 秩和(rank sum) →秩和检验(rank sum test)
适宜作秩和检验的资料
不满足参数统计的资料 等级资料 边界不确定的资料
配对设计符号秩检验
配对设计符号秩和检验由Wilcoxon提出,又 称Wilcoxon符号秩和检验(signed rank test) 。
附表9
P414
0.01 0.02 0.05 0.10
51-117 53-115 58-110 62-106
T=127.5
P<0.01
原则:内大外小
n1 8
n1 n2 4
0.01
0.02
0.05 0.10
51 53 58 62
106 110 115 117
n 10
正态性检验Kolmogorov-Smirnov检验P=0.038,该资 料不服从正态分布。