秩和检验
秩和检验【医学统计学】
568.4
14.0
384.6
3.0
556.2
13.0
369.1
1.0
435.7
7.0
377.8
2.0
574.8
15.0
436.7
8.0
468.7
12.0
662.9
19.5
433.4
6.0
582.8
16.5
442.3
10.0
438.1
9.0
426.1
5.0
n1 10
T1 101
n2 12
T2 152
2.求检验统计量T 值
①省略所有差值为0的对子数,观察单位数减去0对子数 的个数 ②按差值的绝对值从小到大编秩,绝对值相等的差值若 符号不同取平均值,并保持原差值的正负号;
③任取正秩和或负秩和为T,本例取T-=3。
3. 确定P 值,作出推断结论
2020/8/8
15
检验步骤
查附表12 • 本例T=3,n=10,
3 9 6 8 7 -1 10 4 -2 5
T 52 T 3
2020/8/8
10
配对符号秩检验基本思想
• 当H0(差值的总体中位数Md=0)成立,任一配对差值出现正号、负号的 机会均等,秩和T-与T+的理论数也应相等为n(n+1)/4
• 可以证明:
• H0为真时,秩统计量T是对称分布 • H0非真时,T呈偏态分布
单纯⑴虚寒型 ⑵3 ⑶6 ⑷25 ⑸26 13 ⑻ 73
喘息虚寒型
1
3 10
9
3 26
虚寒阻塞型 16 28 61 27 ⑹9 141
2020/8/8
21
秩和检验
编号 (1 ) 1 2 3 4 5 6 7 8 9 10 11 12 离子交换法 (2 ) 0.6 3.2 3.4 2.6 0.4 2.0 1.5 3.4 5.8 4.5 3.9 1.9 蒸馏法 (3 ) 0.1 2.1 2.4 3.3 0.4 5.6 2.4 3.6 3.0 5.3 2.7 1.2
3.确定检验统计量T并得出P值,判断结果:
此例n1=80>10,n2=100,n2-n1=20>10,使用正态近似法求Z值,确定P值。 又由于相持较多,计算校正的Zc值,即:
Z
7603 80 180 1 / 2 0.5 80 100 ( 180 1 ) / 12
3 j
(2)正态近似法。大样本 (n>50)
Z
| T μ T | 0.5
σT
| T n (n 1)/4 | 0.5
n (n 1)(2n 1)/24
校正公式:(当相持个数较多时)
Z
| T n(n 1) / 4 | 0.5
3 n(n 1)(2n 1) (t j t j ) 24 48
第八章 秩和检验
中山大学公共卫生学院 医学统计与流行病学系
凌莉 教授 lingli@
一、非参数检验的概念及其应用 二.配对资料的符号秩和检验 (Wilcoxon配对法) 三.完全随机设计两独立样本比较的秩和检验 (Wilcoxon两样本比较法) 四.完全随机设计多组独立样本比较的秩和检验 (Kruskal-Wallis法,即H检验) 五、随机区组设计资料的秩和检验 (M检验)
2. 编秩并求秩和:
(1)求各级别合计数。
秩和检验零值编秩原则
秩和检验零值编秩原则摘要:1.秩和检验概述2.零值编秩原则的定义3.零值编秩原则的应用4.零值编秩原则的优点与局限性正文:一、秩和检验概述秩和检验(Wilcoxon signed-rank test)是一种非参数检验方法,用于检验两个样本之间是否存在显著差异。
该方法由美国统计学家Wilcoxon 于1945 年提出,适用于总体分布不明、分布不对称以及组间方差不齐的情况下进行比较。
二、零值编秩原则的定义零值编秩原则是秩和检验中一种重要的编秩方法,其主要思想是将所有零值替换为最小的非零值,然后再进行排序。
具体操作步骤如下:1.对两个样本的数据进行合并,并按从小到大的顺序进行排序;2.将合并后的数据中所有零值替换为最小的非零值;3.根据替换后的数据,计算各数据点的秩次;4.根据秩次计算检验统计量,进而判断两组样本之间是否存在显著差异。
三、零值编秩原则的应用零值编秩原则在秩和检验中具有广泛的应用,尤其在处理数据中含有大量零值的情况时,可以有效地提高检验效能。
例如,在医学研究中,对两组治疗方法的效果进行比较时,可能会遇到一些患者未出现明显疗效的情况,这时采用零值编秩原则可以更好地分析数据。
四、零值编秩原则的优点与局限性1.优点:(1)适用于各种分布类型的数据;(2)对数据中的零值处理更加合理;(3)能有效提高检验效能,尤其适用于数据中含有大量零值的情况。
2.局限性:(1)零值编秩原则依赖于非零值的分布,当非零值分布严重偏态时,可能影响检验结果的准确性;(2)当样本量较小时,零值编秩原则可能无法充分发挥作用。
在这种情况下,可以考虑使用其他非参数检验方法,如Mann-Whitney U 检验等。
总之,零值编秩原则为秩和检验提供了一种有效的编秩方法,尤其在处理含有大量零值的数据时具有较高的实用价值。
医学统计学 9第九讲 秩和检验
7
2.20 0.05 2.5 2.99 0.84
8
2.12 -0.03 -1 3.19 1.04
9
2.42 0.27
4
3.37 1.22 10
2.52 0.37
5
4.57 2.42 11
1. 建立假设 H0:差值总体中位数为0 H1:差值总体中位数不为0;
α=0.05 2. 计算统计量: T+=62.5,T-=3.5
B组:1
2
4.5 4.5 4.5
+
8.5
++
++
++
+++
+++
6 8 9 10 11 12
4.5 8.5 8.5 8.5 11.5 11.5
秩和
A组: - 、、+、+、+、 ++ 秩和: 1 2 4.5 4.5 4.5 8.5
TA=25
B组: +、++、++、++、+++、+++ 秩和: 4.5 8.5 8.5 8.5 11.5 11.5
(4)将秩次冠以正负号,计算正、负秩和(T+,T-); T++T- =n(n+1)/2
(5)用不为“0”的对子数n及T(取绝对值小的秩和作为统
计量T)查T界值表,得到P值作出判断。
编秩
A组: - 、、+、+、+、++ B组: +、++、++、++、+++、+++
第十一讲 秩和检验
适用范围
1、成组设计的两样本计量数据,不符合 t 检 验的条件(方差相等,且服从正态分布); 2、两组等级资料或两端无确切值的资料。
一、原始数据的两样本比较
基本思想: • 假定:两组样本的总体分布形式相同(即 H0成立),则两样本来自同一总体,且任 一组秩和不应太大或太小 。即T 与平均秩 和 n1(N+1)/2应相差不大。 N = n1+n2
• 前面介绍的检验方法首先假定分析变量 服从特定的已知分布(如正态分布), 然后对分布参数(如均数)作检验。这 类 检 验 方 法 称 参 数 检 验 ( parametric test)。 • 今天介绍的检验方法不对变量的分布作 严格假定,这类检验称非参数检验 (nonparametric test)。
非参数统计
(nonparametric statistics)
对总体的分布类型不 作特殊要求 ,统计 推断时不涉及参数 不受总体参数的影响,比 较的是分布或分布位置
依赖于特定分布类 型,比较的是参数
非参数统计的适用情况
• • • • • 等级资料 偏态分布资料 分布不明资料 个别数据偏离过大的资料 各组方差明显不齐的资料
• 确定P值: 以较小绝对值的秩和为T值。 本例T=3.5 以n=11查附表6(P268,单侧) p<0.005, • 判定结果: 按α=0.05水准,拒绝H0,接受H1,故可以 认为该厂工人尿氟含量高于当地健康人。
第二节 成组设计两样本比较 的秩和检验
Wilcoxon rank sum test
这下面一行(记为Ri)就是上面一行数 据Xi的秩。
秩和检验原理
• 秩和检验(rank sum test):是通过对数 据依小到大排列的秩次,以求秩次之和来 进行假设检验的方法。
秩和检验
12
五、统计结果表达
表2 比较不同剂量的保健食品对小鼠抗疲劳作用的秩和检验
分组
例数 中位数 25百分位数 75百分位数 Z 统计量 P值
中剂量组 10 755.35
681.52
826.31 -2.193 0.028
高剂量组 10 826.81
秩和检验
(Rank Sum Test)
1
秩和检验(rank sum test)
秩和检验是一种非参数检验(non-parametric test)。它不依赖于总体分布的具体形式,应 用时可以不考虑被研究对象为何种分布以及分 布是否已知,因而适用性较强。
秩和检验是总体分布之间而不是参数(参数检 验,如t检验、方差分析)之间的检验。
787.47
880.83
差值
10
27.88
1.15
154.72
结果展示: 根据样本数据分布类型,选择合适的表示方法 正态分布时,用均数和标准差表示(mean±SD) 偏态分布时,用中位数和四分位间距表示
13
两样本比较的秩和检验
例2、在河流监测断面优化研究中,研究者从某河流甲乙两个
断面分别随机抽取10和15个样本,测得其亚硝酸盐氮(mg/L)
4
要求掌握内容 计算机操作
配对比较的秩和检验 两样本比较的秩和检验 多个独立样本比较的秩和检验
结果的表达
5
配对比较的秩和检验
例1、某研究者欲研究保健食品对小鼠抗疲劳作用,将同种属的小鼠按性 别和年龄相同、体重相近配成对子,共10对,并将每对中的两只小鼠随 机分到保健食品两个不同的剂量组,过一定时期将小鼠处死,测得其肝 糖原含量(mg/100g),结果见表1,问不同剂量组的小鼠肝糖原含量有 无差别?
秩和检验
1、建立假设及确定检验水准 H0:差值总体水平为0。 H1:差值总体水平不为0。 α =0.05 2、计算T值 (1)求差:算出每对差值 (2)编秩:按差值绝对值大小从小到大编秩,并冠以 原差值的正负号。 A 若差值为0,可删去不计,不编秩。 B 若差值的绝对值相等,符号相反,则以平均秩 次作为每一个差值的秩次,保留原差值符号。 C 若差值完全相等,则按原秩号,不必平均。 (3)求秩和:将正负秩次分别相加,以秩和绝对值小 则为T。本例T=8。
3、确定值,判断结果。 (1)查表法:当n 50 时
得: T0.05,
若
11
= 10~56,( T0.01,
11
=
5~61)
T+ 或 T- :
落在范围内,则P>0.05; 落在范围外, 则P<0.05; 等于界值, 则P=0.05。
现T=8或58,故 0.01 < P<0.05
基本思想
注意:配对的对子数不能少于6。 本法的基本思想:若H0成立,则样本的正负秩和应较接近于T值的均数n(n+1 )/4,T值不会很小。若正负秩和相差悬殊,则T值特别小,则在H0成立的情况下, 由于抽样误差所至的可能性很小,当P<α 时,拒绝H0。 随着n增大,T的分布逐渐逼近均数为n(n+1)/4,方差为n(n+1)(2n+1) /24的正态分布。N>50时,可用u-T代替秩和检验。
本例 T = 170 查表得: T0.05,
(10,2) (10,2)
= 84~146
T0.01,
所以 P < 0.01
= 79~151
(2)正态近似法:
当超过附表的范围时(n1>10, n2 - n1 >10)
医学统计学等级资料的秩和检验
在某些情况下,可以排除异常值以提高检验的稳定性。但应谨慎处理,确保不会排除对 总体分布有重要影响的值。
稳健统计方法
采用稳健统计方法可以在一定程度上减少异常值对检验结果的影响,如使用中位数、众 数等稳健统计量进行秩和检验。
06
秩和检验的展望
秩和检验的发展趋势
广泛应用
秩和检验作为一种非参数统计方法,在医 学、生物学、环境科学等秩和,判断 两组数据的优劣或差异性,从而 进行假设检验。
适用范围
适用于等级资料和连续变量资料, 尤其适用于小样本和不服从正态 分布的数据。
秩和检验的步骤
01
数据整理
对等级资料进行排序,并赋予相应 的秩。
确定检验统计量
根据秩和计算出检验统计量,如Z值、 H值等。
03
02
计算秩和
在蛋白质组学研究中,秩和检验 用于分析蛋白质表达水平在不同 样本之间的差异。
在其他领域的应用
环境卫生研究
在环境卫生研究中,秩和检验用于评估不同暴露水平对健康的影响。
心理学研究
在心理学研究中,秩和检验用于比较不同干预或实验条件下的心理状态或行为差异。
05
秩和检验的注意事项
样本量的问题
样本量过小
当样本量过小时,无法充分反映总体分布情况,可能导致 检验结果不准确。
等级资料
按照事物的属性特征进行等级划分所得的数据,如 疗效评价中的治愈、显效、好转、无效等。
计量资料
通过度量衡等方法获得的数据,如身高、体重等。
等级资料的特点
有序性
等级资料具有有序性,不同等级之间存在一定的顺序 关系。
差异性
不同等级之间存在差异,同一等级内的数据具有相似 性。
相对性
秩和检验
秩和检验秩和检验方法最早是由维尔克松提出,叫维尔克松两样本检验法。
后来曼—惠特尼将其应用到两不等()的情况,因而又称为曼—惠特尼U检验。
这种方法主要用于比较两个独立样本的差异。
1、假设中的等价问题设有两个连续型总体, 它们的概率密度函数分别为:f1(x),f2(x)(均为未知)已知f1(x) = f2(x?a),a为末知常数,要检验的各假设为:H0:A = 0,H1:a < 0.H0:A = 0,H1:a > 0..设两个总体的均值存在,分别记为μ1,μ2,由于f1,f2最多只差一平移,则有μ2 = μ1?a。
此时, 上述各假设分别等价于:H0:μ1 = μ2,H1:μ1 < μ2H0:μ1 = μ2,H1:μ1 > μ22、秩的定义设X为一总体,将容量为n的样本观察值按自小到大的次序编号排列成x(1)< x(2)< Λ < x(n),称x(i)的足标i为x(i)的秩,i = 1,2,Λ,n。
例如:某施行团人员的行李重量数据如表:重量(kg)3439412833写出重量33的秩。
因为28<33<34<39<41,故33的秩为2。
特殊情况:如果在排列大小时出现了相同大小的观察值, 则其秩的定义为足标的平均值。
例如: 抽得的样本观察值按次序排成0,1,1,1,2,3,3,则3个1的秩均为,两个3的秩均为.3、秩和的定义现设1,2两总体分别抽取容量为n1,n2的样本,且设两样本独立。
这里总假定。
我们将这n1 + n2个观察值放在一起,按自小到大的次序排列,求出每个观察值的秩,然后将属于第1个总体的样本观察值的秩相加,其和记为R1,称为第1样本的秩和,其余观察值的秩的总和记作R2,称为第2样本的秩和。
显然,R1和R2是,且有4、秩和检验法的定义秩和检验是一种非参数检验法, 它是一种用样本秩来代替样本值的检验法。
用秩和检验可以检验两个总体的分布函数是否相等的问题秩和检验的适用范围如果两个样本来自两个独立的但非正态获形态不清的两总体,要检验两样本之间的差异是否显着,不应运用参数检验中的,而需采用秩和检验。
秩和检验graphpad步骤
秩和检验(Wilcoxon秩和检验)1. 什么是秩和检验?秩和检验是一种非参数统计方法,用于比较两个相关样本或配对样本的差异。
它的原假设是两个样本的总体没有差异,而备择假设是两个样本的总体存在差异。
秩和检验是Wilcoxon秩和检验的简称,由Frank Wilcoxon于1945年提出。
秩和检验适用于以下情况: - 样本数据不满足正态分布假设; - 样本数据为顺序数据或等距数据,而非连续数据。
2. 秩和检验的基本原理秩和检验的基本原理是将两个相关样本(或配对样本)的观测值按大小排序,然后计算它们的秩次。
秩次是指将样本数据按从小到大排列后,每个数据所对应的位置。
对于配对样本,先计算每对观测值的差异,然后对差异的绝对值进行排序,得到秩次。
对于相关样本,将两个样本合并后进行排序,然后计算秩次。
计算完秩次后,根据秩次之和与期望秩次之和的差异,判断两个样本的总体是否存在显著差异。
3. 秩和检验的步骤步骤1:建立假设设定原假设(H0)和备择假设(H1)。
原假设通常是两个样本的总体没有差异,备择假设则是两个样本的总体存在差异。
步骤2:计算秩次对于配对样本,计算每对观测值的差异,并对差异的绝对值进行排序,得到秩次。
对于相关样本,将两个样本的观测值合并,并进行排序,得到秩次。
步骤3:计算秩次和计算两个样本的秩次和,即将步骤2中得到的秩次相加。
步骤4:计算期望秩次和根据样本容量,计算期望秩次和,即将1到n的秩次相加,其中n为样本容量。
步骤5:计算秩和统计量计算秩次和与期望秩次和的差异,得到秩和统计量(W)。
步骤6:判断显著性根据秩和统计量(W)和样本容量,查找秩和检验的临界值。
如果秩和统计量大于临界值,则拒绝原假设,认为两个样本的总体存在差异;如果秩和统计量小于等于临界值,则接受原假设,认为两个样本的总体没有差异。
4. 使用GraphPad进行秩和检验的步骤GraphPad是一款常用的统计分析软件,提供了方便的秩和检验功能。
13第四节 秩和检验
二、 配对比较的Wilcoxon符号秩和检验
名词解释: 1. 秩次:指将观察值由小 大按次
序排列后所编的次序号。 2.秩和:用秩次号代替原始数据后,
所得的某些秩次之和。 3. 秩和检验:用统计量秩和进行的
检验。
配对设计的两样本比较(7-37)
一般步骤 1. 建立假设 差值总体中位数为0,即Md=0 差值总体中位数不为零,即Md≠0 α=0.05 2.求差值:d=x-y 或 d=y-x
第四节 秩和检验
一、概述 1.参数检验方法(parametric test): 在总体分布类型已知的前提下对未知总 体参数进行的检验。(如t-test, F- test,u-test) 2.非参数检验方法(nonparametric test):不考虑总体的参数,也不考虑总 体的分布,而对总体的分布或分布位置进 行检验。亦称任意分布检验。
1. 建立检验假设,确定检验水准
H0:总体M1=M2 =M3 H1:总体M1,M2和M3 不全相同;
α=0.05
2.计算检验统计量H 值
(1)编秩:各组混合编秩,有相 同值求平均秩。
(2)计算各组秩和Ti ,确定检验 统计量H 值:
H 12
Ti2 3( N 1)
N (N 1) ni
当相同秩次较多时(尤其等级资料),
相同秩次较多时,校正公式(7.4)
其中 为第j个相同秩次的个数。
两样本比较的秩的检验(例7.39)
1. 建立检验假设,确定检验水准
H0:总体M1=M2,
即两总体分布位置相同;
H1:总体M1≠M2,
即两总体分布位置不同; α=0.05
2.计算检验统计量u 值
(1)编秩:本例为等级资料,先 按组段计算各等级的合计人数,再 确定秩次范围及平均秩次。
秩和检验
2
1
3
2
4
3
5
4
6
5
7
6
8
7
9
8
10
9.5
11
11
12
12.5
13
14
83
步骤:
1、建立假设
H0 :生存日数分布相同 H1 :生存日数分布不相同
指定检验水平,α=0.05
2、选择统计学方法 编秩
分别求两组的秩和 T1=170, T2=83 计算检验统计量 取样本量小的秩和T=170 3、确定概率值 查表(两样本比较的秩和检验)
指定检验水平,α=0.05
2、选择统计学方法
编秩
分别求正负秩和 T+=26.5, T-=18.5 计算检验统计量 取T=18.5
3、确定概率值
由于n<=25,n=9,所以查T界值表双侧(配对 比较的符号秩和检验)0.10为8-37,由于 T=18.5,所以P值>0.10
做出专业结论:离子法和蒸馏法测定值的差别无 统计学意义。
第一节 配对两样本:符号秩和检验
离子交换法
蒸馏法
差
秩次
0.5
0
0.5
2
2.2
1.1
1.1
7
0
0
0
-
2.3
1.3
1
6
6.2
3.4
2.8
8
1
4.6
-3.6
-9
1.8
1.1
0.7
3.5
4.4
4.6
-0.2
-1
2.7
3.4
-0.7
-3.5
1.3
2.1
秩 和 检 验
(2)计算检验统计量 T 1求差值d,见表12.1(4) 2编秩
编秩原则:
依差值的绝对值从小到大编秩。 编秩时遇差值等于零,舍去不计,同时样本例数减1。 遇绝对值相等差值,取平均秩次。若符号相同,既可以 顺次编秩,也可以求平均秩次,并将各 秩次冠以原差值 的正负号。
3求秩和并确定检验统计量:分别求出正 负秩之和,任取正或负秩和作为统计量。 本例T=21.5或23.5。
切数据的资料
• 计算简便
缺点
• 对于符合参数检验条件的资料其检验效能较低,
因而,对这类资料应首选参数检验
秩及秩和的概念
秩(假设按年龄大小) f m f f f m m f f m m m 15 18 25 26 29 31 32 37 41 48 51 55 1 2 3 4 5 6 7 8 9 10 11 12 秩:对数据从小到大排序,顺序号即为秩
查附表 2(t 界值表, 时)得单侧P 0.0005 , 按 0.05 水准拒绝H 0 ,接受H1 ,可认为吸烟工人的 HbCO(%)含量高于不吸烟工人的 HbCO(%)含量。
完全随机设计多个样本比较的 Kruskal-Wallis H 检验
一、多个独立样本比较的 Kruskal-Wallis H 检验
Kruskal-Wallis H 检验,用于推断计量资料 或等级资料的多个独立样本所来自的多个总体 分布是否有差别。在理论上检验假设 H 0 应为多 个总体分布相同,即多个样本来自同一总体。由 于 H 检验对多个总体分布的形状差别不敏感, 故
在实际应用中检验假设 H 0 可写作多个总体分布 位置相同。 对立的备择假设 H1 为多个总体分布位 置不全相同。
表8-10 小白鼠接种三种不同菌型伤寒杆菌的存活日数比较
第四节 秩和检验
秩 次
秩 和 产 足 产过 产 早 月 期 (8) 2595 12366 23374 38335 (9) 11418 100302 312156 423876 (10) 865 4809 25636 31310
家兔皮肤损伤程度(评分) 家兔皮肤损伤程度(评分) 秩次 家兔号 A照射 B照射 A-B 1 39 55 16 10 2 3 4 5 6 7 8 9 10 11 12 合计 42 51 43 55 45 22 48 40 45 40 49 54 55 47 53 63 52 44 48 55 32 57 12 4 4 -2 18 30 -4 8 10 -8 8 9 3 3 -1 11 12 -3 6 8 -6 6 R=10(68) R=10(68)
3 i
=
10 −12(12 −1)/ 4 12(12 +1)(2×12 +1)/ 24 −[(33 −3) + (33 −3)]/ 48
三
完全随机设计多组差别的秩和检验 (Kruskal-Wallis法) 法
19:46
对于完全随机设计多组资料比较, 对于完全随机设计多组资料比较,如果 不满足正态分布或方差分析的条件, 不满足正态分布或方差分析的条件,可采用 Kruskal-Wallis秩和检验。 Kruskal-Wallis秩和检验。 秩和检验 此法的基本思想与Wilcoxon-Mann此法的基本思想与Wilcoxon-MannWilcoxon Whitney法相近:如果各组处理效应相同, Whitney法相近:如果各组处理效应相同, 法相近 混合编秩号后,各组的秩和应近似相等。 混合编秩号后,各组的秩和应近似相等。
秩和检验
第四节
多个相关样本检验
用某新药治疗血吸虫病患者,采用三天 疗法,在治疗前后测定7名患者的血清谷 丙转氨酶和变化,以观察该药对肝功能 和影响,结果见表,问四人阶段和SGPT 有无差别?
某新药治疗血吸虫病SGPT(单位)和变化 患者号 1 2 3 4 5 6 7 治疗前 63 90 54 45 54 72 64
a ,b
Chi-Square df Asymp. Sig.
SO2 13.412 3 .004
a. Kruskal Wallis Test b. Grouping Variable: 功能区
B.等级资料
例 问三种病人肺切除术的针麻效果 有无差别?
三种病人肺切除术的针麻效果比较
针麻效果 I II III IV
甲法 & 乙法 乙法 甲法 0 1 0 31 110 1 8 261
SPSS结果与分析:
McNemar Test 2. Test Statistics
T es t St a t is t ic s
b
N Chi-Square Asymp. Sig.
a
甲法 & 乙法 410 86.449 .000
a. Continuity Corrected b. McNemar Test
第二节
两独立样本的检验
A.数值变量资料
例 某实验室观察局部温热治疗移植肿 瘤的疗效,以生存日数作为观察指标, 实验结果见下表,试检验两小鼠生存日 数有无差别?
两组小鼠发癌后生存日数
组别
生存日数
N
实验组 10 12 15 15 16 17 18 20 23 90
10
对照组
秩和检验(SPSS)分析
其他相关信息
此外,还会提供其他相关信 息,如可信区间、P值等, 帮助用户更全面地理解检验 结果。
03
秩和检验的优缺点
秩和检验的优点
无假设限制
秩和检验不需要严格的假设条件,如正态分布、方差 齐性等,因此应用范围较广。
适用于小样本
在样本量较小的情况下,秩和检验能够提供较为准确 的结果。
避免数据异常值影响
应用价值。
未来研究可以进一步探讨秩和 检验与其他统计方法的结合使 用,以更好地满足研究需求。
在实际应用中,研究者应充分 了解秩和检验的适用范围和限 制条件,根据具体情况选择合 适的统计方法。
随着大数据时代的到来,秩和 检验在处理大规模数据方面的 应用将更加广泛,有助于推动 各领域研究的深入发展。
THANKS
运行检验
点击“运行”按钮,SPSS将自动进 行秩和检验,并输出检验结果。
SPSS中秩和检验的结果解读
描述性统计结果
检验统计量
在检验结果中,首先会给出 各个组别的描述性统计结果, 包括各组的频数、百分比、 中位数等。
接着会给出检验的统计量, 包括秩次、秩次之和、平均 秩次等。
检验结论
根据统计量的大小和分布情 况,SPSS会给出检验结论, 判断各组之间是否存在显著 差异。
04
秩和检验的案例分析
案例一:配对设计资料的秩和检验
总结词
配对设计资料的秩和检验适用于对同一观察对象在不同条件下进行观察或测量的情况,例如同一批受 试者在不同时间点的观察值。
详细描述
配对设计资料的秩和检验首先需要对配对数据进行分析,确定配对数据是否具有相关性,然后采用适 当的统计方法进行检验。在SPSS中,可以使用Wilcoxon匹配对符号秩检验或Wilcoxon符号秩检验等 方法进行配对设计资料的秩和检验。
医学统计学之秩和检验
医学统计学之秩和检验什么是秩和检验?秩和检验(Wilcoxon rank-sum test),又称为Mann-Whitney U检验,是非参数假设检验的一种常用方法,用于比较两个独立样本的位置差异。
这个方法基于样本的秩次,而不依赖于数据的具体分布。
秩和检验的适用场景秩和检验通常用于以下情况:1.样本数据不满足正态分布假设;2.无法满足方差齐性假设;3.样本容量较小。
秩和检验是一种非常灵活的方法,适用于大部分类型的数据分布,甚至可以包括极端的离群值。
秩和检验的原理秩和检验的原理是将两个样本的观察值合并后,按照大小重新排列,并赋予秩次。
然后利用秩次之和来比较两个样本的位置差异。
1.对于两个独立样本,将两组数据合并为一个整体的样本。
2.对于每个观察值,分别计算出在整体样本中的秩次。
3.计算两组样本的秩和,比较其大小。
4.根据秩和的大小以及样本容量,查表或计算检验统计量的p-value。
秩和检验的步骤秩和检验的具体步骤如下:1.将两个样本合并为一个整体样本,并标记属于哪个样本。
2.对整体样本中的观察值进行排序,得到秩次。
3.计算秩和,并比较两个样本的秩和大小。
4.根据秩和大小以及样本容量,查找临界值。
5.根据临界值判断是否拒绝原假设,或者计算统计量的p-value。
6.根据p-value判断是否拒绝原假设。
秩和检验的示例假设我们有两个医学治疗方法A和B,想要比较其对病人治疗效果的差异。
我们随机选择了两组病人,分别给予方法A和B进行治疗,然后观察他们的疗效。
以下是我们观察到的结果:组A:8, 10, 12, 10, 14 组B:9, 11, 14, 12, 13我们可以按照秩次将两组数据合并,并计算秩和:组A:8(1), 10(3), 12(4), 10(3), 14(5) 组B:9(2), 11(4), 14(5), 12(4), 13(2)组A的秩和为16,组B的秩和为17。
然后,我们根据秩和的大小以及样本容量,在秩和表中查找临界值。
第十二章 秩和检验
第十二章秩和检验假设检验通常可划分为参数检验(parametric test)和非参数检验(nonparametri c test)两大类。
以特定的总体分布为前提,对未知的总体参数作推断的假设检验方法统称为参数检验。
前面章节介绍的t检验和方差分析均要求样本来自正态总体,属于参数检验。
非参数检验不以特定的总体分布为前提,也不对总体参数作推断,故也称为任意分布检验(distribution-free test)。
非参数检验具有广泛的适用性。
由于总体不必服从特定分布,无论资料总体分布形式如何,一端或两端无界,甚至分布未知,都能适用。
在非参数检验中,一般不直接用样本观察值做分析,统计量的计算是基于原始数据在整个样本中按大小所占的位次。
由于非参数检验没有利用观察值的具体数值,而只利用了其大小次序的信息,信息利用不够充分,故凡适合参数检验的资料,应首选参数检验。
但当总体分布不明确时,则应采用非参数检验。
尤其对于那些难以确定分布又出现少量离群值的小样本数据,非参数检验在剔除这些数据前后所得结论显示出了较好的稳健性。
非参数检验方法很多,有秩和检验(rank sum test)、符号检验、游程检验、等级相关分析等。
本章介绍在非参数检验中占有重要地位且检验功效相对较高的秩和检验。
第一节Wilcoxon符号秩和检验1945年Wilcoxon提出的Wilcoxon符号秩和检验(Wilcoxon singned-rank tes t),亦称符号秩和检验,可用于配对设计计量差值的比较,还可用于单一样本与总体中位数的比较。
一、配对设计的两样本比较(一) 本法的基本思想与步骤配对设计资料主要是对差值进行分析。
通过检验配对样本的差值是否来自中位数为0的总体,来推断两个总体中位数有无差别,即推断两种处理的效应是否不同。
现以例12.1说明其基本思想与步骤。
例12.1 某研究用甲、乙两种方法对某地方性砷中毒地区水源中砷含量(mg/L)进行测定,检测10处,测量值如表12.1的(2)、(3)栏。
统计学秩和检验
案例展示:医学研究中应用秩和检验
案例一
某医学研究比较了两种不同治疗方法对患者疼痛程度的影响。由于疼痛程度为等级资料,且样本量较小,研究者 选择了Wilcoxon符号秩和检验进行分析。结果显示,两种治疗方法的疼痛程度存在统计学差异(P<0.05),表 明其中一种治疗方法在减轻患者疼痛方面更有效。
案例二
THANKS
感谢观看
适用于连续型数据,且两个样本相互独立的情况 。
多重比较与Kruskal-Wallis H检验
目的
用于比较多个独立样本所来自的总体的分布是否存在显著差异。
方法
将多个样本数据混合后按大小排序,计算每个样本的秩和,通过比较各组秩和的差异判 断多个总体分布是否存在显著差异。如果存在差异,可进一步进行两两比较。
基于模型的秩和检验
基于模型的秩和检验方法结合了参数模型和非参数检验的优点,通过建立适当的统计模型来描述数据 的分布规律,并利用模型参数进行假设检验,从而提高了检验的灵活性和准确性。
前沿动态及未来发展趋势
基于大数据的秩和检验
随着大数据时代的到来,基于大数据的秩和检验方法将具有更广阔的应用前景。这些方法 可以利用大规模数据集提供的丰富信息,通过挖掘数据间的关联性和规律性,进一步提高 秩和检验的效能和准确性。
• · 适用范围:秩和检验适用于等级资料、不满足参数检验前提的计量资料以及某些特殊情况下 的计数资料。例如,在临床医学中,常常用于评价两种治疗方法对患者生存时间的影响是否 存在差异;在生物学中,可用于比较不同基因型对某种表型的影响等。
适用范围及优缺点
优点:秩和检验的优点包 括
对异常值和离群点相对不 敏感;
03
适用范围
适用于连续型数据,且样本量较小的 情况。
秩和检验
例1:新配方是否有助于防晒黑
某防晒美容霜制造者,欲了解一种新配方是否有助于防晒 黑,对7个志愿者进行了试验。在每人背部一侧涂原配方美 容霜,另一侧为新配方,在太阳下暴晒后,按预先给定的 标准测定晒黑程度如下表,
编号 1 2 3 4 原配方 新配方 42 38 51 53 31 36 61 52 编号 5 6 7 原配方 新配方 44 33 55 49 48 36
(三)非参数检验的适用范围
1 半定量的资料,如等级资料 2 偏态分布资料 3 有outliner值,如偏大值或偏小值 4 二端或一端无确定值 5 方差不齐 6 分布不明确时
(四)非参数检验的缺点
1 检验效率低, 为参数检验的95% 2 β大,二类错误的概率大
(五)非参数检验的类型
二、配对设计差值的符号秩和检验
(Wilcoxon’s signal rank test)
(3)根据差值的绝对值大小编秩; (4)将秩次冠以正负号,计算正、负 秩和;
表9.1 两种方法测定车间空气中CS2含量(mg/m3)
样品号 化学法 (1) (2) 1 2 3 4 5 6 7 8 9 10 50.7 3.3 28.8 46.2 1.2 25.5 2.9 5.4 3.8 1.0 色谱法 (3) 60.0 3.3 30.0 43.2 2.2 27.5 5.1 5.0 3.2 4.0 差值 (4) -9.3 0 -1.2 3.0 -1.0 -2.0 -2.2 0.4 0.6 -3.0 秩次 (5) -9 _ -4 7.5 -3 -5 -6 1 2 -7.5
个排序,最大值为两组变量个数之和10。依次可 得1,2,3.5,3.5,5,6,7,8,9,10。这10 个序号即是秩 次。A组秩和就是等于3.5+5+8+9+10=39.5,B组 秩和就是等于1+2+3.5+6+7=19.5。从两组的原始
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
两样本比较的秩和检验 (Wilcoxon两样本比较法)
一般步两总体分布相同 – H1:两总体分布不同 – α=0.05
2.编秩次
– 两样本观察值从小到大混合编秩,不同组时相同观 察值取平均秩次
3.求秩和
– 求两组的秩和,以样本量小的一组的秩和作为统计 量T。
3. 求各组秩和Ri Ri = 各组秩次相加 4. 计算统计量 H 值
R 12 H 3N 1 N N 1 ni
2 i
ni为各组观察值个数,
N ni
5. 确定P值,作出推论
(H近似服从ν= k-1的χ2分布) 按ν=k-1查χ2界值表
T u nn 1 0.5 4
2323 12 23 1 103 10 7 3 7 63 6 24 48 1.44
u=1.44<1.96, P>0.05,差别无统计学意义
3 nn 12n 1 t j t j 24 48 2323 1 91 0.5 4
当相同秩次较多时,采用校正公式:
u
nn 1 T 0.5 4 nn 12n 1 t t j 24 48
3 j
式中,tj:第j(j=1,2,···)个相同 差值的个数,假定差值中有2个4,5个6, 3个7,则t1=2,t2=5,t3=3
t
j
3 j
t j 表示相同秩次的个数
多组资料的比较
H 检验(Kruskal-Wallis法)是
用于完全随机设计的多个样本 比较的非参数法
1.建立假设 H0:各抽样总体分布相同 H1:各抽样总体分布不同或不全 相同 α=0.05
2.编秩 将各组数据由小到大排列, 再将各组数据由小到大统一 编秩,不同组的相同数据取 其平均秩次,相同数据在同 一组内,则不必取平均秩次
4.查表或根据公式计算U值确定p值, 。
正态近似法
如果n1或n2-n1超出T界值表的 范围,按下式计算u值:
u
T n1 N 1 / 2 0.5 n1n2 N 1 / 12
相同秩次出现,使u值偏小,故在相同秩 次较多(如超过25%)时,应进行校正。
uc T n1 N 1 / 2 0.5 n1n2 3 3 (N N t j t j ) 12 N ( N 1)
例9.2
变化对应的分数 +3 +2 +1 人数 4 5 6
0
-1 -2 -3
5
4 2 2
1.建立假设检验
–H0:差值的总体中位数M=0 –H1:差值的总体中位数M≠0 –α=0.05
2.计算统计量
频数 4 2 2 + 6 5 4 合计 10 7 6 秩次范 围 1-10 11-17 18-23 平均 秩次 5.5 14 20.5 负秩 和 22 28 41 正秩和 23 70 82
4.查表,确定p值,或根据公式计算U值。
若检验统计量T值在上、下界值范围内, 其P值大于表上方相应概率水平;若T值 在上、下界值上或范围外,则P值等于或 小于相应的概率水平
正态近似法: 对子数n > 25,按下式计算u值
u
T nn 1 / 4 0.5
nn 12n 1 / 24
tj
3
2 2 5 5 3 3 150
3 3
例9.1
病人号 白斑部位 正常部位 d 秩次
1
2 3
40.03
97.13 80.32
88.57
88.00 123.72
48.54
-17.13 43.40
4
5 6 7 8 合计
25.32
19.61 14.50 49.63 44.56
39.03
24.37 92.75 121.57 89.76
13.71
4.76 78.25 71.94 45.20
1.建立假设
–H0:差值的总体中位数M=0 –H1:差值的总体中位数M≠0 –α=0.05
2.计算统计量T值
–T=T-=3
3.查表及下结论
–当n=8时,T0.05(8)=3-33,p≤0.05,按 照α=0.05的水准,拒绝H0,接受H1,认为白 斑部位与正常部位的白介素有差异
非参数检验方法 (nonparametric test) 秩和检验
目的和要求
掌握 配对设计的符号秩和检验、成组设 计(或者等级资料)两样本的秩和检验。 熟悉 成组设计多个样本比较的秩和检验。 了解 随机区组设计资料的秩和检验。
适用资料
1.总体分布为偏态或分布形式未知 2.等级资料 3.个别数据偏大或数据的某一端无确定的 数值 4.各总体方差不齐
非参数检验优点:不受总体分布的限 定,适用范围广 非参数检验缺点:符合作参数检验的 资料(如两样本均数比较的t检验), 如用非参数检验,检验效率低于参 数检验。一般犯第二类错误的概率 β比参数检验大
配对资料的符号秩和检验 (wilcoxon signed rank test)
一般步骤
d 1 2 3 合计
T-=91 T+=185
3.查表与结论
–N=28-5(差值为0)=23, T0.05(23)=73-203, T=T-=91,在73-203范围内,故P>0.05,差 别无统计学意义,按照α=0.05的水准,不拒 绝HO,不能认为该项指导对口腔卫生习惯的 改变有作用。
近似正态法
1.求各对数据地差值 2.建立假设
–H0:差值的总体中位数M=0 –H1:差值的总体中位数M≠0 –α=0.05
3.编秩次,计算统计量
≠
–按照绝对值的大小编秩,按照差值的正负标上正负 号 –符号不等时,如绝对值相等,取平均秩次。 –若差值为0,则舍去不计,总对子数有要相应减去 –求正负秩次之和,T+ 和T-,以绝对值小的作为统 计量T