第八章 统计秩和检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 i
(8-5)
12 49.52 149.52 1792 H ( ) 3(27 1) 16.250 27(27 1) 9
H统计量近似服从v=k-1的卡方分布,查卡
方界值表,P<0.005,按 a =0.05水准拒绝H0, 接受H1,差别有统计学意义,故可认为三组血 清中可溶性CD8抗原水平总体中位数不相同。
宜选用等级相关,行×列资料的卡方检验。
表1 不同期次矽肺患者肺门密度级别分布
肺门密度级别 矽肺期次 + ++ +++ 合计
Ⅰ Ⅱ Ⅲ 合计
43 1 6 50
188 96 17 301
14 72 55 141
245 169 78 492
表1 甲、乙两法治疗扁平足的效果
病例号 甲法 1 好 2 好 3 好 4 好 5 差 6 中 7 好 8 好 9 中 10 差 11 好 12 差 13 好 14 中 15 好 16 中
乙法
差
好
差
中
中
差
中
差
中
差
好
差
中
差
中
差
R×C表的分类
1. 双向无序 2. 单向有序 3. 双向有序属性相同 4. 双向有序属性不同
P<0.01,按=0.05水准拒绝H0。 可以认
为猫和兔子在缺氧条件下生存时间不同,猫
的生存时间较兔子长。
正态近似检验,公式为:
u T n1 N 1 / 2 0.5 n1n2 N 1 / 12
(8-3)
当相同秩次较多时, 应采用校正公式:
u uc c
c 1
பைடு நூலகம்
ti3 ti n n
其中 b 为区组数,k 为处理组数。
4.查附表 11,当 M≥ M ,( b ,k ) 时,P≤ ,即各处 理因素之间的差别有统计学意义。
例8-6
H0:三种不同饲料对小鼠肝脏中铁的含量 总体中位数相同 H1:三种不同饲料对小鼠肝脏中铁的含量 总体中位数不全相同
=0.05
计算统计量M值
注意事项
1. n差值不为0的对子数 2. 便于记忆,秩次相同的皆取平均秩次 3. “内大外小”
完全随机设计 两样本比较的秩和检验
Wilcoxon秩和检验(Wilcoxon rank sum test)
原始数据两样本的比较
例8-2 某试验观察在缺氧条件下猫和兔的生存时间,试
检验在缺氧条件下猫和兔的生存时间是否有差别?
(1) 编秩:先将各配伍组数据由小到大统一编秩,遇相同数值 取平均秩次。再将各处理组的秩次相加,得到各处 理组秩和 Ri。 (2)计算 M 值: M
12 92 152 242 3 8 3 1 14.25 8 3 3 1
以配伍组数 b=8 和处理组数 k=3 查附表 11, M 0.05,( 7 , 4 ) =6.25,本例 M=14.25>6.25, P<0.01。按 =0.05 水准拒绝 H0,接受 H1, 差别有统计学意义,故可以认为三种不同饲 料的小鼠肝脏中铁的含量不全相同。
抽得T如此大、以及比T更大的样本统计量的概率不大于检验
水准,因而拒绝检验假设H0
等级资料两样本比较
例8-3 某医院用复方石苇冲剂治疗老年性慢性支气管炎
患者216例,问该药对两型支气管炎治疗效果是否不同?
H0:两型支气管炎疗效总体分布相同 H1:两型支气管炎疗效总体分布不同 a=0.05
u
11186 88 216 1 / 2 0.5 86 128 216 1 12
注意事项
1. 以样本例数小者的秩和为统计量
2. 用正态近似法,仍是非参数法
问题:
1.例8-3能否用卡方检验,秩和检验的优点?
2.例8-3秩次从“无效” 检验结果是否会发生变化?
“控制”编,
完全随机设计多个样本比较的 秩和检验
Kruskal-Wallis H检验
例8-4
某医院在研究再生障碍性贫血时,测得不同程度再 生障碍性贫血与对照组正常人血清中可溶性CD8抗原水平
①算出各对数值之代数差
②编秩
③求秩和:T+和T-,任一作为统计量T。
本例T=18.5。 以差值不等于0的数值对子数n=10查附表8,
10-45
8-47
0.10
0.05
5-50
3-52
0.02
0.01
n 10
0.01 0.02 0.05 0.10 3 5 8 10 45 47 50 52
基本思想
51-117 53-115 58-110 62-106
T=127.5
P<0.01
原则:内大外小
n1 8
n1 n2 4
0.01 0.02 0.05 0.10
51
53
58
62
106
110
115 117
n 10
0.01 0.02 0.05 0.10 3 5 8 10 45 47 50 52
u
T nn 1 / 4 0.5
nn 12n 1 / 24
(8-1)
校正公式:
u
T nn 1 / 4 0.5 n(n 1)( 2n 1) / 24 (t i3 t i ) / 48
(8-2)
问题:
配对设计,两种处理效应比较的 秩和检验,当n>50,采用u检验,这时 检验是属于参数检验还是非参数检验, 为什么?
3
3.628
82 c 1
82 783 78 303 30 263 26 216 216
3
0.8938
3.628 uc 3.837 0.8938
查附表1,P<0.001,按=0.05水准拒绝 H0。可认为复方石苇冲剂治疗两型支气管炎 的疗效不同,对单纯型疗效好。
常用于检验差值得总体中位数是否等于零。
例8-1 用过硫酸铵分光光度法和示波极谱法测定 水中锰得含量(mg/L),结果见表下表,问:两种 方法的测定结果有无差别? H0:两种方法测得结果相同,即差值总体 中位数为零
H1:两种方法测得结果不相同,即差值总 体中位数不为零 α=0.05
计算统计量T的步骤为:
双向有序属性相同R×C表
2×2配对设计的扩展,即水平数>2的诊断 试验配伍设计。 如: 两种检测方法同时对同一批样品的测定结果。 Kappa检验
双向有序属性不相R×C表
1.研究目的为分析不同年龄组患者疗效之间有无 差别,视为单向有序行×列表,用秩和检验。 2.研究目的为分析两个有序变量之间是否有关系,
双向无序R×C表
P100 :表7-5 、表7-7
1. 研究目的为多个率(构成)的比较,可
用行×列资料的卡方检验。
2.研究目的为分析两个分类变量之间有无 关联性,可用行×列资料的卡方检验。
单向有序R×C表
1. 分组变量是有序的,指标变量是无序的。 行×列资料的卡方检验 2.分组变量为无序,指标变量是有序。 P116:表8-5 秩和检验
(U/ml),问不同程度再生障碍性贫血患者与正常人血清中
可溶性CD8抗原水平是否不同?
H0:三组血清中可溶性CD8抗原水平总体中
位数相同
H1:三组血清中可溶性CD8抗原水平总体中
位数不相同
α=0.05
计算统计量H:
混合编秩,相同数值,取平均秩,算 得各组的秩和R
R 12 H 3( N 1) N ( N 1) ni
假定两种测定方法效应相同,则变量
差值的应服从以0为中心的对称分布,相当 于正或负的秩和应相近,即使有差别,也 只能是随机误差。如果差别太大,超出a检 验水准,就拒绝H0,接受H1。
P>0.10, 按=0.05水准不拒绝H0, 差别无统计学意义。尚不能认为两种方 法测定水中锰的含量有差别。
正态近似:
H0:猫和兔子在缺氧条件下生存时间总体 中位数相同 H1:猫和兔子在缺氧条件下生存时间总体 中位数不同 a=0.05
混合编秩 相等数值取平均秩 取较小样本的秩和记为T, 本例T=127.5 以n1及n2- n1查秩和检验临界值表(附表9)
附表9
P414
0.01 0.02 0.05 0.10
对总体的分布类 型不作任何要求
不受总体参数的影响,比较 的是分布或分布位置 适用范围广;可用于任何类型 资料(等级资料,或“>50mg” )
依赖于特定分布类 型,比较的是参数
非参数检验的优缺点
⒈ 优点
①不受总体分布的限制,适用范围广。 ②不受资料类型的限制,可以是计量资料、 等级资料以及一端或两端无确切数据的资料。
H Hc c
(8-6)
t c 1
3
3 i
ti
n n
随机区组设计的秩和检验
Friedman M检验
M检验(Friedman法)查表法
1.每个区组的数据由小到大分别编秩,相同数 据取平均秩次。 2.计算各处理组的秩和 Ri。
12 Ri2 3b k 1 3.计算 M 值: M bk k 1
正态性检验Kolmogorov-Smirnov检验P=0.038,该资 料不服从正态分布。
参数检验和非参数检验
(parametric test and nonparametric test )
概念
参数检验 (parametric test) 已知总体分布类型,对 未知参数进行统计推断 非参数检验 (nonparametric test)
3.秩和检验(rank sum test)
用数据排序的秩来代替原始数据进行 假设检验,这种方法称为秩和检验。
秩(rank) → 秩和(rank sum) →秩和检验(rank sum test)
适宜作秩和检验的资料
不满足参数统计的资料 等级资料 边界不确定的资料
配对设计符号秩检验
配对设计符号秩和检验由Wilcoxon提出,又 称Wilcoxon符号秩和检验(signed rank test) 。
2 .缺点
① 对于符合参数检验条件的资料,如果用非参
数检验,没有充分利用资料提供的信息,检验 效能低于参数检验。 ② 非参数检验一般犯第二类错误的概率β比参数 检验大,若要使β相同,非参数检验要比参数检
验需要更多的样本例数。
秩和检验
1. 秩(rank) 将数据从小到大排序,该序号在统计学上称为秩 ♀ ♂ ♀ ♀ ♀ ♂ ♂ ♀ ♀ ♂ ♂ ♂ 40 46 48 49 50 57 60 61 62 63 64 69 1 2 3 4 5 6 7 8 9 10 11 12 2.秩和(rank sum) ♀=1+3+4+5+8+9=30 ♂=2+6+7+10+11+12=48
分布近似法
当处理组数k或配伍组数b超出附表11的范围时,
2
12 b k ( k 1)
R 3 b ( k 1)
2 i
=k–1
思考题:
1. 对同一资料,又出自同一研究目的,用参数检验 和非参数检验所得结果不一致时,宜以何者为准?
2.配对比较两种方法治疗扁平足效果,请问哪种方法好?
3
(8-4)
式中N= n1+ n2 ti 是第i 种相同秩的个数。
基本思想
两个样本(含量分别为n1和n2,且n1≤n2)来自同一总体或 分布相同的两个总体时,即假设检验H0成立时,n1样本的秩
和T与平均秩和n1(N+1)/2相差应该不大,此时u< u ;
若T与平均秩和n1(N+1)/2相差很大,则会有u≥ u ,表示
例8-1 用过硫酸铵分光光度法和示波极谱法测定 水中锰得含量(mg/L),结果见表下表,问:两种 方法的测定结果有无差别?
样品号 分光光度法 极谱法 1 2 3 4 5 6 7 8 9 10
0.52 0.32 0.32 0.33 0.21 0.07 0.03 0.37 0.40 0.18 0.49 0.33 0.34 0.32 0.16 0.16 0.09 0.24 0.67 0.69
(8-5)
12 49.52 149.52 1792 H ( ) 3(27 1) 16.250 27(27 1) 9
H统计量近似服从v=k-1的卡方分布,查卡
方界值表,P<0.005,按 a =0.05水准拒绝H0, 接受H1,差别有统计学意义,故可认为三组血 清中可溶性CD8抗原水平总体中位数不相同。
宜选用等级相关,行×列资料的卡方检验。
表1 不同期次矽肺患者肺门密度级别分布
肺门密度级别 矽肺期次 + ++ +++ 合计
Ⅰ Ⅱ Ⅲ 合计
43 1 6 50
188 96 17 301
14 72 55 141
245 169 78 492
表1 甲、乙两法治疗扁平足的效果
病例号 甲法 1 好 2 好 3 好 4 好 5 差 6 中 7 好 8 好 9 中 10 差 11 好 12 差 13 好 14 中 15 好 16 中
乙法
差
好
差
中
中
差
中
差
中
差
好
差
中
差
中
差
R×C表的分类
1. 双向无序 2. 单向有序 3. 双向有序属性相同 4. 双向有序属性不同
P<0.01,按=0.05水准拒绝H0。 可以认
为猫和兔子在缺氧条件下生存时间不同,猫
的生存时间较兔子长。
正态近似检验,公式为:
u T n1 N 1 / 2 0.5 n1n2 N 1 / 12
(8-3)
当相同秩次较多时, 应采用校正公式:
u uc c
c 1
பைடு நூலகம்
ti3 ti n n
其中 b 为区组数,k 为处理组数。
4.查附表 11,当 M≥ M ,( b ,k ) 时,P≤ ,即各处 理因素之间的差别有统计学意义。
例8-6
H0:三种不同饲料对小鼠肝脏中铁的含量 总体中位数相同 H1:三种不同饲料对小鼠肝脏中铁的含量 总体中位数不全相同
=0.05
计算统计量M值
注意事项
1. n差值不为0的对子数 2. 便于记忆,秩次相同的皆取平均秩次 3. “内大外小”
完全随机设计 两样本比较的秩和检验
Wilcoxon秩和检验(Wilcoxon rank sum test)
原始数据两样本的比较
例8-2 某试验观察在缺氧条件下猫和兔的生存时间,试
检验在缺氧条件下猫和兔的生存时间是否有差别?
(1) 编秩:先将各配伍组数据由小到大统一编秩,遇相同数值 取平均秩次。再将各处理组的秩次相加,得到各处 理组秩和 Ri。 (2)计算 M 值: M
12 92 152 242 3 8 3 1 14.25 8 3 3 1
以配伍组数 b=8 和处理组数 k=3 查附表 11, M 0.05,( 7 , 4 ) =6.25,本例 M=14.25>6.25, P<0.01。按 =0.05 水准拒绝 H0,接受 H1, 差别有统计学意义,故可以认为三种不同饲 料的小鼠肝脏中铁的含量不全相同。
抽得T如此大、以及比T更大的样本统计量的概率不大于检验
水准,因而拒绝检验假设H0
等级资料两样本比较
例8-3 某医院用复方石苇冲剂治疗老年性慢性支气管炎
患者216例,问该药对两型支气管炎治疗效果是否不同?
H0:两型支气管炎疗效总体分布相同 H1:两型支气管炎疗效总体分布不同 a=0.05
u
11186 88 216 1 / 2 0.5 86 128 216 1 12
注意事项
1. 以样本例数小者的秩和为统计量
2. 用正态近似法,仍是非参数法
问题:
1.例8-3能否用卡方检验,秩和检验的优点?
2.例8-3秩次从“无效” 检验结果是否会发生变化?
“控制”编,
完全随机设计多个样本比较的 秩和检验
Kruskal-Wallis H检验
例8-4
某医院在研究再生障碍性贫血时,测得不同程度再 生障碍性贫血与对照组正常人血清中可溶性CD8抗原水平
①算出各对数值之代数差
②编秩
③求秩和:T+和T-,任一作为统计量T。
本例T=18.5。 以差值不等于0的数值对子数n=10查附表8,
10-45
8-47
0.10
0.05
5-50
3-52
0.02
0.01
n 10
0.01 0.02 0.05 0.10 3 5 8 10 45 47 50 52
基本思想
51-117 53-115 58-110 62-106
T=127.5
P<0.01
原则:内大外小
n1 8
n1 n2 4
0.01 0.02 0.05 0.10
51
53
58
62
106
110
115 117
n 10
0.01 0.02 0.05 0.10 3 5 8 10 45 47 50 52
u
T nn 1 / 4 0.5
nn 12n 1 / 24
(8-1)
校正公式:
u
T nn 1 / 4 0.5 n(n 1)( 2n 1) / 24 (t i3 t i ) / 48
(8-2)
问题:
配对设计,两种处理效应比较的 秩和检验,当n>50,采用u检验,这时 检验是属于参数检验还是非参数检验, 为什么?
3
3.628
82 c 1
82 783 78 303 30 263 26 216 216
3
0.8938
3.628 uc 3.837 0.8938
查附表1,P<0.001,按=0.05水准拒绝 H0。可认为复方石苇冲剂治疗两型支气管炎 的疗效不同,对单纯型疗效好。
常用于检验差值得总体中位数是否等于零。
例8-1 用过硫酸铵分光光度法和示波极谱法测定 水中锰得含量(mg/L),结果见表下表,问:两种 方法的测定结果有无差别? H0:两种方法测得结果相同,即差值总体 中位数为零
H1:两种方法测得结果不相同,即差值总 体中位数不为零 α=0.05
计算统计量T的步骤为:
双向有序属性相同R×C表
2×2配对设计的扩展,即水平数>2的诊断 试验配伍设计。 如: 两种检测方法同时对同一批样品的测定结果。 Kappa检验
双向有序属性不相R×C表
1.研究目的为分析不同年龄组患者疗效之间有无 差别,视为单向有序行×列表,用秩和检验。 2.研究目的为分析两个有序变量之间是否有关系,
双向无序R×C表
P100 :表7-5 、表7-7
1. 研究目的为多个率(构成)的比较,可
用行×列资料的卡方检验。
2.研究目的为分析两个分类变量之间有无 关联性,可用行×列资料的卡方检验。
单向有序R×C表
1. 分组变量是有序的,指标变量是无序的。 行×列资料的卡方检验 2.分组变量为无序,指标变量是有序。 P116:表8-5 秩和检验
(U/ml),问不同程度再生障碍性贫血患者与正常人血清中
可溶性CD8抗原水平是否不同?
H0:三组血清中可溶性CD8抗原水平总体中
位数相同
H1:三组血清中可溶性CD8抗原水平总体中
位数不相同
α=0.05
计算统计量H:
混合编秩,相同数值,取平均秩,算 得各组的秩和R
R 12 H 3( N 1) N ( N 1) ni
假定两种测定方法效应相同,则变量
差值的应服从以0为中心的对称分布,相当 于正或负的秩和应相近,即使有差别,也 只能是随机误差。如果差别太大,超出a检 验水准,就拒绝H0,接受H1。
P>0.10, 按=0.05水准不拒绝H0, 差别无统计学意义。尚不能认为两种方 法测定水中锰的含量有差别。
正态近似:
H0:猫和兔子在缺氧条件下生存时间总体 中位数相同 H1:猫和兔子在缺氧条件下生存时间总体 中位数不同 a=0.05
混合编秩 相等数值取平均秩 取较小样本的秩和记为T, 本例T=127.5 以n1及n2- n1查秩和检验临界值表(附表9)
附表9
P414
0.01 0.02 0.05 0.10
对总体的分布类 型不作任何要求
不受总体参数的影响,比较 的是分布或分布位置 适用范围广;可用于任何类型 资料(等级资料,或“>50mg” )
依赖于特定分布类 型,比较的是参数
非参数检验的优缺点
⒈ 优点
①不受总体分布的限制,适用范围广。 ②不受资料类型的限制,可以是计量资料、 等级资料以及一端或两端无确切数据的资料。
H Hc c
(8-6)
t c 1
3
3 i
ti
n n
随机区组设计的秩和检验
Friedman M检验
M检验(Friedman法)查表法
1.每个区组的数据由小到大分别编秩,相同数 据取平均秩次。 2.计算各处理组的秩和 Ri。
12 Ri2 3b k 1 3.计算 M 值: M bk k 1
正态性检验Kolmogorov-Smirnov检验P=0.038,该资 料不服从正态分布。
参数检验和非参数检验
(parametric test and nonparametric test )
概念
参数检验 (parametric test) 已知总体分布类型,对 未知参数进行统计推断 非参数检验 (nonparametric test)
3.秩和检验(rank sum test)
用数据排序的秩来代替原始数据进行 假设检验,这种方法称为秩和检验。
秩(rank) → 秩和(rank sum) →秩和检验(rank sum test)
适宜作秩和检验的资料
不满足参数统计的资料 等级资料 边界不确定的资料
配对设计符号秩检验
配对设计符号秩和检验由Wilcoxon提出,又 称Wilcoxon符号秩和检验(signed rank test) 。
2 .缺点
① 对于符合参数检验条件的资料,如果用非参
数检验,没有充分利用资料提供的信息,检验 效能低于参数检验。 ② 非参数检验一般犯第二类错误的概率β比参数 检验大,若要使β相同,非参数检验要比参数检
验需要更多的样本例数。
秩和检验
1. 秩(rank) 将数据从小到大排序,该序号在统计学上称为秩 ♀ ♂ ♀ ♀ ♀ ♂ ♂ ♀ ♀ ♂ ♂ ♂ 40 46 48 49 50 57 60 61 62 63 64 69 1 2 3 4 5 6 7 8 9 10 11 12 2.秩和(rank sum) ♀=1+3+4+5+8+9=30 ♂=2+6+7+10+11+12=48
分布近似法
当处理组数k或配伍组数b超出附表11的范围时,
2
12 b k ( k 1)
R 3 b ( k 1)
2 i
=k–1
思考题:
1. 对同一资料,又出自同一研究目的,用参数检验 和非参数检验所得结果不一致时,宜以何者为准?
2.配对比较两种方法治疗扁平足效果,请问哪种方法好?
3
(8-4)
式中N= n1+ n2 ti 是第i 种相同秩的个数。
基本思想
两个样本(含量分别为n1和n2,且n1≤n2)来自同一总体或 分布相同的两个总体时,即假设检验H0成立时,n1样本的秩
和T与平均秩和n1(N+1)/2相差应该不大,此时u< u ;
若T与平均秩和n1(N+1)/2相差很大,则会有u≥ u ,表示
例8-1 用过硫酸铵分光光度法和示波极谱法测定 水中锰得含量(mg/L),结果见表下表,问:两种 方法的测定结果有无差别?
样品号 分光光度法 极谱法 1 2 3 4 5 6 7 8 9 10
0.52 0.32 0.32 0.33 0.21 0.07 0.03 0.37 0.40 0.18 0.49 0.33 0.34 0.32 0.16 0.16 0.09 0.24 0.67 0.69