第八章 统计秩和检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
若T与平均秩和n1(N+1)/2相差很大,则会有u≥ u,表示
抽得T如此大、以及比T更大的样本统计量的概率不大于检验 水准,因而拒绝检验假设H0
等级资料两样本比较
例8-3 某医院用复方石苇冲剂治疗老年性慢性支气管炎 患者216例,问该药对两型支气管炎治疗效果是否不同?
H0:两型支气管炎疗效总体分布相同 H1:两型支气管炎疗效总体分布不同 a=0.05
Friedman M检验
M检验(Friedman法)查表法
1.每个区组的数据由小到大分别编秩,相同数
据取平均秩次。
2.计算各处理组的秩和 Ri。
3.计算
M
值:
M
bk
12
k 1
Ri2
3b k
1
其中 b 为区组数,k 为处理组数。
4.查附表 11,当 M≥ M ,(b,k) 时,P≤ ,即各处
2 .缺点 ① 对于符合参数检验条件的资料,如果用非参 数检验,没有充分利用资料提供的信息,检验 效能低于参数检验。
② 非参数检验一般犯第二类错误的概率β比参数 检验大,若要使β相同,非参数检验要比参数检 验需要更多的样本例数。
秩和检验
1. 秩(rank)
将数据从小到大排序,该序号在统计学上称为秩
理因素之间的差别有统计学意义。
例8-6
H0:三种不同饲料对小鼠肝脏中铁的含量 总体中位数相同
H1:三种不同饲料对小鼠肝脏中铁的含量 总体中位数不全相同
=0.05
计算统计量M值
(1) 编秩:先将各配伍组数据由小到大统一编秩,遇相同数值
取平均秩次。再将各处理组的秩次相加,得到各处
理组秩和 Ri。
③求秩和:T+和T-,任一作为统计量T。 本例T=18.5。
以差值不等于0的数值对子数n=10查附表8, 10-45 0.10 8-47 0.05 5-50 0.02 3-52 0.01
n 10
0.01
0.02
0.05 0.10
3 5 8 10
45
47 50 52
基本思想
假定两种测定方法效应相同,则变量 差值的应服从以0为中心的对称分布,相当 于正或负的秩和应相近,即使有差别,也 只能是随机误差。如果差别太大,超出a检 验水准,就拒绝H0,接受H1。
问题:
配对设计,两种处理效应比较的 秩和检验,当n>50,采用u检验,这时 检验是属于参数检验还是非参数检验, 为什么?
注意事项
1. n差值不为0的对子数 2. 便于记忆,秩次相同的皆取平均秩次 3. “内大外小”
完全随机设计 两样本比较的秩和检验
Wilcoxon秩和检验(Wilcoxon rank sum test)
双向有序属性相同R×C表
2×2配对设计的扩展,即水平数>2的诊断 试验配伍设计。 如: 两种检测方法同时对同一批样品的测定结果。
Kappa检验
双向有序属性不相R×C表
1.研究目的为分析不同年龄组患者疗效之间有无 差别,视为单向有序行×列表,用秩和检验。 2.研究目的为分析两个有序变量之间是否有关系, 宜选用等级相关,行×列资料的卡方检验。
用数据排序的秩来代替原始数据进行 假设检验,这种方法称为秩和检验。
秩(rank) → 秩和(rank sum) →秩和检验(rank sum test)
适宜作秩和检验的资料
不满足参数统计的资料 等级资料 边界不确定的资料
配对设计符号秩检验
配对设计符号秩和检验由Wilcoxon提出,又 称Wilcoxon符号秩和检验(signed rank test) 。
双向无序R×C表
P100 :表7-5 、表7-7
1. 研究目的为多个率(构成)的比较,可 用行×列资料的卡方检验。
2.研究目的为分析两个分类变量之间有无 关联性,可用行×列资料的卡方检验。
单向有序R×C表
1. 分组变量是有序的,指标变量是无序的。 行×列资料的卡方检验
2.分组变量为无序,指标变量是有序。 P116:表8-5 秩和检验
表1 不同期次矽肺患者肺门密度级别分布
矽肺期次
Ⅰ Ⅱ Ⅲ 合计
肺门密度级别
+
++ +++
43
188
14
1
96
72
6
17
55
50
301
141
合计
245 169
78 492
查附表1,P<0.001,按=0.05水准拒绝 H0。可认为复方石苇冲剂治疗两型支气管炎 的疗效不同,对单纯型疗效好。
注意事项
1. 以样本例数小者的秩和为统计量 2. 用正态近似法,仍是非参数法
问题:
1.例8-3能否用卡方检验,秩和检验的优点?
2.例8-3秩次从“无效” “控制”编, 检验结果是否会发生变化?
P>0.10, 按=0.05水准不拒绝H0, 差别无统计学意义。尚不能认为两种方 法测定水中锰的含量有差别。
wk.baidu.com 正态近似:
T nn 1/ 4 0.5 u nn 12n 1/ 24
(8-1)
校正公式:
(8-2)
T nn 1/ 4 0.5
u n(n 1)(2n 1) / 24 (ti3 ti ) / 48
例8-1 用过硫酸铵分光光度法和示波极谱法测定 水中锰得含量(mg/L),结果见表下表,问:两种 方法的测定结果有无差别?
样品号 分光光度法 极谱法
1 2 3 4 5 6 7 8 9 10 0.52 0.32 0.32 0.33 0.21 0.07 0.03 0.37 0.40 0.18 0.49 0.33 0.34 0.32 0.16 0.16 0.09 0.24 0.67 0.69
表1 甲、乙两法治疗扁平足的效果
病例号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 甲法 好 好 好 好 差 中 好 好 中 差 好 差 好 中 好 中 乙法 差 好 差 中 中 差 中 差 中 差 好 差 中 差 中 差
R×C表的分类
1. 双向无序 2. 单向有序 3. 双向有序属性相同 4. 双向有序属性不同
常用于检验差值得总体中位数是否等于零。
例8-1 用过硫酸铵分光光度法和示波极谱法测定
水中锰得含量(mg/L),结果见表下表,问:两种 方法的测定结果有无差别?
H0:两种方法测得结果相同,即差值总体 中位数为零
H1:两种方法测得结果不相同,即差值总 体中位数不为零
α=0.05
计算统计量T的步骤为: ①算出各对数值之代数差 ②编秩
0.01
0.02
0.05 0.10
3 5 8 10
45
47 50 52
P<0.01,按=0.05水准拒绝H0。 可以认
为猫和兔子在缺氧条件下生存时间不同,猫 的生存时间较兔子长。
正态近似检验,公式为:
u
T
n1N 1/ 2 0.5 n1n2 N 1/12
(8-3)
当相同秩次较多时, 应采用校正公式:
原始数据两样本的比较
例8-2 某试验观察在缺氧条件下猫和兔的生存时间,试 检验在缺氧条件下猫和兔的生存时间是否有差别?
H0:猫和兔子在缺氧条件下生存时间总体 中位数相同
H1:猫和兔子在缺氧条件下生存时间总体 中位数不同
a=0.05
混合编秩 相等数值取平均秩 取较小样本的秩和记为T, 本例T=127.5 以n1及n2- n1查秩和检验临界值表(附表9)
uc
u c
c 1
ti3 ti (8-4)
n3 n
式中N= n1+ n2 ti 是第i 种相同秩的个数。
基本思想
两个样本(含量分别为n1和n2,且n1≤n2)来自同一总体或 分布相同的两个总体时,即假设检验H0成立时,n1样本的秩 和T与平均秩和n1(N+1)/2相差应该不大,此时u< u ;
♀ ♂ ♀ ♀ ♀ ♂ ♂ ♀ ♀♂ ♂ ♂ 40 46 48 49 50 57 60 61 62 63 64 69 1 2 3 4 5 6 7 8 9 10 11 12
2.秩和(rank sum) ♀=1+3+4+5+8+9=30 ♂=2+6+7+10+11+12=48
3.秩和检验(rank sum test)
11186 88216 1 / 2 0.5
u
3.628
86128216 1
12
823 82 783 78 303 30 263 26
c 1
0.8938
2163 216
uc
3.628 3.837 0.8938
分布近似法
当处理组数k或配伍组数b超出附表11的范围时,
2 1 2
bk (k 1)
R
2 i
3b ( k
1)
=k–1
思考题:
1. 对同一资料,又出自同一研究目的,用参数检验 和非参数检验所得结果不一致时,宜以何者为准?
2.配对比较两种方法治疗扁平足效果,请问哪种方法好?
正态性检验Kolmogorov-Smirnov检验P=0.038,该资 料不服从正态分布。
参数检验和非参数检验
(parametric test and nonparametric test )
概念
参数检验 (parametric test)
已知总体分布类型,对 未知参数进行统计推断
依赖于特定分布类 型,比较的是参数
附表9
P414
0.01 0.02 0.05 0.10
51-117 53-115 58-110 62-106
T=127.5
P<0.01
原则:内大外小
n1 8
n1 n2 4
0.01
0.02
0.05 0.10
51 53 58 62
106 110 115 117
n 10
完全随机设计多个样本比较的 秩和检验
Kruskal-Wallis H检验
例8-4
某医院在研究再生障碍性贫血时,测得不同程度再
生障碍性贫血与对照组正常人血清中可溶性CD8抗原水平 (U/ml),问不同程度再生障碍性贫血患者与正常人血清中
可溶性CD8抗原水平是否不同?
H0:三组血清中可溶性CD8抗原水平总体中
(2)计算
M
值:
M
12
833 1
92 152 242
383 1 14.25
以配伍组数 b=8 和处理组数 k=3 查附表 11, M 0.05,(7,4) =6.25,本例 M=14.25>6.25,
P<0.01。按 =0.05 水准拒绝 H0,接受 H1, 差别有统计学意义,故可以认为三种不同饲 料的小鼠肝脏中铁的含量不全相同。
位数相同
H1:三组血清中可溶性CD8抗原水平总体中
位数不相同
α=0.05
计算统计量H:
混合编秩,相同数值,取平均秩,算 得各组的秩和R
H 12 Ri2 3(N 1)
(8-5)
N (N 1) ni
H 12 (49.52 149.52 1792 ) 3(27 1) 16.250
27(27 1)
9
H统计量近似服从v=k-1的卡方分布,查卡 方界值表,P<0.005,按 a =0.05水准拒绝H0, 接受H1,差别有统计学意义,故可认为三组血 清中可溶性CD8抗原水平总体中位数不相同。
Hc
H c
(8-6)
c 1
ti3 ti
n3 n
随机区组设计的秩和检验
非参数检验 (nonparametric test)
对总体的分布类 型不作任何要求
不受总体参数的影响,比较 的是分布或分布位置
适用范围广;可用于任何类型 资料(等级资料,或“>50mg” )
非参数检验的优缺点
⒈ 优点 ①不受总体分布的限制,适用范围广。 ②不受资料类型的限制,可以是计量资料、 等级资料以及一端或两端无确切数据的资料。
抽得T如此大、以及比T更大的样本统计量的概率不大于检验 水准,因而拒绝检验假设H0
等级资料两样本比较
例8-3 某医院用复方石苇冲剂治疗老年性慢性支气管炎 患者216例,问该药对两型支气管炎治疗效果是否不同?
H0:两型支气管炎疗效总体分布相同 H1:两型支气管炎疗效总体分布不同 a=0.05
Friedman M检验
M检验(Friedman法)查表法
1.每个区组的数据由小到大分别编秩,相同数
据取平均秩次。
2.计算各处理组的秩和 Ri。
3.计算
M
值:
M
bk
12
k 1
Ri2
3b k
1
其中 b 为区组数,k 为处理组数。
4.查附表 11,当 M≥ M ,(b,k) 时,P≤ ,即各处
2 .缺点 ① 对于符合参数检验条件的资料,如果用非参 数检验,没有充分利用资料提供的信息,检验 效能低于参数检验。
② 非参数检验一般犯第二类错误的概率β比参数 检验大,若要使β相同,非参数检验要比参数检 验需要更多的样本例数。
秩和检验
1. 秩(rank)
将数据从小到大排序,该序号在统计学上称为秩
理因素之间的差别有统计学意义。
例8-6
H0:三种不同饲料对小鼠肝脏中铁的含量 总体中位数相同
H1:三种不同饲料对小鼠肝脏中铁的含量 总体中位数不全相同
=0.05
计算统计量M值
(1) 编秩:先将各配伍组数据由小到大统一编秩,遇相同数值
取平均秩次。再将各处理组的秩次相加,得到各处
理组秩和 Ri。
③求秩和:T+和T-,任一作为统计量T。 本例T=18.5。
以差值不等于0的数值对子数n=10查附表8, 10-45 0.10 8-47 0.05 5-50 0.02 3-52 0.01
n 10
0.01
0.02
0.05 0.10
3 5 8 10
45
47 50 52
基本思想
假定两种测定方法效应相同,则变量 差值的应服从以0为中心的对称分布,相当 于正或负的秩和应相近,即使有差别,也 只能是随机误差。如果差别太大,超出a检 验水准,就拒绝H0,接受H1。
问题:
配对设计,两种处理效应比较的 秩和检验,当n>50,采用u检验,这时 检验是属于参数检验还是非参数检验, 为什么?
注意事项
1. n差值不为0的对子数 2. 便于记忆,秩次相同的皆取平均秩次 3. “内大外小”
完全随机设计 两样本比较的秩和检验
Wilcoxon秩和检验(Wilcoxon rank sum test)
双向有序属性相同R×C表
2×2配对设计的扩展,即水平数>2的诊断 试验配伍设计。 如: 两种检测方法同时对同一批样品的测定结果。
Kappa检验
双向有序属性不相R×C表
1.研究目的为分析不同年龄组患者疗效之间有无 差别,视为单向有序行×列表,用秩和检验。 2.研究目的为分析两个有序变量之间是否有关系, 宜选用等级相关,行×列资料的卡方检验。
用数据排序的秩来代替原始数据进行 假设检验,这种方法称为秩和检验。
秩(rank) → 秩和(rank sum) →秩和检验(rank sum test)
适宜作秩和检验的资料
不满足参数统计的资料 等级资料 边界不确定的资料
配对设计符号秩检验
配对设计符号秩和检验由Wilcoxon提出,又 称Wilcoxon符号秩和检验(signed rank test) 。
双向无序R×C表
P100 :表7-5 、表7-7
1. 研究目的为多个率(构成)的比较,可 用行×列资料的卡方检验。
2.研究目的为分析两个分类变量之间有无 关联性,可用行×列资料的卡方检验。
单向有序R×C表
1. 分组变量是有序的,指标变量是无序的。 行×列资料的卡方检验
2.分组变量为无序,指标变量是有序。 P116:表8-5 秩和检验
表1 不同期次矽肺患者肺门密度级别分布
矽肺期次
Ⅰ Ⅱ Ⅲ 合计
肺门密度级别
+
++ +++
43
188
14
1
96
72
6
17
55
50
301
141
合计
245 169
78 492
查附表1,P<0.001,按=0.05水准拒绝 H0。可认为复方石苇冲剂治疗两型支气管炎 的疗效不同,对单纯型疗效好。
注意事项
1. 以样本例数小者的秩和为统计量 2. 用正态近似法,仍是非参数法
问题:
1.例8-3能否用卡方检验,秩和检验的优点?
2.例8-3秩次从“无效” “控制”编, 检验结果是否会发生变化?
P>0.10, 按=0.05水准不拒绝H0, 差别无统计学意义。尚不能认为两种方 法测定水中锰的含量有差别。
wk.baidu.com 正态近似:
T nn 1/ 4 0.5 u nn 12n 1/ 24
(8-1)
校正公式:
(8-2)
T nn 1/ 4 0.5
u n(n 1)(2n 1) / 24 (ti3 ti ) / 48
例8-1 用过硫酸铵分光光度法和示波极谱法测定 水中锰得含量(mg/L),结果见表下表,问:两种 方法的测定结果有无差别?
样品号 分光光度法 极谱法
1 2 3 4 5 6 7 8 9 10 0.52 0.32 0.32 0.33 0.21 0.07 0.03 0.37 0.40 0.18 0.49 0.33 0.34 0.32 0.16 0.16 0.09 0.24 0.67 0.69
表1 甲、乙两法治疗扁平足的效果
病例号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 甲法 好 好 好 好 差 中 好 好 中 差 好 差 好 中 好 中 乙法 差 好 差 中 中 差 中 差 中 差 好 差 中 差 中 差
R×C表的分类
1. 双向无序 2. 单向有序 3. 双向有序属性相同 4. 双向有序属性不同
常用于检验差值得总体中位数是否等于零。
例8-1 用过硫酸铵分光光度法和示波极谱法测定
水中锰得含量(mg/L),结果见表下表,问:两种 方法的测定结果有无差别?
H0:两种方法测得结果相同,即差值总体 中位数为零
H1:两种方法测得结果不相同,即差值总 体中位数不为零
α=0.05
计算统计量T的步骤为: ①算出各对数值之代数差 ②编秩
0.01
0.02
0.05 0.10
3 5 8 10
45
47 50 52
P<0.01,按=0.05水准拒绝H0。 可以认
为猫和兔子在缺氧条件下生存时间不同,猫 的生存时间较兔子长。
正态近似检验,公式为:
u
T
n1N 1/ 2 0.5 n1n2 N 1/12
(8-3)
当相同秩次较多时, 应采用校正公式:
原始数据两样本的比较
例8-2 某试验观察在缺氧条件下猫和兔的生存时间,试 检验在缺氧条件下猫和兔的生存时间是否有差别?
H0:猫和兔子在缺氧条件下生存时间总体 中位数相同
H1:猫和兔子在缺氧条件下生存时间总体 中位数不同
a=0.05
混合编秩 相等数值取平均秩 取较小样本的秩和记为T, 本例T=127.5 以n1及n2- n1查秩和检验临界值表(附表9)
uc
u c
c 1
ti3 ti (8-4)
n3 n
式中N= n1+ n2 ti 是第i 种相同秩的个数。
基本思想
两个样本(含量分别为n1和n2,且n1≤n2)来自同一总体或 分布相同的两个总体时,即假设检验H0成立时,n1样本的秩 和T与平均秩和n1(N+1)/2相差应该不大,此时u< u ;
♀ ♂ ♀ ♀ ♀ ♂ ♂ ♀ ♀♂ ♂ ♂ 40 46 48 49 50 57 60 61 62 63 64 69 1 2 3 4 5 6 7 8 9 10 11 12
2.秩和(rank sum) ♀=1+3+4+5+8+9=30 ♂=2+6+7+10+11+12=48
3.秩和检验(rank sum test)
11186 88216 1 / 2 0.5
u
3.628
86128216 1
12
823 82 783 78 303 30 263 26
c 1
0.8938
2163 216
uc
3.628 3.837 0.8938
分布近似法
当处理组数k或配伍组数b超出附表11的范围时,
2 1 2
bk (k 1)
R
2 i
3b ( k
1)
=k–1
思考题:
1. 对同一资料,又出自同一研究目的,用参数检验 和非参数检验所得结果不一致时,宜以何者为准?
2.配对比较两种方法治疗扁平足效果,请问哪种方法好?
正态性检验Kolmogorov-Smirnov检验P=0.038,该资 料不服从正态分布。
参数检验和非参数检验
(parametric test and nonparametric test )
概念
参数检验 (parametric test)
已知总体分布类型,对 未知参数进行统计推断
依赖于特定分布类 型,比较的是参数
附表9
P414
0.01 0.02 0.05 0.10
51-117 53-115 58-110 62-106
T=127.5
P<0.01
原则:内大外小
n1 8
n1 n2 4
0.01
0.02
0.05 0.10
51 53 58 62
106 110 115 117
n 10
完全随机设计多个样本比较的 秩和检验
Kruskal-Wallis H检验
例8-4
某医院在研究再生障碍性贫血时,测得不同程度再
生障碍性贫血与对照组正常人血清中可溶性CD8抗原水平 (U/ml),问不同程度再生障碍性贫血患者与正常人血清中
可溶性CD8抗原水平是否不同?
H0:三组血清中可溶性CD8抗原水平总体中
(2)计算
M
值:
M
12
833 1
92 152 242
383 1 14.25
以配伍组数 b=8 和处理组数 k=3 查附表 11, M 0.05,(7,4) =6.25,本例 M=14.25>6.25,
P<0.01。按 =0.05 水准拒绝 H0,接受 H1, 差别有统计学意义,故可以认为三种不同饲 料的小鼠肝脏中铁的含量不全相同。
位数相同
H1:三组血清中可溶性CD8抗原水平总体中
位数不相同
α=0.05
计算统计量H:
混合编秩,相同数值,取平均秩,算 得各组的秩和R
H 12 Ri2 3(N 1)
(8-5)
N (N 1) ni
H 12 (49.52 149.52 1792 ) 3(27 1) 16.250
27(27 1)
9
H统计量近似服从v=k-1的卡方分布,查卡 方界值表,P<0.005,按 a =0.05水准拒绝H0, 接受H1,差别有统计学意义,故可认为三组血 清中可溶性CD8抗原水平总体中位数不相同。
Hc
H c
(8-6)
c 1
ti3 ti
n3 n
随机区组设计的秩和检验
非参数检验 (nonparametric test)
对总体的分布类 型不作任何要求
不受总体参数的影响,比较 的是分布或分布位置
适用范围广;可用于任何类型 资料(等级资料,或“>50mg” )
非参数检验的优缺点
⒈ 优点 ①不受总体分布的限制,适用范围广。 ②不受资料类型的限制,可以是计量资料、 等级资料以及一端或两端无确切数据的资料。