秩和检验统计学
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
randomized design, more than 2 groups) 9.4 multiple comparison
2
两类统计方法
参数统计方法
总体均数的可信区间估计
均数比较的t检验或z检验
均数比较的方差分析
率比较的u检验
非参数统计方法
t检验等的条件
正态性 方差齐性
要作校正。
uc u c
c
t
3 j
t
j
/
N3 N
15
表9.3 两种疗法对急性脑梗死Ⅱ期的疗效比较
疗效 (1)
基本痊愈 显著进步 进步 无效 合计
试验 对照 合计 秩次范 平均
秩和
组 组 (4) 围 秩次 试验组 对照组
(2) (3)
(5) (6) (7)=(2)×(6 (8)=(3)×(6
差值d (4)=(2)
-(3) 140.2 268.5 -28.2 -94.4 328.4 118.9 85.9 46.6 72.1
秩次 (5)
7 9 -1 -5 10 6 4 2 3
17
检验假设
H0 :所测前后值的总体分布位置相同,差值的
总体中位数Md=0); H1: 所 测 前 后 值 的 总 体 分 布 位 置 不 同
9.1 Wilcoxon signed rank test( paired design) 9.2 Wilcoxon rank sum test( completely
randomized design, 2 groups) 9.3 Wilcoxon rank sum test( completely
1 3 9 15 20 22
健康 组
(7) 1.7 2.4 2.6 2.6 2.9 3.3 3.6 3.9 4.4
95.5
70
6
6
22
秩次 (8)
2 6 7.5 7.5 10 11 12 13 14
83 9
假设检验步骤
H0:四组人群AFP检测结果总体分布相同; H1:四组人群AFP检测结果总体分布不同或不完全相同 (1)编秩;(2)求秩和 (3)
20世纪30年代,苏联数学家安德烈柯尔莫哥洛夫和 N.V.Smirnov 发展了无需使用参数的分布比较方法
6
位次(rank)的概念
中位数(median)复习概念 数值的具体大小与相对大小(exact magnitude and
relative magnitude)
Observation 3.1 5.5 6.0 10.2 11.9
计算统计H量H N
12
N
1பைடு நூலகம்
Ri2 ni
3N
1
确定P值和作出推断结论
若组数k=3,每组例数ni≤5,可查附表19,H界值表得出P值; 若k>3最小样本例数不小于5,则H近似服从ν=k-1的χ2分布。
本例k=4,每组例数ni>5 ,查附表10 界值表, =3,得 P<0.05(P=0.001),按 的检验水准,拒绝H0,接受H1,可 以认为四组人群AFP检测结果总体分布不同或不完全相同。
检验效能低;
4
非参数统计方法的适用范围
1.分布类型不明或偏态分布 2.等级资料 3. 方差明显不齐,无法变换 4.个别数据偏离,或开口资料 5.正态分布资料
5
统计学家们 Wilcoxon-Mann-Whitney
Frank wilcoxon
20世纪40年代,美国氰胺公司化学家Frank wilcoxo(n1892-1965) 实验中由于仪器的预热过程,数据变异较大,导致t检 验方法似乎有误。 基于组合与排列的方法。
表9.1 治疗前后测得患者血清总胆红素
样品编号 (1)
1 2 3 4 5 6 7 8 9
术前 (2)
395.5 299.2 577.5 158.4 428.0 123.5 95.9 218.6 394.1
术后 (3)
255.3 30.7 605.7 252.8 99.6 4.6 10.0 172.0 322.0
)
)
39 8 47 1~47 24 936
192
43 48 91 48~138 93 3999
4464
21 32 53 139~191 165 3465
5280
5 16 21 192~212 202 1010
3232
108 104 212 -
-
9410
13168
16
9.1 配对符号检验Wilcoxon signed-rank test
Wilcoxon, F. (1945) Individual Comparisons by Ranking Methods. Biometrics Bulletin 1: 80–83.
经济学家Henry B.Mann和Ohio State University 统计学 研究生 D.Ransom Whitney
u值:
T nn 1/ 4 0.5
u
nn
12n
1 /
24
t
3 j
t
j
/ 48
21
9.3 多个样本比较的秩和检验Kruskal-Wallis H test
肝癌 (1)
4.7 5.8 13.3 22.9 205.9 274.0 71348.8 2134.8 9402.0 159261.0 Ri
卡方检验
秩和检验
3
非参数统计 (nonparametric statistics)
概念
不以一定的抽样分布为基础;不通过统计量 来估计参数或对参数进行推断。常用的有符 号检验,秩和检验,卡方检验,游程检验等
优缺点 计算简单;不需严格的正态性假设,因 而适用范围广; ;对异常数据不敏感; 单调转换下的不变性;
rank
12
3
4
5
不考虑数值的具体大小,只考虑其相对大小,用对代表 秩次的连续整数的统计来代替对具体数值计算统计指 标。所以,秩和检验不是针对总体的数值分布,而是 总体的位置排列。
7
一个小问题
比较男生与女生的平均身高(不许用任何测量工具)
8
9.2 两样本比较的秩和检验
Wilcoxon rank-sum test
分n(n别+求1)/出2。正可、用负于秩验次算之计和算T+是和否T正-(二确者)之。和等于 本验例统T计+量=4T1.,本T-例=1取4(T和=为1455),任取T+ (或T- )作检
19
确定P值和作出推断结论
当n<25时,查附表11T界值表。查表时,若T 在 Tα 上 、 下 界 值 范 围 外 或 等 于 界 值 时 , 则
( Md≠0); α=0.05
18
求检验统计量 T值
编秩
依差值的绝对值从小到大编秩,再根据差值的正、负 给秩次冠以正负号;
编秩时如遇差值等于0,舍去不计,有效对子数n相应 减少,本例有效对子数n=8;
遇有差值的绝对值相等,符号不同,则取其平均秩次。
如表10.6第(4)栏中差值绝对值等于0.02的有4个,它们 位次是4、5、6、7,其平均秩次为(4+5+6+7)/4=5.5。
连续整数的求和。 如果两样本来自一个总体,样本例数相等时,
应平分总秩和;样本例数不等时则按比例 分总秩和。
14
正态近似与校正数
如果n1或n2-n1超
出附表的范围, 可用正态近似法
u T n1(N 1) / 2 0.5
uc=
即u检验计算u值. 相同秩次较多时
n1n2 (N 1) /12
9 非参数统计分析方法
non-parametric statistics
余小金 东南大学公共卫生学院 流行病学与卫生统计学系
1
主要内容Outline
9.0非参数检验简介 9.1配对设计秩和检验 9.2完全随机设计秩和检验 9.3多组比较秩和检验 9.4 两两比较
9.0 Introduction to nonparametric test
表9.2 两种方法治疗胆道梗阻患者测得血清总胆红素下降量
对照组
秩次
试验组
秩次
(1)
(2)
(3)
(4)
140.2
11
48.6
5
268.5
16
246.5
15
-28.2
3
415.7
21
-94.4
2
378.2
20
328.4
19
133.8
10
118.9
9
308.4
18
85.9
7
308.1
17
46.6
4
487.3
22
72.1
6
113.3
8
-209.6
1
155.6
13
228.5
14
144.0
12
n1=10
T1=78 9 n2=12
T2=175
检验假设 H0:…………….的分布位置相同。
H1:…………………..的分布位置不同。 α=0.05
10
11
求检验统计量T值
统一排序,并给予秩次(为什么?)。 遇相同数据时,怎么办?
分 秩 和别为和求T为。两统组计秩量和T。,若以n样1=本n含2,量可较取小任者一为组n1的,其秩
本例T1=78(n1=10),T2=175(n2=12),T=78。
12
确定P值和作出推断结论
由n1,n2-n1查附表18,若T值在界值Tα范围内, 则P>α;若T值在界值Tα外,或恰好等于下界
P<α ; 若 T 在 Tα 上 、 下 界 值 范 围 内 , 则
P>α。
本例n=10,T=14;查附表,得T在双侧界值
范围内,P > 0.05。按双侧α=0.05水准, 不拒绝H0 ,故尚不能认为术前和术后患者血 清总胆红素检测结果有差别。
20
正态近似法
当n> 25,超出附表17的范围,可用正 态近似法即u检验,按式(10.6)计算
ni
表9.4 4组人群AFP检测结果
秩次 (2)
16.5 18 21 23 25 26 28 29 30 31
247.5 10
肝炎 (3)
2.1 2.3 4.7 7.8 50.6 452.3
秩次 (4)
4 5 16.5 19 24 27
肝硬化 (5)
1.5 2.0 2.8 4.5 9.0 21.1
秩次 (6)
23
多个样本两两比较的秩和检验
RA RB
N
N
12
1
1 nA
1 nB
k k
1
2
24
作业
选择题 P123 第11,12题
25
谢谢您的认真听讲!
26
值(或上界值),则P≤α。 本例n1=10,n2-n1=23,T=78,查附表12得双
侧 P<0.05 , 按 α=0.05 水 准 , 拒 绝 H0 , 接 受 H1,故认为可以认为两组患者血清总胆红素下 降量是不相同的。
13
基本思想
N=n1+n2 秩次应从1到N,总秩和是一定的,即从1到N的
2
两类统计方法
参数统计方法
总体均数的可信区间估计
均数比较的t检验或z检验
均数比较的方差分析
率比较的u检验
非参数统计方法
t检验等的条件
正态性 方差齐性
要作校正。
uc u c
c
t
3 j
t
j
/
N3 N
15
表9.3 两种疗法对急性脑梗死Ⅱ期的疗效比较
疗效 (1)
基本痊愈 显著进步 进步 无效 合计
试验 对照 合计 秩次范 平均
秩和
组 组 (4) 围 秩次 试验组 对照组
(2) (3)
(5) (6) (7)=(2)×(6 (8)=(3)×(6
差值d (4)=(2)
-(3) 140.2 268.5 -28.2 -94.4 328.4 118.9 85.9 46.6 72.1
秩次 (5)
7 9 -1 -5 10 6 4 2 3
17
检验假设
H0 :所测前后值的总体分布位置相同,差值的
总体中位数Md=0); H1: 所 测 前 后 值 的 总 体 分 布 位 置 不 同
9.1 Wilcoxon signed rank test( paired design) 9.2 Wilcoxon rank sum test( completely
randomized design, 2 groups) 9.3 Wilcoxon rank sum test( completely
1 3 9 15 20 22
健康 组
(7) 1.7 2.4 2.6 2.6 2.9 3.3 3.6 3.9 4.4
95.5
70
6
6
22
秩次 (8)
2 6 7.5 7.5 10 11 12 13 14
83 9
假设检验步骤
H0:四组人群AFP检测结果总体分布相同; H1:四组人群AFP检测结果总体分布不同或不完全相同 (1)编秩;(2)求秩和 (3)
20世纪30年代,苏联数学家安德烈柯尔莫哥洛夫和 N.V.Smirnov 发展了无需使用参数的分布比较方法
6
位次(rank)的概念
中位数(median)复习概念 数值的具体大小与相对大小(exact magnitude and
relative magnitude)
Observation 3.1 5.5 6.0 10.2 11.9
计算统计H量H N
12
N
1பைடு நூலகம்
Ri2 ni
3N
1
确定P值和作出推断结论
若组数k=3,每组例数ni≤5,可查附表19,H界值表得出P值; 若k>3最小样本例数不小于5,则H近似服从ν=k-1的χ2分布。
本例k=4,每组例数ni>5 ,查附表10 界值表, =3,得 P<0.05(P=0.001),按 的检验水准,拒绝H0,接受H1,可 以认为四组人群AFP检测结果总体分布不同或不完全相同。
检验效能低;
4
非参数统计方法的适用范围
1.分布类型不明或偏态分布 2.等级资料 3. 方差明显不齐,无法变换 4.个别数据偏离,或开口资料 5.正态分布资料
5
统计学家们 Wilcoxon-Mann-Whitney
Frank wilcoxon
20世纪40年代,美国氰胺公司化学家Frank wilcoxo(n1892-1965) 实验中由于仪器的预热过程,数据变异较大,导致t检 验方法似乎有误。 基于组合与排列的方法。
表9.1 治疗前后测得患者血清总胆红素
样品编号 (1)
1 2 3 4 5 6 7 8 9
术前 (2)
395.5 299.2 577.5 158.4 428.0 123.5 95.9 218.6 394.1
术后 (3)
255.3 30.7 605.7 252.8 99.6 4.6 10.0 172.0 322.0
)
)
39 8 47 1~47 24 936
192
43 48 91 48~138 93 3999
4464
21 32 53 139~191 165 3465
5280
5 16 21 192~212 202 1010
3232
108 104 212 -
-
9410
13168
16
9.1 配对符号检验Wilcoxon signed-rank test
Wilcoxon, F. (1945) Individual Comparisons by Ranking Methods. Biometrics Bulletin 1: 80–83.
经济学家Henry B.Mann和Ohio State University 统计学 研究生 D.Ransom Whitney
u值:
T nn 1/ 4 0.5
u
nn
12n
1 /
24
t
3 j
t
j
/ 48
21
9.3 多个样本比较的秩和检验Kruskal-Wallis H test
肝癌 (1)
4.7 5.8 13.3 22.9 205.9 274.0 71348.8 2134.8 9402.0 159261.0 Ri
卡方检验
秩和检验
3
非参数统计 (nonparametric statistics)
概念
不以一定的抽样分布为基础;不通过统计量 来估计参数或对参数进行推断。常用的有符 号检验,秩和检验,卡方检验,游程检验等
优缺点 计算简单;不需严格的正态性假设,因 而适用范围广; ;对异常数据不敏感; 单调转换下的不变性;
rank
12
3
4
5
不考虑数值的具体大小,只考虑其相对大小,用对代表 秩次的连续整数的统计来代替对具体数值计算统计指 标。所以,秩和检验不是针对总体的数值分布,而是 总体的位置排列。
7
一个小问题
比较男生与女生的平均身高(不许用任何测量工具)
8
9.2 两样本比较的秩和检验
Wilcoxon rank-sum test
分n(n别+求1)/出2。正可、用负于秩验次算之计和算T+是和否T正-(二确者)之。和等于 本验例统T计+量=4T1.,本T-例=1取4(T和=为1455),任取T+ (或T- )作检
19
确定P值和作出推断结论
当n<25时,查附表11T界值表。查表时,若T 在 Tα 上 、 下 界 值 范 围 外 或 等 于 界 值 时 , 则
( Md≠0); α=0.05
18
求检验统计量 T值
编秩
依差值的绝对值从小到大编秩,再根据差值的正、负 给秩次冠以正负号;
编秩时如遇差值等于0,舍去不计,有效对子数n相应 减少,本例有效对子数n=8;
遇有差值的绝对值相等,符号不同,则取其平均秩次。
如表10.6第(4)栏中差值绝对值等于0.02的有4个,它们 位次是4、5、6、7,其平均秩次为(4+5+6+7)/4=5.5。
连续整数的求和。 如果两样本来自一个总体,样本例数相等时,
应平分总秩和;样本例数不等时则按比例 分总秩和。
14
正态近似与校正数
如果n1或n2-n1超
出附表的范围, 可用正态近似法
u T n1(N 1) / 2 0.5
uc=
即u检验计算u值. 相同秩次较多时
n1n2 (N 1) /12
9 非参数统计分析方法
non-parametric statistics
余小金 东南大学公共卫生学院 流行病学与卫生统计学系
1
主要内容Outline
9.0非参数检验简介 9.1配对设计秩和检验 9.2完全随机设计秩和检验 9.3多组比较秩和检验 9.4 两两比较
9.0 Introduction to nonparametric test
表9.2 两种方法治疗胆道梗阻患者测得血清总胆红素下降量
对照组
秩次
试验组
秩次
(1)
(2)
(3)
(4)
140.2
11
48.6
5
268.5
16
246.5
15
-28.2
3
415.7
21
-94.4
2
378.2
20
328.4
19
133.8
10
118.9
9
308.4
18
85.9
7
308.1
17
46.6
4
487.3
22
72.1
6
113.3
8
-209.6
1
155.6
13
228.5
14
144.0
12
n1=10
T1=78 9 n2=12
T2=175
检验假设 H0:…………….的分布位置相同。
H1:…………………..的分布位置不同。 α=0.05
10
11
求检验统计量T值
统一排序,并给予秩次(为什么?)。 遇相同数据时,怎么办?
分 秩 和别为和求T为。两统组计秩量和T。,若以n样1=本n含2,量可较取小任者一为组n1的,其秩
本例T1=78(n1=10),T2=175(n2=12),T=78。
12
确定P值和作出推断结论
由n1,n2-n1查附表18,若T值在界值Tα范围内, 则P>α;若T值在界值Tα外,或恰好等于下界
P<α ; 若 T 在 Tα 上 、 下 界 值 范 围 内 , 则
P>α。
本例n=10,T=14;查附表,得T在双侧界值
范围内,P > 0.05。按双侧α=0.05水准, 不拒绝H0 ,故尚不能认为术前和术后患者血 清总胆红素检测结果有差别。
20
正态近似法
当n> 25,超出附表17的范围,可用正 态近似法即u检验,按式(10.6)计算
ni
表9.4 4组人群AFP检测结果
秩次 (2)
16.5 18 21 23 25 26 28 29 30 31
247.5 10
肝炎 (3)
2.1 2.3 4.7 7.8 50.6 452.3
秩次 (4)
4 5 16.5 19 24 27
肝硬化 (5)
1.5 2.0 2.8 4.5 9.0 21.1
秩次 (6)
23
多个样本两两比较的秩和检验
RA RB
N
N
12
1
1 nA
1 nB
k k
1
2
24
作业
选择题 P123 第11,12题
25
谢谢您的认真听讲!
26
值(或上界值),则P≤α。 本例n1=10,n2-n1=23,T=78,查附表12得双
侧 P<0.05 , 按 α=0.05 水 准 , 拒 绝 H0 , 接 受 H1,故认为可以认为两组患者血清总胆红素下 降量是不相同的。
13
基本思想
N=n1+n2 秩次应从1到N,总秩和是一定的,即从1到N的