秩转换的非参数检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
参数检验
• 参数检验方法:t 检验,方差分析; • 总体分布假定:各组样本所来自的总体为
正态分布(已知的分布形式),各组样本所 来自的总体方差齐性。
非参数检验
• 定义:不依赖于总体的分布类型,对样本 所来自总体的分布不作严格假定的统计推 断方法,称为非参数检验(nonparametric test)。直接对总体分布做假设检验。 又称为任意分布检验(distribution-free test)。
秩和
(1) (2)
很低
1
(3) (4) (5)
2
3
1~3
(6) 2
吸烟
不吸烟
(7)=(2)×(6) (8)= (3)×(6)
2
4
低
8
23
31 4~34
19
152
437
中
16
11
27 35~61 48
768
528
偏高 10
4
14 62~75 68.5
685
274
高
4
0
4 76~79 77.5
310
0
合计 39(n1) 40(n2) 79
肺癌病人
秩次 1 2.5 7 14 17 18 19 20 21 22
n1=10
T1=141.5
矽肺0期工人
RD值
秩次
3.23
2.5
3.50
4
4.04
5
4.15
6
4.28
8
4.34
9
4.47
10
4.64
11
4.75
12
4.82
13
4.95
15
5.10
16
n2=12
T2=111.5
(1)建立检验假设,确定检验水准
查T界值表。
(3)确定P值,作出结论
若n1≤10且n2-n1≤10,可通过查阅T界值表 (附表10)确定P值;
若两样本量不满足上述条件,则可采用正 态近似法作u检验,按公式(8-2)计算u值。
正态近似法
u
| T n1(N 1)/2 |
n1 n2(N
12
1)(1
(tj3 tj ) ) N3 N
号秩检验完全相同的操作过程。 此例得T=1.5,查表得P<0.005; 拒绝H0,认为该厂工人的尿氟含量高于当地正
常人的水平。
第二节 两个独立样本比较的 Wilcoxon秩和检验
Wilcoxon秩和检验
• Wilcoxon秩和检验(rank sum test)用于推 断计量资料或等级资料的两个独立样本所 来自总体的分布位置是否有差别。
的比较。
符号秩检验的基本思想
• 在H0成立(两配对样本差值的总体中位数 为0)的条件下,两配对样本的差值的正负 及其绝对值的相对大小是随机的;
• 在此情况下,正秩和与负秩和之间应当相 近,差别不会太大;
• 如果正秩和与负秩和之间相差足够大,则 可认为H0成立的可能性很小,从而加以拒 绝。
1. 配对样本差值的中位数与0比较
量T; 根据公式(8-2)计算u值,执行u检验过程。
(3)确定P值,作出结论 例8-4分析结果
本例n1=39, n2=40,T=T1=1917;
计算得u=3.7023,查表得单侧P<0.0005;
拒绝H0,认为吸烟工人HbCO含量高于不吸 烟工人HbCO含量。
第三节:完全随机设计多个样本比 较的Kruskal-Wallis H检验
T=10(10+1)/2=55
T2=31
例: 两组比较的等级数据编秩
A组 : - 、、 +、 +、 +、 ++ 秩(i) : 1 2 4.5 4.5 4.5 8.5 秩和 : TA=25 (组间相同,求平均秩)
B组 : +、++、++、++、+++、+++ 秩(i) :4.5 8.5 8.5 8.5 11 12 秩和 : TB=53 (组内相同,不影响求秩和)
非参数检验的优缺点:
优点:
适用范围广 对数据要求不严 方法简便、易于理解和掌握
缺点:
损失信息、检验效能低
符合条件
首选参数检验
不符合条件
非参数检验
wk.baidu.com
第一节 配对样本比较的Wilcoxon 符号秩检验
Wilcoxon符号秩检验简介
符号秩检验由Wilcoxon于1945年提出;
应用:
• 配对样本差值的中位数与0比较; • 单个样本中位数与总体中位数(给定值)
95
—
新法 (3)
76 152 243 82 240 220 205 38 243 44 190
100
—
差值d (4)=(3)-(2)
16 10 48 2 -2 0 15 13 45 6 -46
5
—
例8-1:两种方法测量12份血清ALT测量结果
编号 (1)
1 2 3 4 5 6 7 8 9 10 11
例8-1分析结果
取负秩和为T,则T=11.5;
查T界值表得0.05<P<0.1;
结论:不拒绝H0,不能认为两种方法检测 ALT的结果有差别。
正态近似法:
n>25时,T分布近似正态分布可用正 态近似法作u检验:
u T T | T n(n 1) / 4 | 0.5
T
n(n 1)(2n 1) / 24
3.求秩号和,即将正、负秩号分别相加,正负秩号绝对值之
和应等于 n(n 1) / 2 ,可用以核对。
4. 检验统计量 T 取较小一个秩和(或任取),根据 T 值查附表 9 进行判断,该表左侧为对子数,表身内部 是秩和,与上端纵标目之概率相对应。 判断标准:
若 T 在上下界范围内时,P 大于相应的概率水平(如 0.05) 若 T 在上下界范围外时,P 小于相应的概率水平 若 T 等于界值时,P 等于相应的概率水平
配对设计两组处理效应的比较一
般采用配对t 检验,如果差数严重
偏离正态分布,可采用Wilcoxon符 号秩检验。
例8-1:两种方法测量12份血清ALT测量结果
编号 (1)
1 2 3 4 5 6 7 8 9 10 11
12
合计
原法 (2)
60 142 195 80 242 220 190 25 198 38 236
7 6 9 4
3
负秩 (6)
1.5
10
合计 —
—
—
54.5
11.5
1.检验假设
H0 : Md 0 H1 : Md 0;
2.编秩号
0.05
(1)剔去差数为 0 的数据;
(2)余下的 n 个差数按绝对值自小至大排秩号,但排好后秩号
要保持原差数的正负号;
(3)差数绝对值相等时,要以平均秩号表示;
例: 秩转换的基本方法
将两组比较原始数据(X)混合按大小编秩,如x 相同取平均秩, 分别对各组的秩求和(T). 甲组(x) 3 5 10 20 22 秩和 秩号 (i) 1 3 5 7 8 T1=24
乙组(x) 4 9 15 25 35
秩号(i) 2 4 6
9 10
总秩和 T N(N 1) / 2, N n1 n2
相同秩次较多时的校正值:
| T n(n 1) / 4 | 0.5
uc n(n 1)(2n 1) / 24
(ti3 ti ) / 48
注意:仍为非参数检验
2.配对设计等级资料的符号秩检验
1. 把等级从弱到强转换成秩,如某指标的检测结果 为-,+,++,+++,可转化为相应的秩次1,2, 3,4;
(1)- 45.3 (2) -1.09 0 1.09 4.17 5.75 7.86 7.96 9.07 11.86 22.07 25.75 42.07 —
正秩 (3)
1.5 3 4 5 6 7 8 9 10 11 64.5
负秩 (4)
1.5
1.5
假设检验过程
与配对资料符号秩检验基本相同。 此处先计算每一测量值与给定的值的差数; 然后对此差数进行秩转换,进行与配对资料符
第八章
秩转换的非参数检验 (Nonparametric Test)
主要内容
第一节 配对样本资料的Wilcoxon符号秩检验 第二节 两个独立样本比较的Wilcoxon秩和检验 第三节 完全随机设计多个样本比较的Kruskal-
Wallis H检验 第四节 随机区组设计多个样本的Friedman M检验
总秩和 : TA+TB=12(12+1)/2=78
A组(x) 3, 5, 7, 9 11
14
(i) 1 2 3 4 5
8.5
T=23.5
B组(x)
12 13 14 16 20 22
(i)
6 7 8.5 10 11 12 T=54.5
秩次:在一定程度上反映了原始数据大小(等级)的信息。 秩和:反映了一组数据在分布上的范围位置。 平均秩次:反映一组数据平均水平
• 秩转换:将某一变量值从小到大排序后, 获得每一变量值的秩次,并用此秩次代替 原有变量值的过程。
秩和检验的方法----秩转换
秩和检验的基本计算步骤: 1.将数据(x)按大小转化为秩次(i),用秩次的
大小反映变量值的大小。 2.对各组”秩次”求和,称为秩和(T =∑i)。 3.对各组秩和(T)做检验的方法称为秩和检验。
例8-3分析结果
本例n1=10, n2-n1=2,T=T1=141.5,满足查T 界值表的条件;
查表得单侧0.025<P<0.05;
拒绝H0 ,认为肺癌病人的RD值高于矽肺0 期病人的RD值。
2. 等级资料两样本比较
例8-4 吸烟和不吸烟工人HbCO含量比较
含量 吸烟 不吸烟 合计 秩范围 平均秩
似满足)t 检验或 F检验条件,当然选 t
检验或 F 检验,因为这时若选秩转换的
非参数检验,会降低检验效能。
秩转换的非参数检验
非参数检验是一类统计学方法的总称, 基于秩转换(rank transformation)的非 参数检验只是其中的一种。
秩转换的非参数检验
• 秩次(rank):某种测量值按照从小到大的 顺序排序后,每一测量值所对应的序号。
H0:两组患者RD值总体分布位置相同 H1:肺癌病人RD值高于矽肺0期工人RD值 α=0.05
(2)混合编秩,求统计量T
将两样本数据混合,从小到大排序; 对混合数据进行秩转换,获得每一观察值对应
的秩次; 观察值相等者取平均秩次; 分别计算两样本的秩和; 取样本量较小者为n1,其秩和作为统计量T; 两样本量相等者任取其中一个作为统计量T(通
12
原法 (2)
60 142 195 80 242 220 190 25 198 38 236
95
新法 (3)
76 152 243 82 240 220 205 38 243 44 190
100
差值d (4)=(3)-(2)
16 10 48 2 -2 0 15 13 45 6 -46
5
正秩 (5)
8 5 11 1.5
• 对分布的形状不加考虑,因此应注意分布 位置和分布(包括位置和形状)的区别。
• 分布形状相同或类似的两个总体分布位置 比较,可以简化地理解为两总体中位数的 比较。
1. 计量资料两样本比较
例8-3 两类肺病患者RD值比较
RD值 2.78 3.23 4.20 4.87 5.12 6.21 7.18 8.05 8.56 9.60
A组平均秩次=23.5/6=3.92
B组平均秩次=54.5/6=9.08
非参数检验的应用场合
• 计量资料: ➢不满足参数检验的条件,且无适当的变量变
换方法解决此问题时; ➢分布类型无法获知的小样本计量资料; ➢一端或两端存在不确定数值(如>1000IU)
的计量资料; • 等级资料:比较各组间等级强度的差别。
—
— 1917(T1) 1243(T2)
(1)建立检验假设,确定检验水准
H0:两组工人HbCO含量总体分布位置相同 H1:吸烟工人HbCO含量高于不吸烟工人 α=0.05
(2)混合编秩,求统计量T
确定各等级的合计人数; 根据各等级的合计人数确定其秩次范围和平
均秩; 分别计算两样本的秩和; 取样本量较小者为n1,其秩和(T1)作为统计
常取秩和较小者)。
T
较小例数组的秩和, min(R1 ,R 2 ),n1 n2
n1
n2
N n1 n2
n0 min( n1 ,n2 )
较小例数组的平均秩和为: n0(1 N)/2
若H0成立,T值应接近 n0(1 N)/2 ,若T值严重偏离
n0(1 N)/2,则提示H0可能是不正确的。小样本时,
参数检验
parametric test
要求:样本来自给定分 布的总体,该总体分布
依赖于若干参数: , 2
非参数检验
Non-parametric test
要求:对总体的分布 类型不作任何要求
统计分析: 参数估计 假设检验:参数
统计分析: 假设检验:
总体的分布位置
注意:如果已知其计量资料满足(或近
2. 求各对秩次的差值,省略所有差值为0的对子数, 令余下的有效对子数为n;
3. 按n个差值编正秩与负秩,求正秩和与负秩和 注意:由于等级资料相同秩多,此时小样本的检 验结果会存在偏性,最好用大样本。
3. 单个样本中位数和指定的 总体中位数比较
例8-2:12名工人尿氟含量与45.3比较
尿氟含量 (1) 44.21 45.30 46.39 49.47 51.05 53.16 53.26 54.37 57.16 67.37 71.05 87.37 合计