第八章 秩转换的非参数检验(孙振球)
公布规划-第八章秩转换的非参数检验
假设:M=45.3 求差、编秩、求和
查表:n=11、T=1.5,P<0.005,差别有统 东部 西部 北部
第一季度 第二季度 第三季度 第四季度
20.4
27.4
90
20.4
30.6
38.6
34.6
31.6
45.9
46.9
45
43.9
计学意义,可认为该厂工人的尿氟含量
高于当地正常人的尿氟含量。
**第二节 两个独立样本 比较的Wilcoxon秩和检验
本含量相等的资料)
补充2、各实验组与对照组 比较的秩和检验
1、各样本秩和从大到小排列
2、q | RT RC | sRT RC
n(na)(na 1)
s RT RC
6
3、查表下结论(此法仅适用于各组样本含量相
等的资料)
结束
7
29.0
9
36.0
12
—
38
—
5
6.5
1
9.0
2
12.5
3
18.0
5
24.0
8
—
19
—
5
*一、多样本比较的秩和检验
1.建立检验假设: H0:三个处理组总体分布相同; H1:三个总体的分布不同或不全相同。 =0.05。
2.计算 编秩:将各组由小到大排队,再将三个组的数据统一
编秩。 编秩中,
若有相同的数据在同一组内,其秩次按位置顺序编号; 若相同的数据在不同组内,则取其平均秩次。
20 10 48 2 -2 0 15 13 31 6 -36 5 T =54.5 T
8 5 11 1.5 -1.5
7 6 9 4 -10 3 =11.5
秩转换的非参数检验
(2)正态近似法u 检验 如果n超出附表10范 围,则用以下公式计算u值,进行u检验:
u T n1 (n1 n2 1) / 2 t 3 t j) ( j n1n2 (n1 n2 1) 1- 3 12 N N
( t C 1-
3 3 j
二、两组频数表或等级资料比较
例8-4 39名吸烟工人和40名不吸烟工人的碳氧血红蛋 白HbCO(%)含量见表8-6。问吸烟工人的HbCO(%)含量 是否高于不吸烟工人的HbCO(%)含量?
表8-6 吸烟工人和不吸烟工人的HbCO(%)含量比较 含量 吸烟 不吸烟 合 秩次 平均 秩和 工人 工人 计 范围 秩次 吸烟 不吸烟
(3)计算正负秩和: T = 54.5, T = 11.5 (4)确定检验统计量T 任取T 和 T 为T ,本例取T =11.5。 3.确定P 值,作出推论: (1) n≤50,查表法。本例n=11,查附表9得 T0.05, 为 ~56, 11 10
本例11.5在此范围内,故P >0.05,按α =0.05 水准,不拒绝Ho 还不能认为两法测定结果有差别。 (2) n>50,u 检验。
第八章
秩转换的非参数检验
非参数检验的概念: 非参数检验是指对原始资料无特殊要求(如正 态分布、总体方差相等)的一类检验方法,它不 是比较参数,而是比较分布的位置。不符合t 检验 和F检验的数值变量资料可用秩和检验,此外,秩 和检验还可用于两组或多组等级资料以及“开口” 资料的比较。等级相关也属于非参数检验。
表8-9 三种药物杀灭钉螺的死亡率(%)比较 甲药 乙药 丙药 死亡率 秩次 死亡率 秩次 死亡率 秩次 32.5 10 16.0 4 6.5 1 35.5 11 20.5 6 9.0 2 40.5 13 22.5 7 12.5 3 46.0 14 29.0 9 18.0 5 49.0 15 36.0 12 24.0 8 63 ─ 38 ─ 19 Ri ni 5 ─ 5 ─ 5
8.秩转换的非参数检验-10.14
11.5
一、配对样本差值的中位数和0比较 配对样本差值的中位数和 比较
附表9 T 界值表(配对比较的符号秩和检验用) 界值表(配对比较的符号秩和检验用) 单侧:0.05 0.025 0.01 0.005 N 双侧:0.10 0.05 0.02 0.010 5 0-15 .-. .-. .-. 6 2-19 0-21 .-. .-. 7 3-25 2-26 0-28 .-. 8 5-31 3-33 1-35 0-36 , 9 8-37 n=11,T=11.5 3-142 5-140 1-44 查表法: ①查表法: 10 10-45 8-47 5-50 3-52 11 13-53 10-56 7-59 5-61 当 n≤50 时 , 根 据 n 和 12 17-61 13-65 9-69 7-71 T 查 T 界值表 ( 附表 界值表( 13 21-70 17-74 12-79 0.05<P<0.10,按照 水准, 9-82 ,按照α=0.05水准,不 水准 14 25-80 21-84 15-90 12-93 9)。 ) 拒绝H30-90 拒绝 0,尚不能认为两组测定结果有 15 25-95 19-101 15-105 16 35-101 29-107 23-113 19-117 差别。 差别。 17 41-112 34-119 27-126 23-130 18 47-124 40-131 32-139 27-144 若统计量T值在某 界值范围内, 53-137 相应概率; 值在某T界值范围内 若统计量 值在某 界值范围内,P值 > 相应概率; 37-153 值 19 46-144 32-158 60-150 43-167 37-173 值恰好等于界值, 值 20相应概率; 若T值恰好等于界值,P值 = 相应概率; 52-158 值恰好等于界值 . . . . . . . . . 值在界值范围外, 值 相应概率。 若T值在界值范围外,P值 <. 相应概率。 值在界值范围外 50 466-809 434-841 397-878 373-902
秩转换的非参数检验
2)正态近似法:大样本时 (n≥50时), 可按式11-1计算统计量u值,作正态检验:
| T-n(n+1) / 4|-0.5 u=
n(n+1)(2n+1) / 24
(11-1)
如有相同秩次,应用校正公式:
u=
| T n(n 1) / 4 | 0.5
n(n 1)(2n 1) 1
24
48
(t
3 j
Tests of Normality
Kolmogorov-Smirnova
Statistic
差值
.420
df
Sig.
8
.000
a. Lilliefors Significance Correction
Shapiro-Wilk
Statistic
df
.628
8
Sig. .000
Tests of Normality
第八章 秩转换旳非参数检验
癌症. 1997;16(3):219
用改良旳Seldinger’s插管技术对8例临床及病理证明旳恶性滋养细胞 肿瘤进行选择性盆腔动脉插管灌注化疗。治疗前后hCG放免测定值。 采用t检验进行分析,治疗前后血hCG值经统计学处理有明显性差别。
1、资料类型 2、何种设计 3、统计措施
差值对数
Kolmogorov-Smirnova
Statistic df
Sig.
.372
8 .002
Shapiro-Wilk
Statistic df
.559
8
a. Lilliefors Significance Correction
Sig. .000
参数统计
(parametric statistics)
6.秩转换的非参数检验(10)
单个样本中位数和总体中位数比较
例 8-2 已知某地正常人尿氟含量的中位数为 45.30 mol/L 。今在 该地某厂随机抽取 12 名工人,测得尿氟含量见表 8-2 第(1)栏。问 该厂工人的尿氟含量是否高于当地正常人的尿氟含量?
表 8-2
尿 氟 含 量 ( 1) 44.21 45.30 46.39 49.47 51.05 53.16 53.26 57.37 63.16 67.37 71.05 87.37 合 计
= 0.05
编秩:
两组数据混合后按大小顺序编秩;
如遇相等数值,取平均秩次;
计算各组秩和,以例数较少组秩和为检验统计量T;
若两组例数相等,两组秩和均可为检验统计量。
问题
:为什么选择例数较少组秩和为检验统计量?
表 11.1 肺 血铁蛋白 31 68 237 174 457 492 199 515 599 238 炎 患 秩 1 11.5 19 16 23 24 18 25 26 20
结果 + ++ +++ ++++ 合计
正常人 18 2
铅工人 8 10 7 3 4
合计 26 12 7 3 4 52
秩次范围 平均秩次 正常秩和 铅组秩和 1-26 27-38 39-45 46-48 49-52 13.5 32.5 42.0 47.0 50.5 308 243 65 108 325 294 141 202 1070
20
32
u=4.493, P < 0.0005 故铅作业工人尿棕色素(1070/32=33.4)高于正常人(308/20=15.4)。
四、完全随机设计多个样本比较的 Kruskal-Waliiis检验
秩转换的非参数检验
参数检验
参数检验方法:t 检验,方差分析; 总体分布假定:各组样本所来自的总体为 正态分布(已知的分布形式),各组样本所 来自的总体方差齐性。
非参数检验
定义:不依赖于总体的分布类型,对样本 所来自总体的分布不作严格假定的统计推 断方法,称为非参数检验(nonparametric test)。直接对总体分布做假设检验。 又称为任意分布检验(distribution-free test)。
(1) 很低 低 中 偏高 高 合计
(2) 1 8 16 10 4
(3) 2 23 11 4 0
(4) 3 31 27 14 4 79
(5) 1~3 4~34 35~61 62~75 76~79 —
(6) 2 19 48 68.5 77.5 —
39(n1) 40(n2)
1917(T1) 1243(T2)
查T界值表。
(3)确定P值,作出结论
若n1≤10且n2-n1≤10,可通过查阅T界值表
(附表10)确定P值;
若两样本量不满足上述条件,则可采用正
态近似法作u检验,按公式(8-2)计算u值。
正态近似法
| T n 1(N 1)/2 | n 1 n 2(N 1) ( t j t j ) ) (1 3 12 N N
(通常取秩和较小者)。
, 较小例数组的秩和 n 1 n 2 T min(R1 ,R 2 ),n 1 n 2
N n1 n2 n0 min( n1 , n2 )
较小例数组的平均秩和为:
n0(1 N)/2
若H0成立,T值应接近 n0(1 N)/2 ,若T值严重偏离
n0(1 N)/2 ,则提示H0可能是不正确的。小样本时,
秩转换的非参数检验
非参数检验是相对于参数检验而言地.参数检验——如果总体分布为已知地数学形式,对其总体参数作假设检验.计量资料——正态分布——假设检验——检验、检验计量资料:不满足参数检验条件地假设检验方法,一变量变换,二非参数检验(等级资料)非参数检验对总体分布不作严格假定(任意分布检验)秩转换————推断一个总体表达分布位置地中位数(非参数)和已知、两个或多个总体地分布是否有差别.秩转换地非参数检验时先将数值变量资料自小到大,或等级资料从弱到强转换成秩后,再计算检验统计量,其特点是假设检验地结果对总体分布地形状差别不敏感,只对总体分布地位置差别敏感.文档来自于网络搜索配对样本比较地符号秩检验符号秩检验符号秩和检验——用于配对样本差值地中位数和比较——用于单个样本中位数和总体中位数比较配对样本差值地中位数和比较———————<—————————————目地是推断配对样本差值地总体中位数是否和有差别——即推断配对地两个相关样本所来自地两个总体中位数是否有差别.平均秩——相同秩—————————————>———————————单个样本中位数和总体中位数比较—————————————————————目地是推断样本所来自地总体中位数和某个已知地总体中位数是否有差别——用样本各变量值和地差值,即推断差值地总体中为数和是否有差别本法地原理()界值表制作地原理()正态近似法地原理第二节两个独立样本比较地秩和检验————————秩和检验()————用于推断计量资料或等级资料地两个独立样本所来自地两个总体分布是否有差别. ——————推断两个总体分布地位置是否有差别.原始数据地两样本比较————计量资料为原始数据频数表资料和等级资料地两样本比较————计量资料为频数表资料,是按数量区间分组————等级资料是按等级分组本法地原理界值表制作地原理正态近似法地原理、检验第三节完全随机设计多个样本比较地检验一、多个独立样本比较地检验————用于推断计量资料或等级资料地多个独立样本所来自地多个总体分布是否有差别.原始数据地多个样本比较————计数资料为原始数据——————————频数表资料和等级资料地多个样本比较————计量资料为频数表资料,是按数量区间分组————等级资料是按等级分组本法地原理界值表制作地原理地近似法原理多个独立样本两两比较地法检验————进一步推断两两总体分布位置不同——————————————————随机区组设计多个样本比较地检验多个相关样本比较地检验————用于推断随机区组设计地多个相关样本所来自地多个总体分布是否相等.、方法步骤————————————————————————————————、本法地原理()界值表制作地原理()近似法地原理————————————>或>——————————、近似法二、多个相关样本两两比较地检验——————进一步推断两两总体分布位置不同秩转换地非参数检验参数检验————如果总体分布为已知地数学形式,对其总体参数作检验假设非参数检验(任意分布检验)————对总体分布不作严格假定,直接对总体分布作假设检验秩转换地非参数检验————推断一个总体表达分布位置地中位数(非参数)和已知、两个或多个总体地分布是否有差别.————先将数值变量从小到大,或等级从弱到强转换成秩后,再计算检验统计量.————假设检验地结果对总体分布地形状差别不敏感,只对总体分布地位置差别铭感.应用范围:——————对于计量资料不满足正态和方差齐性条件地小样本资料分布不明地小样本资料一端或两端是不确定数值地资料——————对于等级资料若选行*列表资料地检验,只能推断构成比差别选秩转换地非参数检验,可推断等级强度差别注意:如果已知其计量资料满足(或近似满足)检验或检验条件,当然选检验或检验,因为这时若选秩转换地非参数检验,会降低检验效能.文档来自于网络搜索配对样本比较地符号秩检验(符号秩和检验)————用于配对样本差值地中位数和比较;————用于单个样本中位数和总体中位数比较配对样本差值地中位数和比较————目地是推断配对样本差值地总体中位数是否和有差别——即推断配对地两个相关样本所来自地两个总体中位数是否有差别检验步骤()建立检验假设,确定检验水平()求检验统计量值()确定值,作出推断结论——————————————《时,查界值表——————————————>时,正态近似法作检验注意:配对等级资料采用符号秩和检验最好选用大样本单个样本中位数和总体中位数比较————目地是推断样本所来自地总体中位数和某个已知地总体中位数是否有差别————用样本各变量值和地差值,即推断差值地总体中位数和是否有差别第二节两个独立样本比较地秩和检验————用于推断两个独立样本所来自地两个总体分布是否有差别.————目地是推断两个总体分布地位置是否有差别、原始数据地两样本比较——————————《和《时,查界值表——————————> 或> 时,用正态近似法作检验频数表资料和等级资料地两样本比较————计数资料为频数表资料,是按数量区间分组————等级资料是按等级分组第三节完全随机设计多个样本比较地检验一、多个独立样本比较地检验————用于推断计量资料或等级资料地多个独立样本所来自地多个总体分布是否有差别.、原始数据地多个样本比较—————————————————或————查界值表———————且最小样本地例数大于或>时,查界值表、频数表资料和等级资料地多个样本比较二、多个独立样本两两比较地法检验————————————进一步推断两两总体分布位置不同第四节随机区组设计多个样本比较地检验一、多个相关样本比较地检验————用于推断随机区组设计地多个相关样本所来自地多个总体分布是否有差别.————————————————《和《时,查界值表————————————————>或>时,用近似法多个相关样本两两比较地检验——————进一步推断两两总体分布位置不同————检验。
秩转换的非参数检验
秩和(rank sum)
同组秩次之和。编秩 NhomakorabeaA组: - 、、+、+、+、++ B组: +、++、++、++、+++、+++
A组:- ± + + + 1 2 3 4 5
B组: + 6
++ 7
++ ++ ++ +++ +++ 8 9 10 11 12
第二节 两独立样本差别的秩和检验 Wilcoxon rank sum test
对于计量数据,如果资料方差相等,且服从
正态分布,就可以用t检验比较两样本均数。如
果此假定不成立或不能确定是否成立,就应采用
秩和检验来分析两样本是否来自同一总体。
Wilcoxon秩和检验(Wilcoxon rank sum test),用于推 断计量资料或等级资料的两个独立样本所来自的两个总体分 布是否有差别。 秩和检验的目的是推断两个总体分布的位置是否有差别, 如要推断两个不同人群的某项指标值的大小是否有差别或哪
秩 吸烟工人
和 不吸烟工人
(7) (6) (8)=(3) = (2) (6) 2 4 152 437 768 528 685 274 310 0 1917(T1) 1243(T2)
如果两 总体分 布相同
基本思想 两样本来自同一总体
任一组秩和不应太大或太小
T
与平均秩和 n0 (1 N ) / 2 应相差不大
【孙振球第三版】医学统计学复习题
【孙振球第三版】医学统计学复习题1、总体:根据研究目的确定的同质观察单位的全体。
2、有限总体:是指空间、时间范围限制的总体。
4、样本:从总体中随机抽取部分观察单位,其实测值的集合。
5、计量资料:描述指标,对每个观察单位用定量的方法测量某项指标量的大小所得的资料,有计量单位。
6、计数资料:相对数,将观察单位按性质或类别分类,然后清点各组观察单位的个数所得资料。
7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。
9、平均数:描述一组变量值的集中位置或水平。
常用的平均数有算术平均数、几何平均数和中位数。
10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。
11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。
检验水平,就是预先规定的允许犯I 型错误概率的最大值。
I 型错误概率大小也用α表示,α可取单尾亦可取双尾。
12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。
其概率大小用β表示,β只取单尾,β值的大小一般未知,须在知道两总体差值δ、α及n时,才能算出。
13、相对数:两个有联系的指标之比,是分类变量常用的描述性统计指标,常用两个分类的绝对数之比表示相对数的大小。
如率、构成比、比等。
14、率:强度相对数,说明某现象发生的频率或强度。
15、构成比:结构相对数字,表示事物内部某一部分的个体与该事物各个部分个体数的和之比。
用来说明各构成部分在总体所占的比重或分布。
16、相对比:简称比,是两个相关联指标之比,说明两指标间的比例关系。
两指标可以性质相同,也可以性质不同,通常以倍数或百分数表示。
秩转换的非参数检验(第8章)
60 142 195 80 242 220 190 25 198 38 236 95
—
76 152 243 82 240 220 205 38 243 44 190 100
—
16 10 48 2 -2 0 15 13 45 6 -46 5
—
Байду номын сангаас
8 5 11 1.5 1.5 7 6 9 4 10 3
54.5 11.5
T 不变,
3
T n ( n 1 )( 2 n 1 ) / 24 ( t j t j ) / 48 。 据中心极限定理,当 u T T T n 很大时, T 分布近似正态分布,于 T n (n 1) / 4 n ( n 1 )( 2 n 1 ) / 24 ( t j t j ) / 48
14
单侧: 双侧:
n>50时,可用正态近似法作u检验。
u
T n (n 1) / 4 n ( n 1 )( 2 n 1 ) 24 (t j t j )
3
48
t j ( j 1 , 2 , ) 为第 j 个相同秩的个数。
15
2. 单个样本中位数与总体中位数比较
对策: 尝试变量变换使其满足参数检验条件 采用非参数检验
4
非参数检验 (nonparametric test)
对总体分布不作任何假定,不受总体分布限 制,适用范围广。 又称任意分布检验(distribution-free test)。 对两个或多个总体的分布作比较。对分布的 形状差别不敏感,对分布的位置差别敏感。 将原始数据转换为秩(rank),对秩进行检 验—秩转换的非参数检验。
符合参数检验的资料,首选参数检验; 如果采用非参数检验,会降低检验效率。
第八章秩转换的非参数检验(NonparametricTest)
表 8-1 12 份血清用原法和新法测血清谷-丙转氨酶(nmol· S-1/L)结果的比较
编号
原法
新法
差 值d
正秩
负秩
(1)
(2)
(3)
(4)=(3)-(2)
(5)
(6)
1
60
76
16
8
2
142
152
10
5
3
195
243
48
11
4
80
82
2
1.5
5
242
240
-2
1.5
6
220
220
0
7
190
205
第三节
完全随机设计多个样本比较的 Kruskal-Wallis H 检验
一、多个独立样本比较的 Kruskal-Wallis H 检验
Kruskal-Wallis H 检验,用于推断计量资料 或等级资料的多个独立样本所来自的多个总体 分布是否有差别。在理论上检验假设 H0 应为多 个总体分布相同,即多个样本来自同一总体。由 于 H 检验对多个总体分布的形状差别不敏感,故 在实际应用中检验假设 H0 可写作多个总体分布 位置相同。对立的备择假设 H1为多个总体分布位 置不全相同。
用 Wilcoxon 符号秩检验。
检验步骤
H0 :尿氟含量的总体中位数M 45.30 H1 : M 45.30
0.05
据表8-2第(3)、(4)栏,取T=1.5。
有效差值个数n 11 。据n 11 和T 1.5 查 附表 9(P534),得单侧P 0.005 ,按 0.05 水 准拒绝H0 ,接受H1 ,可认为该厂工人的尿氟 含量高于当地正常人的尿氟含量。
秩转换的非参数检验
A法
B法
差值 d 正秩
负秩
3 0 .6
3 0 .6
0
--
--
5 9 .9
6 3 .1
-3 .2
3
4 6 .0
5 8 .0
-1 2 .0
6
2 3 .0
1 0 .9
1 2 .1
7
2 0 .3
3 3 .7
-1 3 .4
9 .5
4 8 .6
9 9 .5
-5 0 .9
11
2 5 .0
2 4 .4
0 .6
1
2 3 .4
3 6 .2
-1 2 .8
8
4 4 .1
4 5 .2
-1 .1
2
3 9 9 .8 4 0 4 .1 -4 .3
4
2 5 .9
3 9 .3
-1 3 .4
9 .5
5 3 5 .6 5 4 4 .8 -9 .2
5
——
——
——
8
58
可编辑ppt
9
秩和分布的特点
对子号
1 2 3
N = 3 时两样本配对比较
10
•秩和分布的特点 (1)离散型的对称分布; (2)N一定时,秩和分布也一定; (3)靠近中央的频数较多; (4)当N足够大时,秩和分布逼近正态分布。
可编辑ppt
11
配对资料的秩和均数:
T+与T-是以T为中心的两个对称点 例11.2资料:T= 11(11 + 1)/ 4 = 33 T+ = 8 , T- = 58, 差值均为 25。
可编辑ppt
4
一、秩和检验的基本思想
总体A
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
8
非参检验资料的几种类型
一、成组设计两样本比较的秩和检验 ( Wilcoxon 两样本比较法) 二、配对设计差值的符号秩和检验 (Wilcoxon 配对法) 三、成组设计多个样本比较的秩和检验 (Kruskal-Wallis法) 四、随机区组设计资料的秩和检验 (Friedman法)
9
一、两独立样本比较的秩和检验(原始数据)
3
方法小节
非参数检验
二项分布检验
用途
检验抽取样本所依赖的总体是否服从特定 概率的二项分布 检验抽取样本所依赖的总体是否服从某一 理论分布 检验一个总体位置参数是否等于某假定值 检验一个总体位置参数是否等于某假定值 检验配对数据的总体位置参数是否相同 检验两个总体位置参数是否相同 检验多个总体是否相同 检验配伍设计多个总体是否相同 检验两个变量的相关性 无
6
非参数检验
3. 成组设计多 个样本的比较!
• 多个样本所来自的总体均数的比较: • Kruskal-Wallis H: 最为常用的多个样本 所来自的总体比较的秩和检验 • Median/中位数:检验效能最低 • Jonckheere-Terpstra:用于双向有序变 量资料分析时,检验效能高于KruskalWallis H检验
7
非参数检验
4. 配伍设计多个 样本的比较!
• 多组配伍/相关样本所来自总体均数的检验: • Friedman: M检验,k个相关样本最常用的检验 ; • Kendall’s W检验:Kendall协和系数检验,表示 k个指标间相互关联的程度; • Cochran’s Q检验:适用于二分类变量,是两相 关样本McNemar在多个样本情况下的推广。
11
资料的读数中,“>60”不是确定值, 因而只能采用非参数检验的方法进 行处理!
12
资料的读数中,如果“60” 是确定值, 该资料能够采用 参数检验的方法进行处理吗!
13
14
发现“确定” 按钮没有激活 的情况,需要 考虑是否存在 未完成的选项!
15
16
两个独立样本 Mann-Whitney检验
第八章
秩转换的非参数检验
(nonparametric test)
非参检验
参数检验无法使用的情况下: 1. 资料分布不满足参数检验条件; 2. 不满足方差齐性; 3. 数据不能精确测量,如“>50mg”; 4. 结局变量为有序分类的资料。
2
非参检验
• 经典统计的多数检验都假定了总体的背景 分布。 • 但也有些没有假定总体分布的具体形式, 仅仅依赖于数据观测值的相对大小(秩) 或零假设下等可能的概率等和数据本身的 具体总体分布无关的性质进行检验。 • 这都称为非参数检验 • 在资料能够进行参数检验或者能够通过转 换符合参数检验的条件下,首选参数检验 ,因为非参仅仅考虑参数的位置分布,而 忽略了详细的信息,检验效能降低。
10
例1:两独立样本比较的秩和检验
• 某实验室观察某种抗癌新药治疗小鼠移 植性肿瘤的疗效,两组各10只小鼠,以 生存日数作为观察指标,结果如下,试 检验两组小鼠生存日数有无差别?
试验组:24 26 27 30 32 34 36 40 60天以上 对照组:4 6 7 9 10 10 12 13 16 16
Friedman检验 秩相关及其检验
非参数检验
1. 成组设计两 样本的比较!
Байду номын сангаас
• 非参数检验的方法选择多样: • 独立两样本所来自总体比较: • Wilconxon rank sum test/ Wilconxon Mann-Whitney U • Kolmogorov-Smimov Z: 检验样本是否来自同一总体 • Moses extreme reactions: 当样本中同时含有正值和 负值时选用的方法。 • Wald-Wolfowitz runs:检验两个样本所在总体的任 一点分布情况是否相同
检验步骤 计算Wilcoxon统计量W和Mann-Whitney统计量U 分别求出两个样本的秩的和,Wx和Wy。若m<n,检 验统计量W=Wx ;若m>n,统计量W=Wy ;若m=n ,统计量为第一个变量值所在样本组的W值 Mann-Whitney统计量定义为 U W k ( k 1) 2
参数检验
KolmogorovSmirnov 检验(K-S检验)
符号检验 Wilcoxon符号秩检验 两个配对样本 Wilcoxon符号秩检验 两个独立样本 Mann-Whitney检验 k个独立样本 Kruskal-Wallis检验
2008年8月
无 单总体均值的t或z检验 单总体均值的t或z检验 双总体均值的t或z检验 (匹配样本) 双总体均值的t或z检验 (独立样本) 单因素方差分析 配伍设计方差分析 线性相关系数及其检验
(k为W对应样本组的样本数据个数)
小样本情况下,统计量服从 Mann-Whitney 分布, 大样本情况下,近似服从正态分布,检验统计量为
z
根据P值作出决策
U nm 2 mn( m n 1) 12
Mann-Whitney 检验
18
一、两独立样本比较的秩和检验(频数资料)
数据格式:1个分组变量“group”,1个反应变量
5
非参数检验
2. 配对设计两 样本的比较!
• 配对/相关两样本所来自的总体的比较: • Wilcoxon: Wilcoxon符号秩和检验,为相关样本 差值的秩和检验,系统默认值; • Sign:符号检验,利用正负号检验,效率低 • McNemar: 常用的配对卡方检验,只用于两分类 资料,检验两组间分类有差异的频数,不考虑相 同分类的频数; • Marginal Homogeneity: 与McNemar类似,只分析 有差异的情况!
“x”,1个频数变量“freq”。
步骤:
数据格式:1个分组变量“group
”,1个反应变量 “x ”。
步骤:
Analyze
Nonparametric Tests
2 Independent Samples…
Test Variable List: x
Grouping Variable: group Test Type: Mann-Whitney U