第八章 秩转换的非参数检验(孙振球)
公布规划-第八章秩转换的非参数检验
假设:M=45.3 求差、编秩、求和
查表:n=11、T=1.5,P<0.005,差别有统 东部 西部 北部
第一季度 第二季度 第三季度 第四季度
20.4
27.4
90
20.4
30.6
38.6
34.6
31.6
45.9
46.9
45
43.9
计学意义,可认为该厂工人的尿氟含量
高于当地正常人的尿氟含量。
**第二节 两个独立样本 比较的Wilcoxon秩和检验
本含量相等的资料)
补充2、各实验组与对照组 比较的秩和检验
1、各样本秩和从大到小排列
2、q | RT RC | sRT RC
n(na)(na 1)
s RT RC
6
3、查表下结论(此法仅适用于各组样本含量相
等的资料)
结束
7
29.0
9
36.0
12
—
38
—
5
6.5
1
9.0
2
12.5
3
18.0
5
24.0
8
—
19
—
5
*一、多样本比较的秩和检验
1.建立检验假设: H0:三个处理组总体分布相同; H1:三个总体的分布不同或不全相同。 =0.05。
2.计算 编秩:将各组由小到大排队,再将三个组的数据统一
编秩。 编秩中,
若有相同的数据在同一组内,其秩次按位置顺序编号; 若相同的数据在不同组内,则取其平均秩次。
20 10 48 2 -2 0 15 13 31 6 -36 5 T =54.5 T
8 5 11 1.5 -1.5
7 6 9 4 -10 3 =11.5
秩转换的非参数检验
(2)正态近似法u 检验 如果n超出附表10范 围,则用以下公式计算u值,进行u检验:
u T n1 (n1 n2 1) / 2 t 3 t j) ( j n1n2 (n1 n2 1) 1- 3 12 N N
( t C 1-
3 3 j
二、两组频数表或等级资料比较
例8-4 39名吸烟工人和40名不吸烟工人的碳氧血红蛋 白HbCO(%)含量见表8-6。问吸烟工人的HbCO(%)含量 是否高于不吸烟工人的HbCO(%)含量?
表8-6 吸烟工人和不吸烟工人的HbCO(%)含量比较 含量 吸烟 不吸烟 合 秩次 平均 秩和 工人 工人 计 范围 秩次 吸烟 不吸烟
(3)计算正负秩和: T = 54.5, T = 11.5 (4)确定检验统计量T 任取T 和 T 为T ,本例取T =11.5。 3.确定P 值,作出推论: (1) n≤50,查表法。本例n=11,查附表9得 T0.05, 为 ~56, 11 10
本例11.5在此范围内,故P >0.05,按α =0.05 水准,不拒绝Ho 还不能认为两法测定结果有差别。 (2) n>50,u 检验。
第八章
秩转换的非参数检验
非参数检验的概念: 非参数检验是指对原始资料无特殊要求(如正 态分布、总体方差相等)的一类检验方法,它不 是比较参数,而是比较分布的位置。不符合t 检验 和F检验的数值变量资料可用秩和检验,此外,秩 和检验还可用于两组或多组等级资料以及“开口” 资料的比较。等级相关也属于非参数检验。
表8-9 三种药物杀灭钉螺的死亡率(%)比较 甲药 乙药 丙药 死亡率 秩次 死亡率 秩次 死亡率 秩次 32.5 10 16.0 4 6.5 1 35.5 11 20.5 6 9.0 2 40.5 13 22.5 7 12.5 3 46.0 14 29.0 9 18.0 5 49.0 15 36.0 12 24.0 8 63 ─ 38 ─ 19 Ri ni 5 ─ 5 ─ 5
8.秩转换的非参数检验-10.14
11.5
一、配对样本差值的中位数和0比较 配对样本差值的中位数和 比较
附表9 T 界值表(配对比较的符号秩和检验用) 界值表(配对比较的符号秩和检验用) 单侧:0.05 0.025 0.01 0.005 N 双侧:0.10 0.05 0.02 0.010 5 0-15 .-. .-. .-. 6 2-19 0-21 .-. .-. 7 3-25 2-26 0-28 .-. 8 5-31 3-33 1-35 0-36 , 9 8-37 n=11,T=11.5 3-142 5-140 1-44 查表法: ①查表法: 10 10-45 8-47 5-50 3-52 11 13-53 10-56 7-59 5-61 当 n≤50 时 , 根 据 n 和 12 17-61 13-65 9-69 7-71 T 查 T 界值表 ( 附表 界值表( 13 21-70 17-74 12-79 0.05<P<0.10,按照 水准, 9-82 ,按照α=0.05水准,不 水准 14 25-80 21-84 15-90 12-93 9)。 ) 拒绝H30-90 拒绝 0,尚不能认为两组测定结果有 15 25-95 19-101 15-105 16 35-101 29-107 23-113 19-117 差别。 差别。 17 41-112 34-119 27-126 23-130 18 47-124 40-131 32-139 27-144 若统计量T值在某 界值范围内, 53-137 相应概率; 值在某T界值范围内 若统计量 值在某 界值范围内,P值 > 相应概率; 37-153 值 19 46-144 32-158 60-150 43-167 37-173 值恰好等于界值, 值 20相应概率; 若T值恰好等于界值,P值 = 相应概率; 52-158 值恰好等于界值 . . . . . . . . . 值在界值范围外, 值 相应概率。 若T值在界值范围外,P值 <. 相应概率。 值在界值范围外 50 466-809 434-841 397-878 373-902
秩转换的非参数检验
秩转换的非参数检验基本概念1.参数检验方法(parametric test):总体分布类型已知的条件下对其参数进行估计或检验。
(如t-test, F- test)2.非参数检验方法(nonparametric test):一种不依赖总体分布的具体形式,也不对参数进行估计或检验的统计方法来分析此类资料这种方法不受总体参数的影响,检验的是分布或分布位置,而不是参数。
这样的检验方法称为非参数检验(如基于秩次的检验)3.秩次(rank)):秩统计量,是指全部观察值按某种顺序排列的位序。
在一定程度上反映了等级的高低。
4.秩和(rank sum):同组秩次之和。
在一定程度上反映了等级的分布位置非参数检验的优缺点:优点:无严格的条件限制,且多数非参数统计方法较为简单,易于理解和掌握,应用范围广缺点:对适宜参数统计的资料,若用非参数统计处理,常损失部分信息,降低检验效能。
总结:因此对适合参数统计条件的资料或经变量变换后适合参数统计的资料,应最好用参数统计。
但资料不具备用参数统计的条件时,非参数统计是很有效的分析方法适用范围:(1)总体分布为偏态或分布形式未知的计量资料(尤其在n<30的情况下)。
(2)等级资料。
(3)个别数据偏大或数据的某一端无确定的数值。
(4)各总体方差不齐。
检验步骤1、检验假设H0:差值的总体中位数Md=0 H1:差值的总体中位数Md≠0 α=0.052、求差值3、编秩:依差值的绝对值从小到大编秩遇差值为0的对子,舍去不计,同时样本量减一遇差值绝对值相等则取平均秩,称为相同秩(ties)然后按差值的正负对秩次冠以正负号4、求检验统计量:任取正秩和或负秩和为T5、确定P值并做出统计推断(查附表9,内大外小原则)正态近似法(n>50时)超出附表9范围,可用正态近似法作u检验。
两样本比较的秩和检验基本思想:如果H0 成立,即两组分布位置相同,则A组的实际秩和应接近理论秩和n1(N+1)/2; (B组的实际秩和应接近理论秩和n2(N+1)/2).或相差不大,差值很大的概率应很小。
统计学 秩转换的非参数检验
注意
配对等级资料采用符号秩检验 最好选用大样本。
2.单个样本中位数和总体中位数比较
目的是推断样本所来自的总体中位数M 和某个已知的总体中位数M0是否有差别。用 样本各变量值和M0的差值,即推断差值的总 体中位数和0是否有差别。方法步骤见例8-2。
应用范围:
对于计量资料: 1. 不满足正态和方差齐性条件的小样本资料; 2. 分布不明的小样本资料; 3. 一端或二端是不确定数值(如<0.5、>5.0等) 的资料(必选); 对于等级资料: χ2 若选行×列表资料的 检验,只能推断构成比差 别,而选秩转换的非参数检验,可推断等级强 度差别。
注意:如果已知其计量资料满足( 注意:如果已知其计量资料满足(或近似 满足) 检验条件, 满足)t 检验或 F检验条件,当然选 t 检 检验, 验或 F检验,因为这时若选秩转换的非 参数检验,会降低检验效能。 参数检验,会降低检验效能。
2 3.5 6
• 上面 组和B组中各有五个原始值,按顺序排列: 上面A组和 组中各有五个原始值 按顺序排列: 组和 组中各有五个原始值, 最小值设为1, 最小值设为 ,再按绝对值大小对余下的变量逐 个排序,最大值为两组变量个数之和10。依次 个排序,最大值为两组变量个数之和 。 可得1, , 可得 ,2,3.5, 3.5, 5, 6, 7, 8, 9, 10。这10 个序号 。 即是秩次。 组秩和就是等于 即是秩次。A组秩和就是等于 3.5+5+8+9+10=39.5,B组秩和就是等于 , 组秩和就是等于 1+2+3.5+6+7=19.5。从两组的原始变量值也可以 。 初步看出: 组偏大 组偏大, 组偏小 组偏小。 初步看出:A组偏大,B组偏小。现在得出的秩 和也是A组大于 组大于B组 和也是 组大于 组,与由变量值所观察到的一 致。
秩转换的非参数检验
参数检验
参数检验方法:t 检验,方差分析; 总体分布假定:各组样本所来自的总体为 正态分布(已知的分布形式),各组样本所 来自的总体方差齐性。
非参数检验
定义:不依赖于总体的分布类型,对样本 所来自总体的分布不作严格假定的统计推 断方法,称为非参数检验(nonparametric test)。直接对总体分布做假设检验。 又称为任意分布检验(distribution-free test)。
(1) 很低 低 中 偏高 高 合计
(2) 1 8 16 10 4
(3) 2 23 11 4 0
(4) 3 31 27 14 4 79
(5) 1~3 4~34 35~61 62~75 76~79 —
(6) 2 19 48 68.5 77.5 —
39(n1) 40(n2)
1917(T1) 1243(T2)
查T界值表。
(3)确定P值,作出结论
若n1≤10且n2-n1≤10,可通过查阅T界值表
(附表10)确定P值;
若两样本量不满足上述条件,则可采用正
态近似法作u检验,按公式(8-2)计算u值。
正态近似法
| T n 1(N 1)/2 | n 1 n 2(N 1) ( t j t j ) ) (1 3 12 N N
(通常取秩和较小者)。
, 较小例数组的秩和 n 1 n 2 T min(R1 ,R 2 ),n 1 n 2
N n1 n2 n0 min( n1 , n2 )
较小例数组的平均秩和为:
n0(1 N)/2
若H0成立,T值应接近 n0(1 N)/2 ,若T值严重偏离
n0(1 N)/2 ,则提示H0可能是不正确的。小样本时,
秩转换的非参数检验
非参数检验是相对于参数检验而言地.参数检验——如果总体分布为已知地数学形式,对其总体参数作假设检验.计量资料——正态分布——假设检验——检验、检验计量资料:不满足参数检验条件地假设检验方法,一变量变换,二非参数检验(等级资料)非参数检验对总体分布不作严格假定(任意分布检验)秩转换————推断一个总体表达分布位置地中位数(非参数)和已知、两个或多个总体地分布是否有差别.秩转换地非参数检验时先将数值变量资料自小到大,或等级资料从弱到强转换成秩后,再计算检验统计量,其特点是假设检验地结果对总体分布地形状差别不敏感,只对总体分布地位置差别敏感.文档来自于网络搜索配对样本比较地符号秩检验符号秩检验符号秩和检验——用于配对样本差值地中位数和比较——用于单个样本中位数和总体中位数比较配对样本差值地中位数和比较———————<—————————————目地是推断配对样本差值地总体中位数是否和有差别——即推断配对地两个相关样本所来自地两个总体中位数是否有差别.平均秩——相同秩—————————————>———————————单个样本中位数和总体中位数比较—————————————————————目地是推断样本所来自地总体中位数和某个已知地总体中位数是否有差别——用样本各变量值和地差值,即推断差值地总体中为数和是否有差别本法地原理()界值表制作地原理()正态近似法地原理第二节两个独立样本比较地秩和检验————————秩和检验()————用于推断计量资料或等级资料地两个独立样本所来自地两个总体分布是否有差别. ——————推断两个总体分布地位置是否有差别.原始数据地两样本比较————计量资料为原始数据频数表资料和等级资料地两样本比较————计量资料为频数表资料,是按数量区间分组————等级资料是按等级分组本法地原理界值表制作地原理正态近似法地原理、检验第三节完全随机设计多个样本比较地检验一、多个独立样本比较地检验————用于推断计量资料或等级资料地多个独立样本所来自地多个总体分布是否有差别.原始数据地多个样本比较————计数资料为原始数据——————————频数表资料和等级资料地多个样本比较————计量资料为频数表资料,是按数量区间分组————等级资料是按等级分组本法地原理界值表制作地原理地近似法原理多个独立样本两两比较地法检验————进一步推断两两总体分布位置不同——————————————————随机区组设计多个样本比较地检验多个相关样本比较地检验————用于推断随机区组设计地多个相关样本所来自地多个总体分布是否相等.、方法步骤————————————————————————————————、本法地原理()界值表制作地原理()近似法地原理————————————>或>——————————、近似法二、多个相关样本两两比较地检验——————进一步推断两两总体分布位置不同秩转换地非参数检验参数检验————如果总体分布为已知地数学形式,对其总体参数作检验假设非参数检验(任意分布检验)————对总体分布不作严格假定,直接对总体分布作假设检验秩转换地非参数检验————推断一个总体表达分布位置地中位数(非参数)和已知、两个或多个总体地分布是否有差别.————先将数值变量从小到大,或等级从弱到强转换成秩后,再计算检验统计量.————假设检验地结果对总体分布地形状差别不敏感,只对总体分布地位置差别铭感.应用范围:——————对于计量资料不满足正态和方差齐性条件地小样本资料分布不明地小样本资料一端或两端是不确定数值地资料——————对于等级资料若选行*列表资料地检验,只能推断构成比差别选秩转换地非参数检验,可推断等级强度差别注意:如果已知其计量资料满足(或近似满足)检验或检验条件,当然选检验或检验,因为这时若选秩转换地非参数检验,会降低检验效能.文档来自于网络搜索配对样本比较地符号秩检验(符号秩和检验)————用于配对样本差值地中位数和比较;————用于单个样本中位数和总体中位数比较配对样本差值地中位数和比较————目地是推断配对样本差值地总体中位数是否和有差别——即推断配对地两个相关样本所来自地两个总体中位数是否有差别检验步骤()建立检验假设,确定检验水平()求检验统计量值()确定值,作出推断结论——————————————《时,查界值表——————————————>时,正态近似法作检验注意:配对等级资料采用符号秩和检验最好选用大样本单个样本中位数和总体中位数比较————目地是推断样本所来自地总体中位数和某个已知地总体中位数是否有差别————用样本各变量值和地差值,即推断差值地总体中位数和是否有差别第二节两个独立样本比较地秩和检验————用于推断两个独立样本所来自地两个总体分布是否有差别.————目地是推断两个总体分布地位置是否有差别、原始数据地两样本比较——————————《和《时,查界值表——————————> 或> 时,用正态近似法作检验频数表资料和等级资料地两样本比较————计数资料为频数表资料,是按数量区间分组————等级资料是按等级分组第三节完全随机设计多个样本比较地检验一、多个独立样本比较地检验————用于推断计量资料或等级资料地多个独立样本所来自地多个总体分布是否有差别.、原始数据地多个样本比较—————————————————或————查界值表———————且最小样本地例数大于或>时,查界值表、频数表资料和等级资料地多个样本比较二、多个独立样本两两比较地法检验————————————进一步推断两两总体分布位置不同第四节随机区组设计多个样本比较地检验一、多个相关样本比较地检验————用于推断随机区组设计地多个相关样本所来自地多个总体分布是否有差别.————————————————《和《时,查界值表————————————————>或>时,用近似法多个相关样本两两比较地检验——————进一步推断两两总体分布位置不同————检验。
秩转换的非参数检验
秩和(rank sum)
同组秩次之和。编秩 NhomakorabeaA组: - 、、+、+、+、++ B组: +、++、++、++、+++、+++
A组:- ± + + + 1 2 3 4 5
B组: + 6
++ 7
++ ++ ++ +++ +++ 8 9 10 11 12
第二节 两独立样本差别的秩和检验 Wilcoxon rank sum test
对于计量数据,如果资料方差相等,且服从
正态分布,就可以用t检验比较两样本均数。如
果此假定不成立或不能确定是否成立,就应采用
秩和检验来分析两样本是否来自同一总体。
Wilcoxon秩和检验(Wilcoxon rank sum test),用于推 断计量资料或等级资料的两个独立样本所来自的两个总体分 布是否有差别。 秩和检验的目的是推断两个总体分布的位置是否有差别, 如要推断两个不同人群的某项指标值的大小是否有差别或哪
秩 吸烟工人
和 不吸烟工人
(7) (6) (8)=(3) = (2) (6) 2 4 152 437 768 528 685 274 310 0 1917(T1) 1243(T2)
如果两 总体分 布相同
基本思想 两样本来自同一总体
任一组秩和不应太大或太小
T
与平均秩和 n0 (1 N ) / 2 应相差不大
【孙振球第三版】医学统计学复习题
【孙振球第三版】医学统计学复习题1、总体:根据研究目的确定的同质观察单位的全体。
2、有限总体:是指空间、时间范围限制的总体。
4、样本:从总体中随机抽取部分观察单位,其实测值的集合。
5、计量资料:描述指标,对每个观察单位用定量的方法测量某项指标量的大小所得的资料,有计量单位。
6、计数资料:相对数,将观察单位按性质或类别分类,然后清点各组观察单位的个数所得资料。
7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。
9、平均数:描述一组变量值的集中位置或水平。
常用的平均数有算术平均数、几何平均数和中位数。
10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。
11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。
检验水平,就是预先规定的允许犯I 型错误概率的最大值。
I 型错误概率大小也用α表示,α可取单尾亦可取双尾。
12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。
其概率大小用β表示,β只取单尾,β值的大小一般未知,须在知道两总体差值δ、α及n时,才能算出。
13、相对数:两个有联系的指标之比,是分类变量常用的描述性统计指标,常用两个分类的绝对数之比表示相对数的大小。
如率、构成比、比等。
14、率:强度相对数,说明某现象发生的频率或强度。
15、构成比:结构相对数字,表示事物内部某一部分的个体与该事物各个部分个体数的和之比。
用来说明各构成部分在总体所占的比重或分布。
16、相对比:简称比,是两个相关联指标之比,说明两指标间的比例关系。
两指标可以性质相同,也可以性质不同,通常以倍数或百分数表示。
秩转换的非参数检验(第8章)
60 142 195 80 242 220 190 25 198 38 236 95
—
76 152 243 82 240 220 205 38 243 44 190 100
—
16 10 48 2 -2 0 15 13 45 6 -46 5
—
Байду номын сангаас
8 5 11 1.5 1.5 7 6 9 4 10 3
54.5 11.5
T 不变,
3
T n ( n 1 )( 2 n 1 ) / 24 ( t j t j ) / 48 。 据中心极限定理,当 u T T T n 很大时, T 分布近似正态分布,于 T n (n 1) / 4 n ( n 1 )( 2 n 1 ) / 24 ( t j t j ) / 48
14
单侧: 双侧:
n>50时,可用正态近似法作u检验。
u
T n (n 1) / 4 n ( n 1 )( 2 n 1 ) 24 (t j t j )
3
48
t j ( j 1 , 2 , ) 为第 j 个相同秩的个数。
15
2. 单个样本中位数与总体中位数比较
对策: 尝试变量变换使其满足参数检验条件 采用非参数检验
4
非参数检验 (nonparametric test)
对总体分布不作任何假定,不受总体分布限 制,适用范围广。 又称任意分布检验(distribution-free test)。 对两个或多个总体的分布作比较。对分布的 形状差别不敏感,对分布的位置差别敏感。 将原始数据转换为秩(rank),对秩进行检 验—秩转换的非参数检验。
符合参数检验的资料,首选参数检验; 如果采用非参数检验,会降低检验效率。
第八章秩转换的非参数检验(NonparametricTest)
表 8-1 12 份血清用原法和新法测血清谷-丙转氨酶(nmol· S-1/L)结果的比较
编号
原法
新法
差 值d
正秩
负秩
(1)
(2)
(3)
(4)=(3)-(2)
(5)
(6)
1
60
76
16
8
2
142
152
10
5
3
195
243
48
11
4
80
82
2
1.5
5
242
240
-2
1.5
6
220
220
0
7
190
205
第三节
完全随机设计多个样本比较的 Kruskal-Wallis H 检验
一、多个独立样本比较的 Kruskal-Wallis H 检验
Kruskal-Wallis H 检验,用于推断计量资料 或等级资料的多个独立样本所来自的多个总体 分布是否有差别。在理论上检验假设 H0 应为多 个总体分布相同,即多个样本来自同一总体。由 于 H 检验对多个总体分布的形状差别不敏感,故 在实际应用中检验假设 H0 可写作多个总体分布 位置相同。对立的备择假设 H1为多个总体分布位 置不全相同。
用 Wilcoxon 符号秩检验。
检验步骤
H0 :尿氟含量的总体中位数M 45.30 H1 : M 45.30
0.05
据表8-2第(3)、(4)栏,取T=1.5。
有效差值个数n 11 。据n 11 和T 1.5 查 附表 9(P534),得单侧P 0.005 ,按 0.05 水 准拒绝H0 ,接受H1 ,可认为该厂工人的尿氟 含量高于当地正常人的尿氟含量。
秩转换的非参数检验
A法
B法
差值 d 正秩
负秩
3 0 .6
3 0 .6
0
--
--
5 9 .9
6 3 .1
-3 .2
3
4 6 .0
5 8 .0
-1 2 .0
6
2 3 .0
1 0 .9
1 2 .1
7
2 0 .3
3 3 .7
-1 3 .4
9 .5
4 8 .6
9 9 .5
-5 0 .9
11
2 5 .0
2 4 .4
0 .6
1
2 3 .4
3 6 .2
-1 2 .8
8
4 4 .1
4 5 .2
-1 .1
2
3 9 9 .8 4 0 4 .1 -4 .3
4
2 5 .9
3 9 .3
-1 3 .4
9 .5
5 3 5 .6 5 4 4 .8 -9 .2
5
——
——
——
8
58
可编辑ppt
9
秩和分布的特点
对子号
1 2 3
N = 3 时两样本配对比较
10
•秩和分布的特点 (1)离散型的对称分布; (2)N一定时,秩和分布也一定; (3)靠近中央的频数较多; (4)当N足够大时,秩和分布逼近正态分布。
可编辑ppt
11
配对资料的秩和均数:
T+与T-是以T为中心的两个对称点 例11.2资料:T= 11(11 + 1)/ 4 = 33 T+ = 8 , T- = 58, 差值均为 25。
可编辑ppt
4
一、秩和检验的基本思想
总体A
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
31
32
33
34
35
三、多个独立样本比较的秩和检验(频数表)
数据格式: 1个分组变量“group”,1个反应变量 “x”,
1个频数变量“frequncy”。
步骤: Data Weight Cases… Weight cases by: freq Analyze Nonparametric Tests K Independent Samples… Test Variable List: x Grouping Variable: group Test Type: Kruskal Wallis H
7
非参数检验
4. 配伍设计多个 样本的比较!
• 多组配伍/相关样本所来自总体均数的检验: • Friedman: M检验,k个相关样本最常用的检验 ; • Kendall’s W检验:Kendall协和系数检验,表示 k个指标间相互关联的程度; • Cochran’s Q检验:适用于二分类变量,是两相 关样本McNemar在多个样本情况下的推广。
11
资料的读数中,“>60”不是确定值, 因而只能采用非参数检验的方法进 行处理!
12
资料的读数中,如果“60” 是确定值, 该资料能够采用 参数检验的方法进行处理吗!
13
14
发现“确定” 按钮没有激活 的情况,需要 考虑是否存在 未完成的选项!
15
16
两个独立样本 Mann-Whitney检验
数据格式:1个分组变量“group
”,1个反应变量 “x ”。
步骤:
Anasts
2 Independent Samples…
Test Variable List: x
Grouping Variable: group Test Type: Mann-Whitney U
36
例4、多个独立样本比较的秩和检验
• 三种病人肺切除术的针麻效果,见下 表,问,此三种病人肺切除术的针麻 效果有无差异?
针麻效果 + ++ +++ ++++ 肺癌 10 17 19 4 肺化脓症 24 41 33 7 肺结核 48 65 36 8
37
针麻效果 + ++++ +++ ++
卡方检验统计量不能 够体现出结局为等级 资料的等级差异对结 果的影响,所以不能 在此类资料的分析中 肺癌 肺化脓症 肺结核 采用! 10 24 48
5
非参数检验
2. 配对设计两 样本的比较!
• 配对/相关两样本所来自的总体的比较: • Wilcoxon: Wilcoxon符号秩和检验,为相关样本 差值的秩和检验,系统默认值; • Sign:符号检验,利用正负号检验,效率低 • McNemar: 常用的配对卡方检验,只用于两分类 资料,检验两组间分类有差异的频数,不考虑相 同分类的频数; • Marginal Homogeneity: 与McNemar类似,只分析 有差异的情况!
123 115
98 104
120 111
104 110
43
项目编号不 是分析所必 须的,但是 一个区组的 或者说有关 联的样本要 在一行上录 入。
注意此资料的录入格式 与随机区组设计的方差 分析有什么区别?变量 个数?录入的形式?
44
Friedman 检验
Kendall W 检验
45
双向有序列联表的检验
检验步骤 计算Wilcoxon统计量W和Mann-Whitney统计量U 分别求出两个样本的秩的和,Wx和Wy。若m<n,检 验统计量W=Wx ;若m>n,统计量W=Wy ;若m=n ,统计量为第一个变量值所在样本组的W值 Mann-Whitney统计量定义为 U W k ( k 1) 2
46
医疗形式与患者对医疗服务的满意度之间的关系 医疗形式 医疗服务满意度 不满意 满意 36 17 13 1 50 18 2 37 很满意 11 8 4 23 合 计 64 39 7 110
自费 半公费 公费 合计
47
Jonckheere-Terpstra过程的操作提示
Friedman检验 秩相关及其检验
非参数检验
1. 成组设计两 样本的比较!
• 非参数检验的方法选择多样: • 独立两样本所来自总体比较: • Wilconxon rank sum test/ Wilconxon Mann-Whitney U • Kolmogorov-Smimov Z: 检验样本是否来自同一总体 • Moses extreme reactions: 当样本中同时含有正值和 负值时选用的方法。 • Wald-Wolfowitz runs:检验两个样本所在总体的任 一点分布情况是否相同
8
非参检验资料的几种类型
一、成组设计两样本比较的秩和检验 ( Wilcoxon 两样本比较法) 二、配对设计差值的符号秩和检验 (Wilcoxon 配对法) 三、成组设计多个样本比较的秩和检验 (Kruskal-Wallis法) 四、随机区组设计资料的秩和检验 (Friedman法)
9
一、两独立样本比较的秩和检验(原始数据)
• 1. 虽然分组变量和研究变量均为有序,但是研究 者仅仅对分组产生的研究结果感兴趣,则可以按 单向有序的资料进行分析; • 2. 如果想要明确两变量之间的相关关系,则需要 采用Spearman相关分析; • 3. 可以采用Jonckheere-Terptra检验,该检验对双 向有序资料的检验效率较其它方法高; • 4. 如果是多中心临床试验的结果,那么不同中心 结果可能会不一致,要考虑混杂因素的影响,可 进行Cochran-Mantel-Haenszel分析。
3
方法小节
非参数检验
二项分布检验
用途
检验抽取样本所依赖的总体是否服从特定 概率的二项分布 检验抽取样本所依赖的总体是否服从某一 理论分布 检验一个总体位置参数是否等于某假定值 检验一个总体位置参数是否等于某假定值 检验配对数据的总体位置参数是否相同 检验两个总体位置参数是否相同 检验多个总体是否相同 检验配伍设计多个总体是否相同 检验两个变量的相关性 无
10
例1:两独立样本比较的秩和检验
• 某实验室观察某种抗癌新药治疗小鼠移 植性肿瘤的疗效,两组各10只小鼠,以 生存日数作为观察指标,结果如下,试 检验两组小鼠生存日数有无差别?
试验组:24 26 27 30 32 34 36 40 60天以上 对照组:4 6 7 9 10 10 12 13 16 16
• 测得某中学教室中6个采样点不同时间空气中的 CO2含量,结果如下,问不同时间空气中的CO2 含量有无差别?(本例未将同一采样点作为一个 区组设置,实际工作中要考虑有无设置区组的必 要) 课前: 0.48 0.53 课中: 4.45 4.73 课后: 2.95 3.07 0.55 4.77 3.18 0.55 4.82 3.20 0.58 4.89 3.30 0.62 5.00 4.45
6
非参数检验
3. 成组设计多 个样本的比较!
• 多个样本所来自的总体均数的比较: • Kruskal-Wallis H: 最为常用的多个样本 所来自的总体比较的秩和检验 • Median/中位数:检验效能最低 • Jonckheere-Terpstra:用于双向有序变 量资料分析时,检验效能高于KruskalWallis H检验
第八章
秩转换的非参数检验
(nonparametric test)
非参检验
参数检验无法使用的情况下: 1. 资料分布不满足参数检验条件; 2. 不满足方差齐性; 3. 数据不能精确测量,如“>50mg”; 4. 结局变量为有序分类的资料。
2
非参检验
• 经典统计的多数检验都假定了总体的背景 分布。 • 但也有些没有假定总体分布的具体形式, 仅仅依赖于数据观测值的相对大小(秩) 或零假设下等可能的概率等和数据本身的 具体总体分布无关的性质进行检验。 • 这都称为非参数检验 • 在资料能够进行参数检验或者能够通过转 换符合参数检验的条件下,首选参数检验 ,因为非参仅仅考虑参数的位置分布,而 忽略了详细的信息,检验效能降低。
“x”,1个频数变量“freq”。
步骤:
Data Weight Cases… Weight cases by: freq Analyze Nonparametric Tests 2 Independent Samples… Test Variable List: x Grouping Variable: group Test Type: Mann-Whitney U
23
例3:配对设计差值的符号秩和检验
• 尿铅的传统测定方法比较繁琐,现有人希望用新 方法代替原有方法,10份样本分别采用两种方法 进行测定,结果如下,试分析两种方法的测定结 果有无差别?
样本号 1 老方法 3.46
2 2.18 3 5.34 4 9.15 5 6 7 21.3 8 9 10 5.62
1.13 51.34
4.35 0.02
新方法 3.47
2.29
5.04
9.35
0.98 150.28
122.59
4.08 0.01
5.28
24
25
26
27
与配对t检验相 比,有什么异同?
28
29
三、多个独立样本比较的秩和检验(原始数据)
数据格式:1个分组变量“group”,1个反应
变量 “x”。
42
例5、随机区组设计资料的秩和检验
• 受试者5人,每人穿4种防护服,测得脉 搏数结果见下表,问,5个受试者穿4种 防护服测得脉搏数有无差别?