研究生统计学 第八章 秩转换的非参数检验 (1)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

b c 1 116 28 1
2
2
bc
52.56
二、单一样本与总体中位数的比较
例7.2 已知某地正常人尿氟含量的中位数 为2.15mmol/L。今在该地某工厂随机抽 取12名工人,测得尿氟含量见表7-2,问 该厂工人的尿氟含量是否高于当地正常 人?
表7-2
尿氟含量(mmol/L) 2.15
概述
但是在实际工作中,有时对总体的 分布类型不易判断,或总体为非正态分 布,则样本例数必须足够多。若不知道 所研究样本来自总体的分布类型或已知 总体分布与检验需要的条件不符,此时 就必须使用非参数统计(nonparametric statistics) 。
概述
非参数统计则不依赖于总体的分布 类型,应用时可以不考虑被研究的对象 为何种分布以及分布是否已知,由于该 种假设检验方法并不是参数间的比较, 而是用于分布之间的比较,故称为非参 数检验(nonparametric test)。
例7.4 用某药治疗不同类型的老年慢性支 气管炎病人,疗效分为4个等级,见表7-4,试 比较该药对两种病型的疗效有无差别? 表7-4 某药对2种病型慢性支气管炎的疗效
例数
疗效
控制 显效
合并 单纯性 合计 肺气肿
秩次 范围 1~107
平均 秩次 54
秩和
单纯性
合并 肺气肿
65 18
42 6
107 24
H0:Md=0 (即M=2.15) H1:Md>0 (即M>2.15) 单侧=0.05 求差值:d=X-2.15; 编秩:按差值绝对值大小编秩并加上正负号,差值 的绝对值相同时取平均秩次; 求秩和并验算: T ++ T -=n(n+1)/2; 确定统计量T: 任取T +或 T –作为检验统计量; 查T界值表,确定P值:本例T超出单侧P=0.005 的T 界值范围,故P<0.005; 作出结论:可以认为该厂工人尿氟含量高于当地正 常人。
n1=10
T1=183.5
n2=16
H0:肺炎患者与正常人血清铁蛋白总体分布相同; H1:肺炎患者与正常人血清铁蛋白总体分布不同。 =0.05 编秩:两组数据按大小统一编秩,数值相同时取平 均秩次; 求秩和并验算: T1+ T2=n(n+1)/2; 确定统计量T: 取n较小者的秩和为检验统计量T。 本例T=183.5。 查T界值表,确定P值:查表得T0.02 (10,6)=91-179,故 P<0.02; 作出结论:可以认为肺炎患者与正常人血清铁蛋白 总体分布不同。
概述
非参数统计方法检验的主要优点:
• • •
适用范围广。对变量的类型和分布无特殊要求, 无论样本资料所来自的总体分布形式如何,甚 至是未知的,都能适用; 对数据要求不严,对某些指标不便准确测定, 只能以严重程度、优劣等级、先后次序等做记 录的资料也可以应用; 多数非参数统计方法简便,易于理解和掌握。
例数 结果
概述
主要缺点: 对于符合参数检验的资料如果用非参 数检验,由于没有充分利用资料提供的信 息,故检验效能低于参数检验的资料,若 要使检验效能相同,往往需要更大的样本 含量。
概述

对符合参数检验的资料,应首先选用参数检验 ;

• •
பைடு நூலகம்
通过变量转换后符合参数检验的资料也应首先 选用参数检验;
若不能满足参数检验的条件的资料,应先选用 非参数检验。 如果非参数检验有显著性,则其效能同参数检 验一样好。
12名工人尿氟含量测定结果
差值(d=X-2.15) 0 秩次
2.10
2.20 2.12 2.42 2.52 2.62 2.72 2.99 3.19 3.37 4.57
-0.05
0.05 -0.03 0.27 0.37 0.47 0.57 0.84 1.04 1.22 2.42
-2.5
2.5 -1 4 5 6 7 8 9 10 11 T+=62.5, T-=3.5
后出生者 88 77 76 64 96 72 差值(d) 2 6 -1 -4 5 0 秩次 3 7 -1.5 -4 5.5
先出生者
7
8 9
77
91 70
65
90 65
-12
-1 -5
-10
-1.5 -5.5
10
11 12
71
88 87
80
81 72
9
-7 -15
9
-8 -11 T+=24.5, T-=41.5
研究生《医学统计学》(第二版)
第八章 秩转换的非参数检验
桂 立 辉 新乡医学院公共卫生学院
概述
前面学过的统计检验方法,一般都 要求样本来自的总体分布类型(如正态 分布、t分布)是已知的,在此条件下 (或在这种假设的基础上)对总体参数 进行估计或假设检验,故称为参数统计 (parametric statistics)。

2
A T 0.5
T
2
72 72 2 2 44 0.5 44 0.5 1892.25 2 52.56 72 72 72 也可采用简便公式:
本例
2
116 72 0.5 44 72 0.5
2
2

2
116 28 2 2 0.001(1) , P 0.001


符号检验
例 用新老两种点彩血球计数法检查213名 正常人,结果新法计数大于老法116例, 老法大于新法者28例,两法结果相同者 69例。请用符号检验法检验两种方法差 别有无统计学意义。
本例:“+”例数116,“-”例数28,差值 为0者不列入计算;理论值 =(116+28)/2=72
采用卡方检验:
(二)方法步骤
H0:Md=0 H1:Md≠0 =0.05 求各对子的差值d; 编秩:按差值绝对值大小编秩并加上正负号,差值 的绝对值相同时取平均秩次; 求秩和并验算: T ++ T -=n(n+1)/2; 确定统计量T: 任取T +或 T –作为检验统计量; 查T界值表,确定P值:本例T 在双侧=0.10 的T 界 值范围内,故P>0.10; 作出结论:尚不能认为治疗前后白细胞总数有差别。
结论:尚不能认为双胞胎兄弟出生先后对智力有影响。
本例若采用正态近似法,因相同秩次 较多,应计算校正的uc。
uc n(n 1)( 2n 1) t T nn 1 4 0.5
3 j
tj


24 48 24.5 1111 1 4 0.5
11(11 1)( 2 11 1) 2 3 2 2 3 2 24 48 8 / 11.2361 0.7116 P 0.05
第一节 配对设计的符号秩和检验
Wilcoxon 符号秩和检验(wilcoxon 配对法或wilcoxon signed rank test )是 推断其差值是否来自中位数为零的总体 方法,可用于配对设计差值的比较和单 一样本与总体中位数的比较。
一、配对设计两样本的比较
(一)本法的基本思想
检验假设H0 是差值的总体中位数等于0,备选假设H1是 差值的中位数不等于0。如果治疗前后2个总体分布的位置 相同,即治疗前后白细胞数目无变化(处理无作用),其 配对数值之差值应服从于以0 为中心的对称分布;也就是相 当于把这些差值按其绝对值的大小编秩并标上原来的正、 负号后,正的秩和与负的秩和在理论上应该是相等的或相 差不大。即使有一些差别,也只能是一些随机因素造成的 差别。所以如果差别不大就不拒绝H0,如果差别很大就拒 绝 H0 。
肺炎患者 正常人
秩次 1 11.5 19 16 血清铁蛋白 177 172 34 47 秩次 17 15 2 7
血清铁蛋白 31 68 237 174
457
492 199
23
24 18
132
54 47
14
10 7
515
599 238
25
26 20
52
47 294 68 43 …
9
7 22 11.5 3.5 … T2=167.5
3510 2151
2268 717
有效 无效 合计
30 13 126
23 11 82
108~131 119.5 53 132~184 158.0 24 185~208 169.5 208 -
4740 3634 2554.4 2161.5 12955.5 8780.5
H0:该药对两种病型的病人疗效的总体分布相同; H1:该药对两种病型的病人疗效的总体分布不同。 =0.05 本例n1=82, n2=126 ,T=8780.5,采用正态近似法:
概述
本章介绍非参数检验中方法比较成熟且 检验效能较高的秩和检验。内容包括:
第一节 配对样本比较的Wilcoxon符号秩检验
第二节 两个独立样本比较的Wilcoxon秩检验 第三节 完全随机化设计多个样本比较的KruskalWallis H检验 第四节 随机区组设计多个样本比较的Friedman M 检验
第二节
两个独立样本比较的 Wilcoxon秩检验
一、 原始数据的两样本比较 例7.3 某医师为研究血清铁蛋白与肺炎的 关系,随机抽查了10名肺炎患者和16名 正常人,并测定血清铁蛋白(μg/L)结果见 表7-3,问肺炎患者与正常人血清铁蛋白 含量有无差别?
表7-3
肺炎患者与正常人血清铁蛋白测定结果(μg/L)
(二)正态近似法 若n>25,超出T界值表的范围,可用正态 近似法作u检验:
T nn 1 4 T n(n 1)( 2n 1) / 24
u T T T nn 1 4 0.5 n(n 1)( 2n 1) / 24
T

式中0.5为连续性校正数。
如果相同秩次较多(不包括差值为0 者),应计算校正的uc。
uc n(n 1)( 2n 1) t T nn 1 4 0.5
3 j
tj

24 48 式中t j 为第j个相同秩次的个数。

对子号 1 2 3 4 5 6 86 71 77 68 91 72
12对双胞胎兄弟智力测试得分
u T n1 ( N 1) / 2 0.5 n1 n2 ( N 1) / 12
3 j

3
8780.5 82(208 1) / 2 0.5 82 126(208 1) / 12
0.4974
N3 N u c u c 0.4974 u c 1.96, P 0.05
H0:Md=0 (M1=M2) H1:Md≠0 (M1≠M2)
=0.05
求各对子的差值d; 编秩:按差值绝对值大小编秩并加上正负号,差值的绝对值 相同时取平均秩次; 求秩和并验算: T ++ T -=n(n+1)/2; 确定统计量T: 任取T +或 T –作为检验统计量;
查T界值表,确定P值:本例T 在双侧=0.10 的T 界值范围 内,故P>0.10;
二、正态近似法
如果n1或n2-n1超出附表范围可按下式 计算u值:
u
T n1 ( N 1) / 2 0.5 n1 n2 ( N 1) / 12
当相同秩次较多时,应用下式对u值 进行校正。式中 c =1-∑(t3j-tj )/(N3-N)
u uc c
三、频数表资料(或等级资料)的两样本比较
配对设计两样本的比较
例7.1 某医院对9名苯中毒患者 试用抗苯一号治疗,得白细胞总数 见下表,问该药是否对患者的白细 胞总数有影响?
表7-1
病人号 1 2 3 4 5 6 7 8 9
9名苯中毒患者治疗前后白细胞总数(109/L)
治疗前 6.0 4.8 4.5 3.4 7.0 3.8 6.0 3.5 5.0 治疗后 4.2 5.5 6.3 3.8 4.4 4.0 5.9 8.0 5.0 差值(d) 1.8 -0.7 -1.8 -0.4 2.6 -0.2 0.1 -4.5 -0.7 秩次 6.5 -4.5 -6.5 -3 8 -2 1 -9 -4.5 T+=15.5, T-=29.5
t c 1
tj
1 107
107 24 3 24 0.8443 3 208 208 0.8443 0.5413


按=0.05水准不拒绝H0 ,尚不能认为该药对两 种病型的慢性支气管炎病人的疗效有差别。
例 对20名正常人和32名铅作业工人尿棕色 素作定性检查,结果见下表,问铅作业工人尿棕 色素是否高于正常人? 正常人和铅作业工人尿棕色素检查结果
相关文档
最新文档