卫生统计学第八版李晓松第十章基于秩的非参数检验

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第一节配对样本的比较
（一）单样本数据的符号秩和检验
基本思想 1.假设样本所对应的总体中位数与给定的总体中位数相同，H0：M1 = M0。 2.计算样本中所有数值与给定中位数的差值，根据所有差值绝对值进行编秩，得到正差值的秩和R+和负差值的秩和R-。
n(n +1) 3.若H0成立，理论上，R+与R-的总体均数应相等，等于： R ，总体 4 n(n 1)(2n 1) 标准差也应相等，等于： R 。 24 4.若R+与R-相差悬殊，均远离M0，则有理由拒绝H0 。具体通过R+ 或R- 的
第二节两组独立样本的比较
（一）两组定量数据的比较
12岁男童与女童发样中Ca含量(μg/g)的比较男童 Ca含量（1）秩（2） 1843 18 383 4 406 5 334 1 443 6 676 11 771 13 358 3 607 9 484 7 n1=10 R1=77 女童 Ca含量（3）秩（4） 842 14 336 2 742 12 1367 15 1623 16 597 8 1976 19 1818 17 643 10 4534 20 n2=10 R2=133
第一节配对样本的比较
（二）配对样本数据的符号秩和检验
检验步骤
(1) 建立检验假设，确定检验水准 H0：差值的总体中位数等于0， Md = 0 H1：差值的总体中位数不等于0， Md ≠ 0
=0.05
(2) 求差值、编秩、求秩和
首先计算每对数据的差值，并对差值进行编秩。分别计算正、负差
值的秩和，得出 R+与R- ，如表所示。
第二节两组独立样本的比较
（一）两组定量数据的比较
基本思想
分别抽取样本量为n1和n2的两个样本，总例数N= n1+n2 。将全部数据统一编秩，取任意样本（如样本量为n1的样本）的秩和作为Wilcoxon秩和检验统计量W，假设两个总体分布相同(H0),则W的均数和标准差分别等于：
n1 N 1 W 2
正态分布拟合优度检验得2=14.000，P=0.003，可认为该数据不服从正态分布。
第一节配对样本的比较
（二）配验的基本思想与单样本符号秩和检验是一致的。不同之处在于，配对数据中每个配对数值的差值可以看作是一个单独的样本，给定的总体中位数为0，即推断差值的单样本是否来自给定中位数为0的总体。其余部分则与单样本符号秩和检验并无差别。
第一节配对样本的比较
（一）单样本数据的符号秩和检验
检验步骤
(4) 确定P值，作出推断样本量较大(n >50)则检验统计量近似服从正态分布，标准化变换获得
Z值：
Z
W R 0.5
R

W n(n 1) / 4 0.5 n(n 1)(2n 1) / 24
P=0.004，拒绝H0，接受H1 ，样本与总体中位数的差异有统计学意义，
检验步骤
(1) 建立检验假设，确定检验水准 H0 ：甲地区人群与乙地区人群的手骨关节炎分值的总体分布相同 H1 ：甲地区人群与乙地区人群的手骨关节炎分值的总体分布不同
=0.05
(2) 编秩、求秩和（略）
第二节两组独立样本的比较
（一）两组定量数据的比较
检验步骤
(3) 计算检验统计量
W = R1 =18642，Z = -13.447 (4) 确定P值，作出推断 P<0.001，按 =0.05水准拒绝H0，接受H1，可以认为甲地区人群与乙地区人群的手骨关节炎分值的差异有统计学意义，可认为乙地区人群比甲地区人群的手骨关节炎严重。
第一节配对样本的比较
（二）配对样本数据的符号秩和检验
例2 采集10名正常成年男性志愿者的血清，分别用放射免疫法和酶联免疫法测量甲胎蛋白的含量(g/L)，结果见表。两种方法测量结果有无差异？
两种方法测量正常成年男性血清中甲胎蛋白含量(g/L)的结果患者序号 1 2 3 4 5 6 7 8 9 10 放射免疫法 15 14 8 17 20 10 22 15 3 13 酶联免疫法 16 12 5 19 16 13 9 15 7 46
第二节两组独立样本的比较
第二节两组独立样本的比较
（一）两组定量数据的比较
例3 在某小学随机采集12岁男童和女童各 10 名的头发样品，检测发样中钙 (Ca) 含量 (μg/g) ，数据见下表。男童与女童头发中Ca含量有无差异？正态分布拟合优度检验，男童组
12岁男、女童发样中Ca含量(μg/g)比较
卫生统计学
第十章基于秩的非参数检验
贺佳第二军医大学
陶育纯
吉林大学
目录
01 第一节：配对样本的比较
02
02 第二节：两组独立样本的比较
03
第三节：多组独立样本的比较
重点难点
※ 符号秩和检验、两独立样本秩和检验和Kruskal-Wallis检验的基本思想 ※ 符号秩和检验、两独立样本秩和检验和Kruskal-Wallis检验的编秩规则 ※ 符号秩和检验、两独立样本秩和检验和Kruskal-Wallis检验中检验统计量的计算方法
第二节两组独立样本的比较
（一）两组定量数据的比较
当数据包含相同秩时，秩和检验统计量W的精确分布会改变，同时，W的标准差必须进行如下调整：
3 n1n2 3 W N N ( t t ) i i 12 N ( N 1) i 1
j
j 为出现相同秩的总次数， ti 为第i 次相同秩的个数
第二节两组独立样本的比较
（一）两组定量数据的比较
例4 2003年10月在两个不同主食地区的中老年人手骨关节炎患病率随机抽样调查中，测得甲地区（主食大米）的175人和乙地区（主食面粉）的194人的手骨关节炎分值，数据见下表。现比较甲地区人群与乙地区人群的手骨关节炎分值是否具有统计学差异？
甲地区与乙地区随机抽样人群的手骨关节炎分值比较骨关节炎分值 0 1 … 合计
第一节配对样本的比较
（二）配对样本数据的符号秩和检验
两种方法测量正常成年男性血清中甲胎蛋白含量(g/L)的结果
患者序号 1 2 3 4 5 6 7 8 9 10 秩和
放射免疫法 15 14 8 17 20 10 22 15 3 13 －
酶联免疫法差值正差值的秩负差值的秩－ 16 -1 1 － 12 2 2.5 － 5 3 4.5 － 19 -2 2.5 － 16 4 6.5 － 13 -3 4.5 － 9 13 8 －－ 15 0 － 7 -4 6.5 － 46 -33 9 －－ R+=21.5 R-=23.5
第一节配对样本的比较
（二）配对样本数据的符号秩和检验
检验步骤
(3) 计算检验统计量本例的检验统计量为R+=21.5或R-=23.5。 (4) 确定P值，作出推断本例P=0.880。在=0.05水准下不拒绝H0，差值的总体中位数与0的差异无统计学意义，尚不能认为放射免疫法与酶联免疫法测量正常成年男性血清甲胎蛋白的结果有差异。
第二节两组独立样本的比较
（二）两组等级变量的比较
检验步骤
(1) 建立检验假设，确定检验水准
H0 ：两个地区的大骨节病临床分度的总体分布相同 H1 ：两个地区的大骨节病临床分度的总体分布不同
=0.05
(2) 编秩、求秩和（略）
(3) 计算检验统计量 W = R1 =10608.5，Z = 0.145 （4）确定P值，作出推断
男童 1843 383 406 334 443 676 771 358 607 484 女童 842 336 742 1367 1623 597 1976 1818 643 4534
2=2891.297 ， P ＜ 0.001 ，女童组
2=9290.446，P＜0.001。可以认为，男
童组与女童组的数据均不服从正态分布。
可认为大骨节病病区面粉中DON含量高于非大骨节病地区。
第一节配对样本的比较
（一）单样本数据的符号秩和检验
例1数据的编秩结果序号原始值 1 0.00 2 0.00 … … 6 12.4 7 34.1 … … 19 196.8 20 205.3 秩和－与中位数的差值 -18.9 -18.9 … -6.5 15.2 … 177.9 186.4 －正差值的秩－－ … － 2 … 19 20 R+=184 负差值的秩 5 5 … 1 － … －－ R-=26
第一节配对样本的比较
第一节配对样本的比较
（一）单样本数据的符号秩和检验
例1 动物实验发现DON可导致家兔膝关节软骨和滑膜损伤，为研究大骨节病是否与粮食中DON含量有关，采集大骨节病高发地区面粉20份，测量面粉中DON 含量，结果(g/g)如下：0, 0, 0, 0, 0, 12.4, 34.1, 69.0, 98.4, 129.5, 156.1, 163.5, 170.9, 177.6, 172.4, 180.3, 189.2, 192.2, 196.8, 205.3，中位数为142.8 g/g。根据前期研究发现，非大骨节病区面粉中DON含量平均水平（中位数）为18.9 g/g。是否可以认为大骨节病区与非大骨节病区面粉中DON含量不同？正态分布拟合优度检验得2=369.011，P＜0.001，可认为该数据不服从正态分布。
n1n2 N 1 W 12
当W远离W，有理由拒绝 H0具体通过W的抽样分布计算P值获得推断结论。
第二节两组独立样本的比较
（一）两组定量数据的比较
检验步骤
(1) 建立检验假设，确定检验水准 H0：男童与女童头发中Ca含量的总体分布相同 H1：男童与女童头发中Ca含量的总体分布不同
第二节两组独立样本的比较
（二）两组等级变量的比较
例5 2007年7月至11月对西藏拉萨市和山南地区大骨节病进行流行病学调查，获得了两个地区受检人群大骨节病不同临床分度的数据，见下表。现比较两个地区的大骨节病临床分度是否具有统计学差异？
2007年拉萨市和山南地区大骨节病临床分度的比较临床分度 Ⅰ度 Ⅱ度 Ⅲ度合计人数拉萨 73 21 8 n1=102 山南 75 22 9 n2=106 合计 148 43 17 208 秩范围 1～148 149～ 191 192～ 208 －平均秩 74.5 170 200 －秩和拉萨 5438.5 3570 1600 R1=10608.5 山南 5587.5 3740 1800 R2=11127.5
抽样分布计算P值获得推断结论。
第一节配对样本的比较
（一）单样本数据的符号秩和检验
检验步骤
(1) 建立检验假设，确定检验水准 H0：样本所对应总体的中位数等于已知总体中位数，M1 = M0
H1：样本所对应总体的中位数不等于已知总体中位数，M1 ≠ M0
=0.05
(2) 求差值、编秩、求秩和 (3) 计算检验统计量由表可知本例的检验统计量为R+=184或R-=26。
=0.05
(2) 编秩、求秩和先将男童组与女童组发样中Ca含量的数值由小到大统一编秩，将两组秩分别相加得每组秩和。见表。
第二节两组独立样本的比较
（一）两组定量数据的比较
(3) 计算检验统计量本例W=77，Z=-2.117。
(4) 确定P值，作出推断
本例P=0.034，按α=0.05 水准拒绝H0 ，接受H1 ，可以认为男童与女童的头发中Ca含量差异有统计学意义。男童组平均秩为77/10=7.7，女童组平均秩为133/10=13.3，可认为女童的头发中Ca含量高于男童。
第二节两组独立样本的比较
（一）两组定量数据的比较
当两个样本例数较大时（n2>10或n2-n1>10 ），秩和检验统计量W将近似正态分布，可通过对W采取标准化变换获得值：
Z
W W 0.5
W

W n1 ( N 1) / 2 0.5 n1n2 ( N 1) /12
本例Z=2.078，P=0.032，结论同前。
人数
甲地区 17 18 … n1=175 乙地区 2 0 … n2=194
合计 19 18 … -
秩范围 1～19 20～37 … -
平均秩 10 28.5 … -
秩和
甲地区 170 513 … R1=18642 乙地区 20 0 … R2=49623
第二节两组独立样本的比较
（一）两组定量数据的比较