秩转换的非参数检验
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2)正态近似法u 检验 如果n超出附表10范 围,则用以下公式计算u值,进行u检验:
u T n1 (n1 n2 1) / 2 t 3 t j) ( j n1n2 (n1 n2 1) 1- 3 12 N N
( t C 1-
3 3 j
二、两组频数表或等级资料比较
例8-4 39名吸烟工人和40名不吸烟工人的碳氧血红蛋 白HbCO(%)含量见表8-6。问吸烟工人的HbCO(%)含量 是否高于不吸烟工人的HbCO(%)含量?
表8-6 吸烟工人和不吸烟工人的HbCO(%)含量比较 含量 吸烟 不吸烟 合 秩次 平均 秩和 工人 工人 计 范围 秩次 吸烟 不吸烟
(3)计算正负秩和: T = 54.5, T = 11.5 (4)确定检验统计量T 任取T 和 T 为T ,本例取T =11.5。 3.确定P 值,作出推论: (1) n≤50,查表法。本例n=11,查附表9得 T0.05, 为 ~56, 11 10
本例11.5在此范围内,故P >0.05,按α =0.05 水准,不拒绝Ho 还不能认为两法测定结果有差别。 (2) n>50,u 检验。
第八章
秩转换的非参数检验
非参数检验的概念: 非参数检验是指对原始资料无特殊要求(如正 态分布、总体方差相等)的一类检验方法,它不 是比较参数,而是比较分布的位置。不符合t 检验 和F检验的数值变量资料可用秩和检验,此外,秩 和检验还可用于两组或多组等级资料以及“开口” 资料的比较。等级相关也属于非参数检验。
表8-9 三种药物杀灭钉螺的死亡率(%)比较 甲药 乙药 丙药 死亡率 秩次 死亡率 秩次 死亡率 秩次 32.5 10 16.0 4 6.5 1 35.5 11 20.5 6 9.0 2 40.5 13 22.5 7 12.5 3 46.0 14 29.0 9 18.0 5 49.0 15 36.0 12 24.0 8 63 ─ 38 ─ 19 Ri ni 5 ─ 5 ─ 5
比较作出相应的判断。
第一节
配对样本比较的符号秩和检验
一、配对样本差值的中位数和0(总体中位数)比较 例8-1 对12份血清分别用原方法(检测时间20 分钟)和新方法(检测时间10分钟)测谷-丙转氨 酶,结果见表8-1的第(2)、(3)栏。问两法所 得结果有无差别?
表8-1
编 号 (1) 1 2 3 4 5 6 7 8 9 10 11 12 合 计
2 2 19 152 48 768 68.5 685 77.5 310 ─ 1917( T) 1
4 437 528 274 0 1243(
T2)
1. H0:吸烟工人和40名不吸烟工人的碳氧血红蛋白含量 分布相同; H1:吸烟工人和40名不吸烟工人的碳氧血红蛋 白含量分布不同,α =0.05。 2. 计算两组秩和:见上表。 3. 计算u值:本例总例数超出查表范围,故应采用u检验, 而且相同等级较多,u值须作教正。
(1) (2) (3) (4) (5) (6) (7)=(2)×(6) ( 8)=(3)×(6)
很低 1 2 低 8 23 中 16 11 偏高 10 4 高 4 0 合 计 39( n1 ) 40(n2 )
3 1~3 31 4~34 27 35~61 14 62~75 4 76~79 79(N )─
4.确定P值,作出判断: 3.7023>1.96,P<0.05,说明 吸烟工人的碳氧血红蛋白含量高于不吸烟工人。。
三、Mann-Whitney U检验 某试验室在缺氧条件下观察猫和兔各4只的生 存时间 (小时)结果如下,试比较缺氧条件下猫 和兔的生存时间是否有差别? A组 7 4 9 17 B组 11 6 14 21以上 原始数据 4 6 7 9 11 14 17 21以上 组 别 A B A A B B A B U=0+1+1+3=5 U’=1+3+3+4=11 U +U’= n1 n2 =5+11=4×4=16
1.建立假设,确定检验水准:
H 0 : 工人尿氟含量的总体中 位数M 45.30; H1 : M 0, 0.05,单侧检验。
2. 计算检验统计量: (1)计算差值,见上表。 (2)按差值的绝对值从小到大编秩次,见上表。
(3)计算正负秩和: T = 64.5, T = 1.5 (4)确定检验统计量T 任取 T和 T 为T ,本例取T =1.5。 3.确定P 值,作出推论: 本例n=11,查附表9得P < 0.005,按α =0.05水 准,拒绝Ho ,可认为该厂工人的尿氟含量高于当 地 正常人的尿氟含量。
12份血清用原法和新法测血清谷-丙转氨酶 (nmol· S-1/L)的比较 原 法 新 法 差 值 正 秩 负 秩 (2) (3) (4) (5) (6) 60 76 16 8 142 152 10 5 195 243 48 11 80 82 2 1.5 242 240 -2 1.5 220 220 0 190 205 15 7 25 38 13 6 198 243 45 9 38 44 6 4 236 190 -46 10 95 100 5 3 ─ ─ ─ 54.5 11.5
一般规定 n1 n2 , 当 n1 n2 , 则以 n1 组秩和为T值, 当 n1 n2 , 则任取一组秩和为T值。 本例 n1 10, T=141.5 4.确定P 值,作出推论: (1)查表法 查附表10,本例 n1 10, n2 n1 2, 查得 T0.05 值的范围为89~141,141.5已超出此范 围,故P< 0.05,按α =0.05拒绝H0,接受H1 ,说明 肺癌病人的RD值高于矽肺0期工人的RD值。
t j)
N N
本法的基本思想为: 如果检验假设成立,则两组的秩和应较接近, 若两组的秩和相差过大,n1 的秩和就会超出理论 分布范围,因此有理由拒绝H0 。 此外,当 n1 n2 N 确定后,总秩和为一定值, 总秩和= N (n1 n2 1) / 2 , 每一对秩和的概率分布 也具有一定的规律,而且在n足够大时近似正态分 布,因此除了用查表法,还可采用u检验法。 从u值的计算公式中可以看出,如果实际秩和 与理论秩和相差过大,则有理由拒绝H0 。
u
T n(n 1) / 4 0.5 n(n 1)(2n 1) / 24
当相同秩次较多时:
u
T n(n 1) / 4 0.5 n(n 1)(2n 1) / 24 (t t j ) / 48
3 j
式中t j为第j个相同秩次的个数。
二、单个样本中位数和总体中位数比较 例8-2 已知某地正常人尿氟含量的中位数为 45.30。今在该地某厂随机抽取12名工人,测得 尿氟含量见表8-2第(1)栏。问该厂工人的尿氟 含量是否高于当地正常人的尿氟含量?
( t
3 j 3
t j) (3 3) (313 31) (27 27)
3 3 3
(14 14) (4 4) 52230
u | T n1 (n1 n2 1) / 2 | t 3 t j) ( j n1n2 (n1 n2 1) 1- 12 N3 N | 1917 39(79 1) / 2 | 3.7023 39 40 (79 1) 52230 1 3 12 79 79
表8-2 编 号 1 2 3 4 5 6 7 8 9 10 11 12 合计
12名工人的尿氟含量( mol/L)与45.30比较 尿氟含量 差值 正 秩 负 秩 44.21 -1.09 1.5 45.30 0 46.39 1.09 1.5 49.47 4.17 3 51.05 5.75 4 53.16 7.86 5 53.26 7.96 6 54.37 9.07 7 57.16 11.86 8 67.37 22.07 9 71.05 25.75 10 87.37 42.07 11 ─ ─ 64.5 1.5
第二节 完全随机设计两组资料比较
一、两组计量资料比较 例8-3 对10例肺癌病人和12例矽肺(硅沉着病) 0期工人用X线片测量肺门横径右侧距RD(cm), 结果见表8-5。问肺癌病人的RD值是否高于矽肺0 期工人的RD值?
表8-5 肺癌病人和矽肺0期工人的RD值(cm)比较 肺癌病人 矽肺0期工人 RD值 秩次 RD值 秩次 2.78 1 3.23 2.5 3.23 2.5 3.50 4 4.20 7 4.04 5 4.87 14 4.15 6 5.12 17 4.28 8 6.21 18 4.34 9 7.18 19 4.47 10 8.05 20 4.64 11 8.56 21 4.75 12 9.60 22 4.82 13 4.95 15 5.10 16 n1 10 T1 141.5 n2 12 T2 111.5
三、本法的基本思想: 如果检验假设成立,那么由于随机测量误差 的 原因,各对数据的差值既可以是正值也可以是负 值,也就是说它们的秩次之和应该接近。但是, T和T 如 果 相差过大,则有理由拒绝检验假设。 T和T T T 此外,当n 确定后,总秩和为一定值,总秩和 =n(n+1)/2,如果 大则 小。每一对 的概率分布也具有一定的规律,而且在n足够大时 近似正态分布,因此除了用查表法,还可采用u检 验法。 从u值的计算公式中可以看出,如果实际秩 和与平均秩和相差过大,则有理由拒绝H0 。
H 12 /N ( N 1) Ti / ni 3( N 1)
2 2 2 2
1)假设: H0:三种药物杀灭钉螺的死亡率总体分布位置相同; H1:三种药物杀灭钉螺的死亡率总体分布位置不全相同, α=0.05。 2)计算检验统计量H值: (1)编秩次:将三组变量值混合编秩,如有数据 相同则求平均秩次,见上表。 (2)求秩和:三组的秩和分别为63、38、19。 (3)计算H值:
将AB两组数据从小到大排列,清点位于A组每个数
据 前B组数据的个数总和,即U值, n1 n2 如果A组数据都比B组数据大,则U值最大, 且= , 如果A组数据都比B组数据小,则U值最小,且U=0 , 如果AB两组数据相间出现,说明两组数据大小相 差 不大,此时U值较为适中。 根据U值的大小可用查U值表判断两数据相差有无显 | U n1 n1 / 2 | 著性,样本较大时可用正态近似法u检验。 u
t 3 t j) ( j n1n2 ( N 1) 1- 3 12 N N
第三节 完全随机设计多组资料比较 一、H检验 1.原始数据的多个样本比较
例8-5 用三种药物杀灭钉螺,每批用200只活钉 螺,用药后清点每批钉螺的死亡数、再计算死亡 率(%),结果见表8-9。问三种药物杀灭钉螺的 效果有无差别?
1. 建立假设,确定检验水准: H0:肺癌病人和矽肺0期工人的RD值总体分布位 置相同(总体中位数相同); H1:肺癌病人和矽肺0期工人的RD值总体分布位置 不同。 α =0.05,双侧检验。 2. 计算检验统计量: (1)编秩次 将两组变量值混合编秩,如有数据 相同则求平均秩次,见上表。 (2)求秩和 肺癌病人秩和=141.5 矽肺0期工人秩和=111.5 (3)确定检验统计量T
1.建立假设,确定检验水准: H 0 : 差值的总体中位数 d 0; M
H1 : M d 0, 0.05,双侧检验。
2. 计算检验统计量: (1)计算差值,见上表。 (2)按差值的绝对值从小到大编秩次,见上表。 注意: a. 如有差值相等,应求平等级, b.如果差值有0,则按以下方法处理: ①舍去不计; ②所占等级秩和正负各半。
非参数检验的优点: 1.应用范围广; 2.易于理解和掌握; 3.多数计算简便。 非参数检验的缺点: 1.检验效率较低; 2.少数计算较复杂。
秩转换的非参数检验简称秩和检验,分析时先 将数值变量资料从小到大,或等级变量资料从弱 到 强转换成秩次,再求出秩次之和以及相应的检验 统 计量,并与理论值比较后确定P值,最后P值与α