第十章 非参数检验
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
d = 81.339, S d = 113.85, W = 0.843, P ≤ 0.05
Wilconxon 符号检验的基本思想 假定两种处理效应相同, 符号检验的基本思想: 假定两种处理效应相同, 则差值的总体分布是对称的,即总体中位数为0 则差值的总体分布是对称的,即总体中位数为
1.建立检验假设和确定检验水准 . H0 :差值的总体中位数等于零,即Md=0 差值的总体中位数等于零, H1:两种方法测得结果不同,即差值总体中位数不等于零 即 两种方法测得结果不同,即差值总体中位数不等于零,即 Md≠0 α=0.05 = . 2.计算检验统计量 值 .计算检验统计量T值 求每对数据差值, ①求每对数据差值, 编秩:按差值绝对值从小到大, ②编秩:按差值绝对值从小到大, 若遇差值等于零,舍去不计, 若遇差值等于零,舍去不计, 遇有差值的绝对值相等,取平均秩次。 遇有差值的绝对值相等,取平均秩次。 分别求秩和,正秩和以T 表示,负秩和的绝对值以T-表示 表示。 ③分别求秩和,正秩和以 +表示,负秩和的绝对值以 表示。T+ 之和等于n(n+1)/2。检验统计量 )。本例取 及T-之和等于 之和等于 。检验统计量T=min(T+, T-)。本例取 )。本例取T=6.5
参数检验和非参数检验优缺点
参数检验 优点: 优点: 对资料的分析利用充分 统计分析的效率高 缺点: 缺点: 对资料的要求高 适用范围有限 非参数检验 优点:适用范围广; 优点:适用范围广;受限条件 少;稳健性较好 不受分布的影响(偏态、 不受分布的影响(偏态、分布 不明的资料) 不明的资料) 不受方差齐性的限制 不受变量类型的影响 不受样本量的影响 缺点: 缺点: 对信息的利用不充分, 对信息的利用不充分,检验效 率低(易犯Ⅱ型错误) 率低(易犯Ⅱ型错误)
表 10—1 不同剂量组小鼠肝糖原含量(mg/100g) 小鼠对号 (1) 1 2 3 4 5 6 7 8 9 10 中剂量组 (2) 620.16 866.50 641.22 812.91 738.96 899.38 760.78 694.95 749.94 793.94 高剂量组 (3) 958.47 838.42 788.90 815.20 783.13 910.92 758.49 870.80 862.26 805.48 差值 d (4)=(2)-(3) 338.31 -28.08 147.68 2.29 44.21 11.54 -2.29 175.85 112.34 11.54 T+ = 48.5 秩次 (5) 10 -5 8 1.5 6 3.5 -1.5 9 7 3.5 T- = 6.5
复习: 复习:
1. 对呈偏态分布的定性资料用什么指标来进行 统计描述?如何做? 统计描述?如何做? 检验时有什么条件? 2. 做t检验时有什么条件?
第十章 基于秩转换的非参数检验
参数: 总体分布的特征数(总体指标)称为参数, 参数: 总体分布的特征数(总体指标)称为参数,换言 之,总体分布由参数决定。 总体分布由参数决定。 参数统计( 参数统计(parametric test): 基于某种参数分布的统计方 法(描述样本特征、估计参数可信限、检验参数差别), 描述样本特征、估计参数可信限、检验参数差别), 称为参数统计( 称为参数统计( t 、F ) 非参数统计( 非参数统计(nonparametric statistics): 不依赖于特定分 布类型的统计方法,称为非参数统计(适合于任意分布), 布类型的统计方法,称为非参数统计(适合于任意分布), 的统计方法 如秩和检验。 如秩和检验。 非参要点( )将原数据转换为“秩次” 非参要点(1)将原数据转换为“秩次” (2)用“秩次之和”构造概率分布,作假设检 ) 秩次之和”构造概率分布, 验
例10-1 某研究者欲研究保健食品对小鼠抗疲劳作 将同种属的小鼠按性别和年龄相同、 用,将同种属的小鼠按性别和年龄相同、体重相 近配成对子,共10对,并将每对中的两只小鼠随 近配成对子, 对 机分到保健食品两个不同的剂量组, 机分到保健食品两个不同的剂量组,过一定时期 将小鼠杀死,测得其肝糖原含量( ),结 将小鼠杀死,测得其肝糖原含量(mg/100g),结 ), 果如表10-1,问:不同剂量组的小鼠糖原含量有 果如表 , 无差别? 无差别
表10-2 12 名 人 含 ( 工 尿氟 量 mmol/L) 定 果 测 结 尿 含 氟 量 差 值 秩 次 X d 2.15 0 2.10 -0.05 -2.5 2.20 0.05 2.5 2.12 -0.03 -1 每个X都减 每个 都减 2.42 0.27 4 2.15 2.52 0.37 5 2.62 0.47 6 2.72 0.57 7 2.99 0.84 8 3.19 1.04 9 3.37 1.22 10 4.57 2.42 11 T+=62.5 T-=3.5
(2)正态近似法(n >50)这时可利用秩和分布正态近 )正态近似法( )
2 似法作出判断。已知 成立时, 似法作出判断。已知H0成立时,近似有 T ∼ N ( µT , σ T )
Z =
T − µT
σT
(1 0பைடு நூலகம்− 1)
Z=
T − n(n + 1) / 4 − 0.5 n(n + 1)(2n + 1) / 24
其他步骤和方法如前! 其他步骤和方法如前!
第二节 完全随机设计两组独立样本比较的秩和检验
适用情况: 适用情况:完全随机设计两组计量资料比较当 不满足t检验条件时或两组等级资 不满足 检验条件时或两组等级资 料比较 检验目的:检验两总体中位数是否相同( 检验目的:检验两总体中位数是否相同(为什 么?)
一、两组连续变量资料的秩和检验
例10-3 在河流检测断面优化研究中,研究者从 在河流检测断面优化研究中, 某河流甲乙两个断面分别随机抽取10和 个样 某河流甲乙两个断面分别随机抽取 和15个样 测得其亚硝酸盐氮( 品,测得其亚硝酸盐氮(mg/L)的含量如表 ) 10-3,试比较甲乙两个河流断面硝酸盐氮的含 , 量是否有差别? 量是否有差别?
秩和检验( 秩和检验(rank test) )
参数检验的方法很多,秩和检验是较常用的, 非参数检验的方法很多,秩和检验是较常用的, 检验效率较高的一种。其基本原理是编秩求和。 编秩求和 检验效率较高的一种。其基本原理是编秩求和。
秩和检验的形式: 秩和检验的形式:
根据已知资料类型分为: 根据已知资料类型分为: 1. 配对设计差值符号秩和检验(wilcoxon signed-rank test) 配对设计差值符号秩和检验( ) 2. 完全随机设计两样本比较 )(Wilcoxon rank sum test) (Mann-Whiter U test)( )( ) 3. 完全随机设计多个样本比较(Kruskal-Wallis H test) 完全随机设计多个样本比较( ) 4. 随机区组设计资料比较(Friedman’s M test) 随机区组设计资料比较( ) 5. 多个样本间的两两比较(Bonferroni法) 多个样本间的两两比较( 法
二、一组样本资料的符号秩和检验
已知某地正常热尿氟含量中位数为2.15 mmol/L, 今12名 例10-2 已知某地正常热尿氟含量中位数为 名 工人尿氟含量( 见表10-2。问该厂工人的尿氟含量 工人尿氟含量(mmol/L) 见表 。 是否高于当地正常人? 是否高于当地正常人? 解:这是样本与总体比较的一种特例,即“单样本与常模比 这是样本与总体比较的一种特例, 较”,这时近年来发展的应用技术。 这时近年来发展的应用技术。 本例每个工人的尿氟与常模2.15的差值作为“感兴趣的”变 本例每个工人的尿氟与常模 的差值作为“感兴趣的” 的差值作为 个差值, 量,共有12个差值,与前面的配对设计没有差别。 共有 个差值 与前面的配对设计没有差别。
的范围, 若 n1 >10 或 n2 − n1 >10 ,超出附表 10 的范围, 检验, 按下式 可用正态近似法作 Z 检验,令 n1 + n2 = N , 计算 Z 值。
Z=
T − (n1 + n2 +1) 2 − 0.5 n1n2 (n1 + n2 +1) 12
(n不是很大)
如果相同秩次较多时,应作校正计算。 如果相同秩次较多时,应作校正计算。
Z =
T − n ( n + 1) / 4 − 0.5 n ( n + 1)(2 n + 1) − 24 (t 3 − t j ) ∑ j 48
式中t 为第j(j=1,2…)次相持所含相 式中 j为第 次相持所含相 同秩次的个数。如例10-1,第1次相 同秩次的个数。如例 , 次相 有两个差值的绝对值均为 绝对值均为2.29, 持,有两个差值的绝对值均为 , 次相持, 则t1=2;第2次相持,有两个差值均 ; 次相持 有两个差值均 为11.54,则t2=2。 , 。
第一节 配对设计和单样本资料的符号秩和检验
一、配对设计的符号秩和检验
适用情况:配对设计计量资料,当不满足配对t检 适用情况:配对设计计量资料,当不满足配对t 验条件时( 不是正态分布) 验条件时(如:不是正态分布) 检验目的:检验差值总体中位数是否等于0 检验目的:检验差值总体中位数是否等于0(为什 么?) 检验步骤: 检验步骤: 与参数检验相同
n1=10
n2=15
T2=189
1. 检验假设: 检验假设: H0:两总体分布相同, 两总体分布相同, H1:两总体分布不同; 两总体分布不同; α=0.05 2. 计算统计量 编秩: 两组混和排序; 数值相等时取平均秩次 编秩:a) 两组混和排序;b)数值相等时取平均秩次 求秩和: 求秩和:T1=136, T2=189 , 确定统计量: 确定统计量: 若两组例数相等,则任取一组的秩和为统计量; 若两组例数相等,则任取一组的秩和为统计量; 若两组例数不等,则以样本例数较小者的秩和为统计量。 若两组例数不等,则以样本例数较小者的秩和为统计量。 本例, 检验统计量T=136 本例,n1=10, 检验统计量 3. 查表及结论 n=n2-n1,查T 界值表(附表 界值表(附表10page 451) T0.05(5)=94~166, ( ) ~ , T1 =136落在界值范围内,所以 >0.05,不拒绝 0,不能认 落在界值范围内, 落在界值范围内 所以P ,不拒绝H 为某河流甲乙断面亚硝酸盐氮含量的总体分布的位置不同。 为某河流甲乙断面亚硝酸盐氮含量的总体分布的位置不同。
某河流甲乙断面亚硝酸盐氮含量( 表10-3 某河流甲乙断面亚硝酸盐氮含量(mg/L)检测结果 检测结果
河流甲断面 亚硝酸盐氮 0.014 0.018 0.024 0.025 0.027 0.034 0.038 0.043 0.064 0.100 秩次 1 2.5 8.5 10.5 12 15 19 20 22.5 25 T1=136 亚硝酸盐氮 0.018 0.019 0.020 0.022 0.023 0.024 0.025 0.028 0.030 0.035 河流乙断面 秩次 2.5 4 5 6 7 8.5 10.5 13 14 16 亚硝酸盐氮 0.036 0.037 0.055 0.064 0.067 秩次 17 18 21 22.5 24
3.确定 值和作出推断结论: .确定P值和作出推断结论 值和作出推断结论:
(1)查表法(直接法) )查表法(直接法) 当n≤50时,查配对比较用的T 界值表(附表9 page450) 时 查配对比较用的 界值表(附表 ) 若T 值在界值范围内侧 P>α 值在界值上、 若T 值在界值上、下限上或范围外侧 P<α 本例n=10,查附表9双侧范围 ,查附表 双侧范围 双侧范围5-50和8−47,今T=6.5,故 本例 和 , , 0.02<P<0.05。按α=0.05拒绝 0,接受H1。可认为该保健 < 。 = 拒绝H 接受 拒绝 食品的不同剂量对小鼠肝糖原含量的作用不同。 食品的不同剂量对小鼠肝糖原含量的作用不同。