秩转换非参数检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本例:n1=10, T1=141.5, n2=12,T2=111.5 所以:T=T1=141.5
3. 确定P值,作出统计推断
① 查表法:当n1≤10以及n2-n1≤10时,可以查 界值表确定概率值。查界值表,若T在上下界值 范围内,P大于表中上方对应的概率水平;若T等 于上侧界值或下侧界值,P近似等于表中上方对 应的概率水平;若T不在上下界值范围内,P小于
n=11,T=T-=1.5,查界值表:P<0.005
按α=0.05的水准,拒绝H0,接受H1,可以认
为该厂工人尿氟含量高于当地正常人。
第二节 两个独立样本比较的 Wilcoxon秩和检验
两组独立样本比较的秩和检验(Wilcoxon秩和检验), 目的是推断计量资料或等级资料的两个独立样本代表 的两个总体分布是否有差别。
参数统计
(parametric statistics)
非参数统计
(nonparametric statistics)
已知总体分布类型,对
未知参数(μ、π)进
行统计推断
依赖于特定分布类 型,比较的是参数
对总体的分布类 型不作任何要求
不受总体参数的影响, 比较分布或分布位置
优点:1.适用范围广 2.简便,易于掌握
理论上H0为两总体分布相同,即两样本来自同一总 体;H1为两总体分布不同。由于秩和检验对两总体分
布形状的差别不敏感,对位置相同、形状不同但类似 的两总体分布,推断不出两总体分布(形状)有差别,
故在实际应用中,H0可写作两总体分布位置相同,也
可简化为两总体中位数相等。
例8-3 对10例肺癌病人和12例矽肺0期工人用X光片 测量肺门横径右侧距RD值(cm),结果见表8-5。问 肺癌病人的RD值是否高于矽肺0期工人的RD值?
2。计算统计量T
① 省略所有差值为0的对子,令余下的有效对子
数为n 本例n=11
② 对剩余的差值的绝对值从小到大编秩,并根 据差值的正负号标上符号。编秩时遇到绝对值相 同时取平均秩次。
③ 分别求正负秩次之和,用T+和T-表示,并任选
正秩和或负秩和作为统计量值。
本例T=T-=11.5
3. 确定P值,作出统计推断 ① 查表法:n≤50查界值表,若T在上下界值范 围内,P大于表中上方对应的概率水平;若T等于 上侧界值或下侧界值,P近似等于表中上方对应 的概率水平;若T不在上下界值范围内,P小于表
表8-1 12份血清用原法和新法测血清谷-丙转氨酶的比较
编号 1 2 3 4 5 6 7 8 9
10 11 12 合计
原法 60 142 195 80 242 220 190 25 198 38 236 95 -
新法 76
152 243
82 240 220 205
38 243
44 190 100
-
结果为有序分类变量时无法使用。 例:尿糖检测结果
样本数据两端有不确定值时无法使用。 例:仪器性能限制,超出可测量范围
以上情况下强行使用参数统计方法可能会得到错误结论
非参数检验一般不直接用样本观察值作分析,统 计量的计算基于原数据在整个样本中按大小所占位 次。由于丢弃了观察值的具体数值,而只保留其大 小次序的信息,凡适合参数检验的资料,应首选参 数检验。但不清楚是否适合参数检验的资料,则应 采用非参数检验;尤其对于难以确定分布又出现少 量异常值的小样本数据,非参数检验在剔除这些数 据前后所得结论显示出其较好的稳健性。
本身在利用信息上就有丢失
Ⅰ型错误和Ⅱ型错误
真实结果
H0成立 H0不成立
由样本推断的结果
拒绝H0 Ⅰ型错误 α
不拒绝H0 推断正确(1-α)
推断正确(1-β) Ⅱ型错误β
(1-β)即把握度(检验效能)(power of a test):两总体确有差别,在α检验水准下,被检
出有差别的能力
(1-α)即可信度(confidence level):重复 抽样时,样本区间包含总体参数(m)的百分数
第一节 配对样本比较的Wilcoxon符号秩检验 第二节 两个独立样本比较的Wilcoxon秩和检验
第三节 完全随机设计多个样本比较Kruskal—Wallis H检验 第四节 随机区组设计多个样本比较的Friedman M 检验
第一节 配对样本比较的 Wilcoxon符号秩检验
Wilcoxon符号秩检验可用于 1.配对样本差值的中位数与0的比较 2.单个样本中位数和已知的一个总体中位数比较。
非参数检验的适用范围:
① 计量资料不满足正态或方差齐性条件 ② 对于分布不知是否正态的小样本资料 ③ 对于一端或两端无确定数值的资料 ④ 等级资料进行等级强度差别的比较
非参数方法的特点:
������ 适用范围广,几乎可用于任何情况。 ������ 当资料符合参数检验方法的适用条件时,
使用非参数方法的检验效能较低。 ������ 原因:无法借助总体分布得到许多推论,
秩转换的非参数检验
参数检验:总体分布为已知的数学形式,对
其总体参数做假设检验。
非参数检验:是针对参数检验而言的,不
依赖于总体分布的一种假设检验方法,它直接 对总体分布进行假设,不受总体分布的限制, 适用范围广,而且简便易学。
参数统计方法的局限性
必须要先对总体分布进行确定,当总体分布未知,或分 布不符合要求时无法使用。 例:住院时间
对工人尿氟含量进行正态性检验得W=0.845, P=0.032,不满足正态性的条件,使用符号秩检验。
表8-2 12名工人的尿氟含量(μmol/L)与45.30比较
尿氟含量 44.21 45.30 46.39 49.47 51.05 53.16 53.26 54.37 57.16 67.37 71.05 87.37
如:考试成绩的并列第三名 在默认情况下,秩和检验中的相同秩为它们按大小顺序 排列后所处位置的平均值。
非参数检验的方法很多,有符号检验、游程 检验、等级相关分析、秩和检验等。秩转换的 非参数检验(秩和检验)是在非参数检验中占 有重要地位且检验功效高的一种方法。
秩转换的非参数检验(秩和检验),首先 将观察值从小到大,或者等级从弱到强转换为 秩次后,再计算统计量,这种用数据的秩代替 原始数据进行假设检验的方法称为秩和检验。 秩和检验对总体分布的形状差别不敏感,只对 总体分布的位置差别敏感。
-7.5 3
1。 建立假设并确定检验水准
H0:差值的总体中位数为0,Md=0 H1:差值的总体中位数不为0,Md≠0 α=0.05 2。计算统计量T T+=34.5 T-=10.5 T=10.5
3. 确定P值,作出统计推断 n=9,T=T-=10.5,查界值表:P>0.10
按α=0.05的水准,不拒绝H0,还不能认为两
表8-5 肺癌病人和矽肺0期工人的RD值(cm)比较
肺癌病人
RD值 秩
2.78
1
3.23
2.5
4.20
7
4.87 14
5.12 17
6.21 18
7.18 19
8.05 20
8.Βιβλιοθήκη Baidu6 21
9.60 22
n1=10 T1=141.5
矽肺0期工人
RD值

3.23
2.5
3.50
4
4.04
5
4.15
6
4.28
法治疗扁平足效果不同。
二、单样本中位数与总体中位数的比较
比较目的是推断样本来自的总体中位数M和某个 已知的总体中位数M0是否相等。即推断样本各变量 值和M0差值的总体中位数是否为0。
例8-2 已知某地正常人尿氟含量的中位数为
45.30μmol/L 。今在该地某厂随机抽取12名工人, 测得尿氟含量见表8-2第(1)栏。问该厂工人的尿 氟含量是否高于当地正常人的尿氟含量?
表中上方对应的概率水平。
本例n1=10,n2-n1=2,T=141.5,查界值表: 0.025<P<0.05
按α=0.05的水准,拒绝H0,接受H1,可以认
为肺癌病人的RD值高于矽肺工人的RD值。
Wilcoxon检验
1。 建立假设并确定检验水准
H0:肺癌病人和矽肺0期工人RD值的总体分布位
置相同
H1:肺癌病人的RD值高于矽肺0期工人的RD值
(总体分布位置靠右)
α=0.05
2。计算统计量T
① 把两样本数据混合小到大编秩,遇到数据相 同的取平均秩次
② 分别求两样本秩次之和,用T1和T2表示(样本 含量小的为T1),选择T1作为统计量值T。若样本 含量相等,任取一个秩和作为T(T1或T2)。
8
4.34
9
4.47
10
4.64
11
4.75
12
4.82
13
4.95
15
5.10
16
n2=12 T1=111.5
分析:本例两样本资料经正态性检验,W1=0.959, P1=0.775,W2=0.943,P2=0.533;经方差齐性检验, F=20.455,P=0.000,推断的两总体方差不等,使用
中上方对应的概率水平。
本例n=11,T=T-=11.5,查界值表:0.05<P<0.10
按α=0.05的水准,不拒绝H0,还不能认为两
法测定血清谷-丙转氨酶结果有差别。
② 正态近似法:当n>50超出界值表的范围时, 可以使用正态近似法作u检验。
T n n 1 4
u
n

n

1

2n

1
甲 好 好 好好差中好 好 中差 好 差 中 乙 差 差 好中中差中 差 中差 好 好 差
符号秩和检验若用于配对等级资料,则应先将 等级从弱到强赋值,然后再进行符号秩检验。但 对于等级资料,相同秩次多,小样本的检验结果 会存在偏差,最好为大样本。
两种疗法的治疗结果
病例号 1 2 3 4 5 6 7 8 9 10 11 12 13
缺点:对于符合参数统计分析 条件者,采用非参数统计分析, 其检验效能较低
预备知识
分析方法心中有数: 当手中有了数据,首先要对它进行充分、直观的了解,
直方图,茎叶图,箱图等可以帮助我们对数据的分布形状进 行探索,避免因对数据的特性缺乏了解而盲目使用一些方法 作出错误的或不合理的结论。
如果能使用参数方法,当然还是参数方法更好一些,参 数法效能高,方法多。
甲 好 好 好好差中好 好 中差 好 差 中
赋值 3 3 3 3 1 2 3 3 2 1 3 1 2
乙 差 差 好中中差中 差 中差 好 好 差 赋值 1 1 3 2 2 1 2 1 2 1 3 3 1
差值 2 2 0 1 -1 1 1 2 0 0 0 -2 1
秩次 7.5 7.5 3 -3 3 3 7.5
预备知识
秩(Rank):对于样本,按由小到大排成一列,若数据X在这 一列中占据第i位,称X的秩为Ri
实际上就像是考试成绩的排名,只不过倒了过来 相同秩(Ties,得分相同,不分胜负,平手):在许多情况
下,数据中会有相同的值出现,此时如果排秩的话就会出现 同秩的现象,这种情况被称为数据中的相同秩。
合计
(1)-45.30 -1.09 0 1.09 4.17 5.75 7.86 7.96 9.07 11.85 22.07 25.75 42.07 ─
正 秩负 秩 1.5
1.5
3
4
5
6
7
8
9
10
11
64.5
1.5
1。 建立假设并确定检验水准
H0:该厂工人尿氟含量的总体中位数为45.30 H1:该厂工人尿氟含量的总体中位数大于45.30 α=0.05 2。计算统计量T T+=64.5 T-=1.5 T=1.5 3。 确定P值,作出统计推断


t
3 j

t
j

24
48
tj为第j个相同秩次的个数
如:相同秩中有2个1.5,5个8,3个14,则
t1=2,t3=5,t3=3
配对的等级资料
例 配对比较甲、乙两种方法治疗扁平足效果,记录
如下,问两种疗法是否有差别?
两种疗法的治疗结果 病例号 1 2 3 4 5 6 7 8 9 10 11 12 13
一、配对样本差值的中位数与0的比较
比较目的是推断配对样本差值得总体中位数是 否为0,也可以说是推断配对的两个相关样本所来 自的两个总体中位数是否相等。
例8-1 对12份血清分别用原方法(检测时间20分
钟)和新方法(检测时间10分钟)测谷-丙转氨酶, 结果见表8-1的(2)、(3)栏。问两法所得结果有无 差别?
差值 16 10 48 2 -2 0 15 13 45 6
-46 5
-
正秩 8 5
11 1.5
7 6 9 4
3 54.5
负秩 1.5
10 11.5
本例为配对实验设计,对其差值进行正态性检
验:W=0.875,P=0.076,不满足正态性的条件,使
用符号秩检验。
1。 建立假设并确定检验水准
H0:差值的总体中位数为0,Md=0 H1:差值的总体中位数不为0,Md≠0 α=0.05
相关文档
最新文档