秩和检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
配对符号秩检验基本思想
H0为真时,T服从对 称分布,大多数情况下,T 在对称点n(n+1)/4附近。
H0为非真时,T呈
偏态分布,大多数的情 况下,T远离对称点为
n(n+1)/4。
符号秩检验的基本思想
可以证明:当H0(Md=0)成立时,任一配对的差值出现正号与负 号的机会均等,因此,秩和T+与T-的理论数(期望值)也应相等, 由T+与T-之和为n(n+1)/2可知,T+与T-的理论数为n(n+1)/4,当n 很大时,T近似服从均数T为n(n+1)/4,方差为n(n+1)(2n+1)/2 4的正态分布。 H0不成立时,统计量T呈偏态分布,并且在大多数情况下T远离n (n+1)/4 。 因此,在H0成立的情况下T远离n(n+1)/4为小概率事件,可认为 在一次抽样中是不会发生的,故当出现这种情况时推断拒绝H0。
【例9-1】 某医院检验科试用新旧两种方法检测谷丙转氨酶,新法的检测时间 缩短了10分钟。用两种方法检测同一份血清,结果见表9-1。问两法测得结果有 无差别? 表9-1 两法检测血清中的谷丙转氨酶[nmol/(S·L)] 样本号 ⑴ 1 2 3 4 5 6 7 8 9 10 旧法 ⑵ 60 142 242 80 38 212 220 95 236 38 新法 ⑶ 80 152 240 82 25 243 227 100 200 43 差值 ⑷=⑵-⑶ -20 -10 2 -2 13 -31 -7 -5 36 -5 10 4 7 9 5 3 1.5 1.5 正差值秩次 ⑸ 负差值秩次 ⑹ 8 6
Frank Wilcoxon, (1892-1965)
Frank Wilcoxon,是英国生物化学家、统 计学家。 Wilcoxon利用统计学方法研究植物病理学。 一生共发表论文70余篇。他首次引入了两 样本非参数检验方法。 两个著名的非参数方法:Wilcoxon signed -rank test 、 Wilcoxon rank-sum test 就是以他的名字命名的。
第一节 配对设计资料的符号秩 和检验
(Wilcoxon signed-rank test)
一、基本思想 二、检验步骤
一、基本思想
符号秩和检验:是由Wilcoxon于1945年提出,又称 Wilcoxon 符号秩检验 常用于检验差值的总体中位数是否等于零 配对资料有: 同对的两个受试对象分别接受不同处理 同一样品用两种不同方法测试 同一受试对象处理前后的比较或不同部位测定值比较
非参数统计的主要优点
①由于没有条件限制,适用范围广。它可适用于有序分类资料、 偏态分布资料、变异较大或方差不齐的资料、分布型不明的资 料及有特大、特小值或数据的某一端有不确定数值的资料。 ②搜集资料方便。由于非参数统计在搜集资料时可用“等级”或 “符号”来评定观察结果,因而搜集资料十分方便,更符合实 际情况。 ③具有较好的稳健性。参数检验是建立在严格的假定条件的基础 上,一旦不符合假定条件,其推断的正确性将受到质疑。非参 数检验则是带有最弱的假定,所受条件限制很少,稳健性好。
秩次和秩和
非参数检验的方法很多,秩和检验是较常用的,检验效率较 高的一种。其基本原理是编秩求和。
秩次(rank):将数值变量值从小到大,或等级变量值从弱到 强所排列的序号。
秩和:用秩次号代替原始数据后,所得某些秩次号之和,即 按某种顺序排列的序号之和,称为秩和。
秩次和秩和
例1 设有以下两组数据: A组 B组 4.7 1.7 6.4 2.6 2.6 3.6 3.2 2.3 5.2 3.7
两组各有5个变量值。现在依从小到大的顺序将它们排列起来, 并标明秩次,结果如下: A组 秩次 B组 秩次 2.6 3.5 1.7 1 3.2 5 2.3 2 4.7 8 2.6 3.5 5.2 9 3.6 6 6.4 10 3.7 7
平均秩次=
7 8 9 10 8.5 4
3 45 6 4.5 平均秩次= 4
ti为第i个相同秩次的个数
二、检验Байду номын сангаас骤
(一)两组数值变量资料的秩和检验 (二)两组有序分类变量资料的秩和检验
【例9-2】 测得铅作业与非铅作业工人的血铅值(μmol/L) 见表9-2,问两组工人的血铅值有无差别?
表9-2 两组工人的血铅(μmol/L) 铅作业组 血铅值 0.82 0.87 0.97 1.21 1.64 2.08 2.13 秩次 9 10.5 12 14 15 16 17 非铅作业组 血铅值 0.24 0.24 0.29 0.33 0.44 0.58 0.63 0.72 0.87 1.01 秩次 1 2 3 4 5 6 7 8 10.5 13
配对资料的编秩规则
按照配对设计,先求出对子之间的差值。 按其差值的绝对值,从小到大进行排序,其序号即秩次, 并在秩次之前保持原差值的正负号不变。 编秩遇到差值为零时则舍去不编秩。 对绝对值相等的差值若符号不同取平均值,并在秩次之前 保持原差值的正负号。
第二节 完全随机设计两样本比较的秩和检验 一、基本思想 二、检验步骤
第九章
秩和检验
计 量 资 料
计 数 资 料
参 数 统 计 非 参 数 统 计
t 检验 F 检验 u 检验
秩和检验
参数统计
(parametric statistics ) 前面学习的统计方法如t检验和方差分析,都有一定的适用条 件,即要求样本来自正态总体,并且方差齐性(Homogeneity of Variance);并对总体分布的参数(如总体均数)进行估计和检验。
A组:- ± + + + ++ B组: + ++ ++ ++ +++ +++ 1 2 4.5 4.5 4.5 4.5 8.5 8.5 8.5 8.5 11 12
秩次
TA 25 TB 53
N ( N 1) T总 1 2 3 N 2
T总 = 12 ×(12+1)/2 = 78 = TA + TB
T+=18.5
T-=36.5
分析步骤:
1.建立检验假设,确定检验水准
H0:两法检测结果相同,即差值总体中位数等于零,Md=0 H1:两法检测结果不同,即差值的总体中位数Md≠0 α=0.05
2. 选择检验方法、计算统计量 ⑴编秩: ⑵求秩和:本例按双侧检验,T=T+=18.5。 3.确定P值、做出推论
1(
n+1)/2不应该相差很大;如相差悬殊,超出所列界值范围,
就怀疑H0,接受H1。提示两总体分布位置不同。
假设检验的要点:
1.混合编秩、数据相等时取平均秩 2.分别求两组的秩和 3.以样本量较小组的秩和为T 4.查成组设计的T界值表、确定P值
如果n1>10或n2>20则可用正态近似法:
• 当相同秩次较多时用校正公式:
• 连续性资料 ——正态分布 • 计数资料——二项分布、Poisson分布等
统计量:有明确的理论依据(t分布、u分布) 有严格的适用条件,如:
•正态分布 •总体方差齐 •数据间相互独立 Normal distribution Equal Variance Independent
条件不满足时——采用非参数统计的方法。
n1=7 秩和=93.5
n2=10 秩和=59.5
二、检验步骤
1.建立假设、确定检验水准
H0:两组工人血铅值的总体分布相同; H1:两组工人血铅值的总体分布不同 α=0.05
2.选择检验方法、计算统计量 ⑴编秩: ⑵求T值:分别求两组秩和。本例:n1=7,n2=10,T=93.5 3.确定P值、做出推论 由n1、n2-n1查“附表8,若T值在T界值范围 内,则P>α;若T值在界值范围外或等于界值,则P≤α。
非参数统计
(nonparametric statistics ) 又称秩转换的非参数检验或秩和检验(Rank sum test)
对总体分布不做严格假定,也不对总体参数进行统计推 断,而是直接对总体分布的位置进行假设检验。由于这类方 法不受总体参数的限制,故称非参数检验,又称任意分布检 验(distribution-free test)。
非参数统计的主要优点
非参数检验比较的常常是中位 数,而中位数具有较好的耐极端 值的作用。 将变量值从小到大或从弱到 强转换成秩后再计算检验统计量, 从而推断一个总体表达分布位置 的中位数M和已知M0、两个或多 个总体的分布是否不同。 特点:对总体分布的形状差 别不敏感,只对总体分布的位置 差别敏感。
一、基本思想
进行完全随机设计的两组数值变量资料和两组有序分类变量
资料的比较时,若两个样本总体不能满足正态性和方差齐性 的要求,可采用 Wilcoxon Mann-Whitney test进行两样本 比较的秩和检验。
目的是比较两样本分别代表的总体分布是否相同。 如果H0成立,n1与n2确定后,则n1样本的秩和T与其平均秩和n
备注:将等级变成秩次的方法称为秩变换(rank transformation)。 秩次反映等级的高低;秩和反映各组秩次的分布位置。 秩和检验就是通过秩次的排列求出秩和,从而对总体的分布进行假设检 验的方法。至于秩次排列的顺序,从小到大和从大到小的检验结果是相同的。
第九章 秩和检验
第一节 配对设计资料的符号秩和检验 第二节 第三节 第四节 第五节 第六节 完全随机设计两样本比较的秩和检验 完全随机设计多个样本比较的秩和检验 随机区组设计资料的秩和检验 多个样本两两比较的秩和检验 例题和SPSS电脑实验
非参数检验适用范围
实际工作中,非参数统计方法可以发挥作用的情形有:
①总体分布形式未知或分布类型不明;尤其是对于分布不知是否正态的小样本 资料。 ②分布呈非正态而又无适当数据转换方法的偏态分布的资料(非正态分布的资 料): ③等级资料:不能精确测定,只能以严重程度、优劣等级、次序先后等表 示 ——单向有序行×列表资料 ④不满足参数检验条件的资料:各组方差明显不齐。 ⑤数据一端或两端是不确定数值(必选),如“>50kg”等。
非参数统计的主要缺点
对适宜用参数方法的资料,若采用非参数处理,因没有充 分利用资料提供信息,而使检验效率降低,会增加Ⅱ类错误 (假阴性)的概率。反之,如果不符合参数检验的条件,非参数 检验有极高的检验效率。
β
α
非参数统计的基本思想
非参数检验是一种与总体分布无关的统计方法,它不比较 参数,而是通过比较分布的位置来完成统计检验。 基本思想是基于秩次(通过编秩,用秩次代替原始数据信 息来进行检验)即检验各组的平均秩是否相等。如果经检验得 各组的平均秩不相等,则可以推论数据的分布不同,进一步可 推论各分布间分布位置发生了平移。
T界值表(配对比较的符号 秩和检验用)”,若检验统计量T值在Tα界值范围内,其P> α;若T值在Tα上、下界值范围外,则P<α。
查“附表7
正态近似法
n>25时,T分布近似正态分布可用正态近似法作u检验:
相同秩次较多时的校正值
注意:仍为非参数检验
?
配对符号秩检验基本思想
表 n=5时秩和T的分布
T(秩和)(1) 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 合计 0 1 2 3 4 5 1+2+3 1+2+4 1+2+5 1+3+5 1+4+5 1+2+3+5 1+2+4+5 1+3+4+5 2+3+4+5 1+2+3+4+5 1+2 1+3 1+4 1+5 2+5 3+5 4+5 2+3+5 2+4+5 3+4+5 2+3 2+4 3+4 1+3+4 2+3+4 1+2+3+4 秩和组成情况(2) f(3) 1 1 1 2 2 3 3 3 3 3 3 2 2 1 1 1 32 概率(4) 0.03125 0.03125 0.03125 0.06250 0.06250 0.09375 0.09375 0.09375 0.09375 0.09375 0.09375 0.0625 0.0625 0.03125 0.03125 0.03125 1.0000
1 f ( x) e 2
( X )2 2 2
正态分布有几个参数 ?
1 f ( x) e 2
σ1
( x )2 2 2
, x
σ2 μ1 μ2
隐含假设是方差相等(齐性)
参数检验的特点
•分析目的:对总体参数(μ或π)进行估计或检验。 •分布:要求总体分布已知,如: