卫生统计学-第十章 基于秩次的非参数检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
编秩次时应注意:
遇差值为0时,弃去不计,对子数n也随之减少;
遇有差值相等,符号相同时,可顺次编秩也可以 求平均秩次;
遇有差值相同,但符号不同时,要取平均秩次并 分别标上相应的正负号,如本例差值的绝对值有 两个2,它们的位次为1和2,取平均秩次为 (1+2)/2=1.5。
(3)求秩和并确定检验统计量T值
A组 4.7 6.4 2.6 3.2 5.2 B组 1.7 2.6 3.6 2.3 3.7
两组各有5个变量值。现在依从小到大的顺序将它 们排列起来,并标明秩次,结果如下:
A组
2.6 3.2
4.7 5.2 6.4
B组 1.7 2.3 2.6
3.6 3.7
秩次 1 2 3 4 5 6 7 8 9 10
研究目的:均数或率的假设检验 资料类型:计量、计数或等级资料 基本思想:基于秩次(通过编秩,用秩次代替
原始数据信息来进行检验) 即检验各组的平均秩是否相等。如果经检验得各 组的平均秩不相等,则可以推论数据的分布不 同,进一步可推论各分布间分布位置发生了平 移;
秩次和秩和
“秩”即按数据大小排定的次序号,又称秩次号。 编秩就是将观察值按顺序由小到大排列,并用序 号代替原始变量值本身。用秩次号代替原始数据 后,所得某些秩次号之和,即按某种顺序排列的 序号之和,称为秩和。设有以下两组数据:
配对设计资料符号秩和检验是Wilcoxon 于1945年 提出的,用于推断总体中位数是否等于某个指定值, 还可用于推断配对样本差值的总体中位数是否为0。
基本思想:假设两种处理效应相同,则每对变量的 差数的总体是以0为中心对称分布的,这时差数总 体的中位数为0。因此若(差值的总体中位数为0)成 立,则样本的正、负秩和相近;反之,若正、负秩 和相差愈大, 成立的可能性愈小。
基于秩次的非参数检验 rank sum test
闫宇翔
复习
计量资料 计数资料
统计描述
统计推断
频数分布
抽样误差、
集中趋势
标准误
离散趋势
t u F检验
统计图表
秩和检验
频数分布
u 2检验
相对数及其标来自百度文库化 秩和检验、
统计图表
Ridit分析等
应用 正常值范围
正常区间
人口统计 疾病统计
参数统计的概念
t检验、方差分析等方法均要求样本数据来自正态 分布的总体,总体方差相等等条件。此类统计方 法在理论上要求样本来自特定的总体分布方可对 未知总体参数做推断,此类假设检验方法称为参 数检验(parametric test)。
非参数检验的缺点
检验效率低, 为参数检验的95%
β大,二类错误的概率大 原因信息丧失或信息利用不足,因此,当资
料满足参数检验的条件时,应首选参数检验; 当数据不满足参数检验的条件时,非参数检 验就成为较优选择
非参数检验的类型
符号法 秩和检验 √ 游程检验 等级相关
秩和检验概述
从两组的原始变量值也可以初步看出:A组偏大, B组偏小。现在得出的秩和也是A组大于B组,与 由变量值所观察到的一致。
秩和检验的方法
1 配对设计资料的符号秩和检验 2 单样本资料的符号秩和检验 3 两个独立样本比较的秩和检验 4 多个独立样本比较的秩和检验
§1 配对设计的符号秩和检验
分别求出正负秩次之和,正秩和以T+表示,负秩 和的绝对值以T-表示。
T+及T-之和等于n(n+1)/2,即1+2+3+…+n之和。 此式可验算T+和T-计算是否正确。本例T+=48.5, T-=6.5,其和为55,而10(10+1)/2=55, 可见T+,T- 计算无误。
任取T+(或T-)作检验统计量T,本例取T=6.5。
3. 确定P值并作出推断结论
1)查表法 当n≤50时,查附表9,T界值表。查表时, 自左侧找到n , 若检验统计量T值在上、下界值范 围内,其P值大于表上方相应概率水平,差异无统 计学意义;若T值恰等于上、下界值或在界值的范 围以外,则P值等于或小于相应的概率水平,差异 有统计学意义。
非参数检验适用于以下资料
等级资料。如疗效(治愈/显效/有效/无效) ;临床 化验结果(-/±/+/++/+++) 资料等。
偏态分布资料。观察值呈偏态或极度偏态分布, 而经变换但仍未达到正态或近似正态分布。
分布不明的资料。如新指标分布形态不明(n<30) 各组方差明显不齐,且不易变换达到齐性 。 组内个别观察值偏离过大的资料。 开口分组资料。数据某一端无明确数值的资料。
例1 某研究者欲研究保健食品对小鼠抗疲劳作用, 将同种属的小鼠按性别和年龄相同、体重相近配 成对子,共10对,并将每对中的两只小鼠随机分 到保健食品两个不同的剂量组,过一定时期将小 鼠杀死,测得其肝糖原含量(mg/100g),结果 如下表,问不同剂量组的小鼠肝糖原含量有无差 别?
对表8-1中第(4)栏差值进行正态性检验,W=0.843,P=0.048, 因此,不满足关于样本来自正态分布的条件,该资料宜用 Wilcoxon配对法
上面A组和B组中各有五个原始值,按顺序排列: 最小值设为1,再按绝对值大小对余下的变量逐个 排序,最大值为两组变量个数之和10。依次可得1, 2, 3.5, 3.5, 5, 6, 7, 8, 9, 10。这10 个序号即是秩次。
A组秩和就是等于3.5+5+8+9+10=39.5,B组秩和就 是等于1+2+3.5+6+7=19.5。
一般步骤
1. 建立检验假设,确立检验水准 H0:差值的总体中位数Md=0 H1:差值的总体中位数 Md≠0 =0.05 2.计算检验统计量 (1)求差值 计算每对观察值的差值,见表第(4)栏。 (2)编秩次 差值的绝对值从小到大编秩次,即1、2、 3、…、n,并按差值的正负标上正负号,见第(5) 栏。
特点:总体分布类型已知,对总体参数进行估计 或检验
非参数统计的概念
在实践中我们常常需要比较不同组间研究对象的 血铅值、临床疗效等级评分、不同药物的溶解时 间、实验鼠发癌后的生存日数等指标,这类资料 的特点是总体分布类型未知或分布类型已知但不 对称,或者变量可能无法精确测量等特点。
为了克服参数检验的条件限制,一系列不以特定 的总体分布为前提,也不针对决定总体分布的参 数做推断的方法相继出现,此类方法相对于参数 检验统称为非参数检验(nonparametric test)