卫生统计学-第十章基于秩次的非参数检验

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

编秩次时应注意：
遇差值为0时，弃去不计，对子数n也随之减少；
遇有差值相等，符号相同时，可顺次编秩也可以求平均秩次；
遇有差值相同，但符号不同时，要取平均秩次并分别标上相应的正负号，如本例差值的绝对值有两个2，它们的位次为1和2，取平均秩次为 (1+2)/2=1.5。
(3)求秩和并确定检验统计量T值
A组 4.7 6.4 2.6 3.2 5.2 B组 1.7 2.6 3.6 2.3 3.7
两组各有5个变量值。现在依从小到大的顺序将它们排列起来，并标明秩次，结果如下：
A组
2.6 3.2
4.7 5.2 6.4
B组 1.7 2.3 2.6
3.6 3.7
秩次 1 2 3 4 5 6 7 8 9 10
研究目的：均数或率的假设检验资料类型：计量、计数或等级资料基本思想：基于秩次（通过编秩，用秩次代替
原始数据信息来进行检验）即检验各组的平均秩是否相等。如果经检验得各组的平均秩不相等，则可以推论数据的分布不同，进一步可推论各分布间分布位置发生了平移；
秩次和秩和
“秩”即按数据大小排定的次序号，又称秩次号。编秩就是将观察值按顺序由小到大排列，并用序号代替原始变量值本身。用秩次号代替原始数据后，所得某些秩次号之和，即按某种顺序排列的序号之和，称为秩和。设有以下两组数据：
配对设计资料符号秩和检验是Wilcoxon 于1945年提出的，用于推断总体中位数是否等于某个指定值，还可用于推断配对样本差值的总体中位数是否为0。
基本思想：假设两种处理效应相同，则每对变量的差数的总体是以0为中心对称分布的，这时差数总体的中位数为0。因此若(差值的总体中位数为0)成立，则样本的正、负秩和相近；反之，若正、负秩和相差愈大，成立的可能性愈小。
基于秩次的非参数检验 rank sum test
闫宇翔
复习
计量资料计数资料
统计描述
统计推断
频数分布
抽样误差、
集中趋势
标准误
离散趋势
t u F检验
统计图表
秩和检验
频数分布
u 2检验
相对数及其标来自百度文库化秩和检验、
统计图表
Ridit分析等
应用正常值范围
正常区间
人口统计疾病统计
参数统计的概念
t检验、方差分析等方法均要求样本数据来自正态分布的总体，总体方差相等等条件。此类统计方法在理论上要求样本来自特定的总体分布方可对未知总体参数做推断，此类假设检验方法称为参数检验(parametric test)。
非参数检验的缺点
检验效率低，为参数检验的95%
β大，二类错误的概率大原因信息丧失或信息利用不足，因此，当资
料满足参数检验的条件时，应首选参数检验；当数据不满足参数检验的条件时，非参数检验就成为较优选择
非参数检验的类型
符号法秩和检验 √ 游程检验等级相关
秩和检验概述
从两组的原始变量值也可以初步看出：A组偏大， B组偏小。现在得出的秩和也是A组大于B组，与由变量值所观察到的一致。
秩和检验的方法
1 配对设计资料的符号秩和检验 2 单样本资料的符号秩和检验 3 两个独立样本比较的秩和检验 4 多个独立样本比较的秩和检验
§1 配对设计的符号秩和检验
分别求出正负秩次之和，正秩和以T+表示，负秩和的绝对值以T-表示。
T+及T－之和等于n(n+1)/2，即1+2+3+…+n之和。此式可验算T+和T－计算是否正确。本例T＋=48.5， T－=6.5，其和为55，而10(10+1)/2=55, 可见T+，T－计算无误。
任取T+（或T－）作检验统计量T，本例取T=6.5。
3. 确定P值并作出推断结论
1)查表法当n≤50时，查附表9，T界值表。查表时，自左侧找到n , 若检验统计量T值在上、下界值范围内，其P值大于表上方相应概率水平，差异无统计学意义；若T值恰等于上、下界值或在界值的范围以外，则P值等于或小于相应的概率水平，差异有统计学意义。
非参数检验适用于以下资料
等级资料。如疗效(治愈/显效/有效/无效) ；临床化验结果(－/±/＋/++/+++) 资料等。
偏态分布资料。观察值呈偏态或极度偏态分布，而经变换但仍未达到正态或近似正态分布。
分布不明的资料。如新指标分布形态不明(n<30) 各组方差明显不齐，且不易变换达到齐性。组内个别观察值偏离过大的资料。开口分组资料。数据某一端无明确数值的资料。
例1 某研究者欲研究保健食品对小鼠抗疲劳作用，将同种属的小鼠按性别和年龄相同、体重相近配成对子，共10对，并将每对中的两只小鼠随机分到保健食品两个不同的剂量组，过一定时期将小鼠杀死，测得其肝糖原含量（mg/100g），结果如下表，问不同剂量组的小鼠肝糖原含量有无差别？
对表8-1中第(4)栏差值进行正态性检验，W=0.843，P=0.048，因此，不满足关于样本来自正态分布的条件，该资料宜用 Wilcoxon配对法
上面A组和B组中各有五个原始值，按顺序排列：最小值设为1，再按绝对值大小对余下的变量逐个排序，最大值为两组变量个数之和10。依次可得1, 2, 3.5, 3.5, 5, 6, 7, 8, 9, 10。这10 个序号即是秩次。
A组秩和就是等于3.5+5+8+9+10=39.5，B组秩和就是等于1+2+3.5+6+7=19.5。
一般步骤
1. 建立检验假设，确立检验水准 H0：差值的总体中位数Md=0 H1：差值的总体中位数 Md≠0 =0.05 2.计算检验统计量 (1)求差值计算每对观察值的差值，见表第(4)栏。 (2)编秩次差值的绝对值从小到大编秩次，即1、2、 3、…、n，并按差值的正负标上正负号，见第(5) 栏。
特点：总体分布类型已知，对总体参数进行估计或检验
非参数统计的概念
在实践中我们常常需要比较不同组间研究对象的血铅值、临床疗效等级评分、不同药物的溶解时间、实验鼠发癌后的生存日数等指标，这类资料的特点是总体分布类型未知或分布类型已知但不对称，或者变量可能无法精确测量等特点。
为了克服参数检验的条件限制，一系列不以特定的总体分布为前提，也不针对决定总体分布的参数做推断的方法相继出现，此类方法相对于参数检验统称为非参数检验（nonparametric test）

卫生统计学-第十章 基于秩次的非参数检验

卫生统计学-第十章基于秩次的非参数检验