第九章 非参数检验方法
非参数检验方法

⾮参数检验⽅法⾮参数检验的推断⽅法不涉及样本所属总体的分布形式,也不会使⽤均值、⽅差等统计量,⾮参数检验是通过研究样本数据的顺序和分布的性质来构成理论基础,下⾯介绍⼀些⾮参数检验经常使⽤的样本数据信息:1.顺序:将样本数据按照升序排列,可以得到X1≤X2≤X3≤Xi....≤Xn,其中Xi为第i个顺序量。
2.秩将样本数据按照升序排列,可以得到X1≤X2≤X3≤Xi....≤Xn,Ri为Xi在这⼀列数据中的位置,称为秩,R1,R2,R3...Rn为样本数据的秩统计量3.结如果样本数据中存在相同的值,那么在排序时就会出现秩相同的情况,这样的情况称为结,结的取值是对应的秩的均值。
注意是秩的均值⽽不是数据本⾝的均值。
⾮参数检验的统计理论都是根据上述概念计算⽽来,此外,和参数检验⼀样,当我们得到分析数据的时候,最先做的⼯作还是先通过图表和⼀些描述性统计量对数据整体进⾏探索性分析,掌握数据⼤致分布情况、有⽆极端值等,为后续正确选择分析⽅法打下基础。
================================================ ====⾮参数检验主要应⽤在以下场合:1.不满⾜参数检验的条件,且⽆适当的变换⽅法进⾏变换2.分布类型⽆法获知的⼩样本数据3.⼀端或两端存在不确定值,如>10004.有序分类变量求各等级之间的强度差别更进⼀步来讲,⾮参数检验可以做以下分析:⼀、单样本总体分布检验⼆、两独⽴样本差异性检验三、两配对样本差异性检验四、多个独⽴样本差异性检验五、多个相关样本差异性检验可以看出,以上应⽤除了第⼀点之外,其他都有对应的参数检验⽅法,这就要根据样本数据的实际情况来进⾏选择了:适合使⽤参数检验的优先使⽤参数检验,否则使⽤⾮参数检验。
================================================ =下⾯我们分别介绍⼀下上述应⽤对应的⾮参数检验⽅法⼀、单样本总体分布检验单样本总体分布检验主要⽤来检验某样本所在总体分布和某⼀理论分布是否存在显著差异,主要涉及的⾮参数检验⽅法有:1.卡⽅检验卡⽅检验可以检验样本数据是否符合某⼀期望分布或理论分布,这在卡⽅检验中有所介绍,在此不再多说2.⼆项分布检验⼆项分布检验主要⽤来检验样本数据是否符合某个指定的⼆项分布,该检验只适合⼆分类变量样本。
第九章 非参数检验方法

胃癌患者,观察其生存 时间如表9-4所示,问两 组患者的生存时间是否 不同?
n1=10
T1=162
假设检验的要点
1. 2. 3. 4. 混合编秩、数据相等时取平均秩 分别求两组的秩和 以样本量较小组的秩和为T 查成组设计的T界值表、确定P值
1.建立检验假设: H0:两组患者生存时间的总体 分布相同 H1:两组患者生存时间的总体 分布不同 α=0.05 2.计算检验统计量T值 ⑴编秩 ⑵求秩和,确定统计量T 3.确定P值(T界值:91~159); 做出推断结论
n1=8
T1=26
n2=7
T2=134
n3=9
n4=8
T4=54.5
秩和检验的两两比较
1、扩展的t检验 2、Nemenyi法检验
习题
• P105~P107 第1、3、5、7题
T1 16.2,T2=9.86
n1=10
T1=162
• 正态近似法
①当n1≤10,n2n1≤10 ,查T界值表(两样本比较的秩和 检验用)确定P值;
②当n1>10或n2>20的大样本时,对T进行u转换,则可用 正态近似法:
| T n1 ( N 1) / 2 | 0.5 u n1n2 ( N 1) /12
1312312051211iitnnuttnnnnn?????????????????二等级资料的秩和检验表95两组人痰液嗜酸性粒细胞的秩和计算例数统一编秩嗜酸性粒细胞数健康人病人范围平均秩次例数较小组病人组的秩和51111685935181810101744174430530530503050?若选行列表资料的卡方检验只能推断两组样本疗效构成比的差别有无统计学意义损失疗效的等级信息应采用秩和检验可推断两组等级强度的差别有无统计学意义比较两组病情的疗效
第九章 非参数检验

第九章非参数检验(医学统计之星)上次更新日期:非参数统计是统计分析的重要组成部分。
可是与之很不相称的是它的理论发展远远不及参数检验完善,因而比较完善的可供使用的方法也不多。
在SAS中,非参数统计主要由UNIVARIATE过程、MEANS过程和NPAR1WAY过程来实现,前两者在前面的章节中已经介绍,它们可以进行配对设计差值的符号秩和检验(WILCOXON配对法);后者是一个单因素的非参数方差分析过程,可进行成组设计的两样本(WILCOXON法)或多样本比较(KRUSKAL-WALLIS法)的秩和检验。
本章将主要介绍NPAR1WAY过程。
由于在理论上还有争议,作为权威性的统计软件,SAS不提供非参检验两两比较的方法。
据我所知,其余统计软件里也只有PEMS提供这一功能(因为她是医统·医百的配套软件,而非参两两比较是写入了该书的)。
如果你需要这一结果,那么恐怕只有手算了。
9.0.1 语法格式NPAR1WAY过程不能处理按频数输入的资料。
这意味着如果你的数据是以频数方式输入的,那么除非你将资料想办法转换成按例记录的资料,否则SAS 无法处理。
有的同学将“NPAR1WAY”打成了“NPARLWAY”,可以这样来记:“NPAR”即“非参”的英文缩写,“WAY”是维数,更明确的说是因素的意思,而“1WAY”就代表一个因素,合起来“NPAR1WAY”说的是“单因素的非参数检验”。
怎么样,明白这个过程在做什么了吧!9.0.2 语法说明【过程选项】NPAR1WAY过程常用的选项有:∙MISSING 将缺失值也用于统计分析∙ANOV A 同时进行方差分析∙MEDIAN 要求进行中位数检验∙NOPRINT 禁止统计结果在OUTPUT视窗内输出∙SA V AGE 要求对样本进行SA V AGE得分分析∙WILCOXON 要求进行WILCOXON秩和检验我们常用的秩和检验就是WILCOXON秩和检验,对于其它方法,有兴趣的读者可参阅有关统计书籍。
09 第九章 非参数检验

通过查阅正态分布表来把握观察的显著性水平, 进而做出否定或保留虚无假设的统计决断。
第三节 中位数检验
一、两个样本中位数差异的检验
二、多个样本中位数差异的检验
中位数检验法是通过对来自两个或多个独立总体的 两个或几个样本的中位数的研究,以判断这两个或 多个总体取值的平均状况是否存在显著性的差异。 其基本思想是假设这两个或多个总体具有相同的分 布律,那么它们的取值将具有相同的平均状态。 中位数检验法的具体做法是:先将几组数 据 X1 、 X 2 、… X k 合并成一个容量为 N n1 n2 nk 的样本,再找出这个样本的中位数 Md 。然后统计出 X1 中大于中位数的数据个数 a ,小于或等于中位数 的数据个数 b ;X 2 中大于中位数的数据个数 c ,小 于或等于中位数的数据个数 d ,…,即分别统计出 每个样本中大于和小于等于中位数的数据个数,再 进行“ r c ”表的 2 检验。
一、小样本的情况
当两个独立样本的容量都小于10,进行秩和检验的 步骤一般为: (1)编排秩次:将两列变量 X1 、X 2 共计 n1 n2 个数据 混合起来,由小到大编排秩次。最小的一个数据的 秩次为1,最大的一个数据的秩次为 n1 n2 。对若干 个数值相等的数据,则取它们相应的秩次的中位数。 (2)求秩和:累计容量较小的样本中的 n1 个数据的 秩次之和,并且记为 T 。 (3)把握显著性水平与统计决断:根据两个独立样本 的容量 n1 和 n2 ,以及显著性水平 ,查阅秩和检验 表。将实际求得的秩和 与表中相应的理论临界值 (下限 T1 和上限 T2 )做比较。如果由样本资料得到 T 的实际秩和 T T1 或 T T2 ,则可以在 显著性水平 上否定无差异的虚无假设;如果实际求得的秩和满 足: T1 T T2 ,则应保留虚无假设。
九非参数检验方法

第10页/共41页
2、计算统计量 (1)按差值的绝对值自小到大排秩次,并保留原差数的 正负号; (2)差数的绝对值相等,但符号相反时,取平均秩次; (3)差数为零时,弃之,总的对子数相应减少; (4)将正负秩次分别相加,得到T+和T-,并以绝对值较 小者作为统计量T值。
主要内容:
第一节 配对资料的符号秩和检验 第二节 两样本比较的秩和检验 第三节 多个样本比较的秩和检验
第1页/共41页
基本概念
1.参数检验(parametric test)
以特定的总体分布为前提,对总体参数进行估计或 假设检验的一类检验方法。
由样本统计量推断未知总体参数。
这时,对总体参数μ、π进行估计或假设检验称为参数
A组 4.7 6.4 2.6 3.2 5.2 B组 1.7 2.6 3.6 2.3 3.7
A组
2.6 3.2
4.7 5.2 6.4
B组 1.7 2.3 2.6 3.6 3.7
秩次 1 2 3 4 5 6 7 8 9 10
第5页/共41页
适用情况
1.总体分布为偏态或分布形式未知的计量资料; 2.等级资料; 3.个别数据偏大或数据的某一端无确定的数值; 4.各组离散程度相差悬殊,即各总体方差不齐。
检验。 分布:要求总体分布已知,如:
•计量资料——正态分布; •计 数 资 料——二项分布、POISSON分布等。
第2页/共41页
2.非参数检验 (nonparametric test) 可以不考虑总体的参数和总体的分布类型,而对
总体的分布或分布位置进行检验。
《非参数检验方法》课件

用于比较两个独立样本的中位数是否相等。
用于比较三个或多个独立样本的中位数是 否相等。
3 Wilcoxon符号秩检验
4 Friedmann检验
用于比较两个相关样本的中位数是否相等。
用于比较三个或多个相关样本的中位数是 否相康型”饮料,是否对销售额产生显著影响?
使用 Mann-Whitney U检验来比较推出“健康型”饮料前后的销售额差异。
案例2:针对不同年龄段顾客的购物偏好是否存在差异?
使用 Kruskal-Wallis H检验来分析不同年龄段顾客的购物偏好是否有显著差异。
总结
非参数检验方法的应用场景和局限性。非参数检验方法的总体流程。非参数 检验方法的意义及应用前景。
《非参数检验方法》PPT 课件
非参数检验方法PPT课件
简介
什么是非参数检验方法?为什么需要非参数检验方法?非参数检验方法的优 势和劣势。
基本原理
什么是假设检验?什么是零假设和备择假设?非参数检验方法与参数检验方 法的区别。
常见的非参数检验方法
1 Mann-Whitney U检验
2 Kruskal-Wallis H检验
非参数假设检验方法课件

非参数假设检验具有灵活性、稳 健性和适用范围广等优点,能够 处理更广泛的数据类型和分布情 况,不受特定参数假设的限制。
与参数检验的区别与联系
区别
参数检验基于对总体分布的参数假设 ,如正态分布等,而非参数检验则不 依赖于这些假设。
联系
非参数检验和参数检验都是为了对总 体进行推断,只是所依据的假设不同 。在实际应用中,可以根据具体情况 选择合适的检验方法。
大,可能会导致误判。
与参数检验的优缺点比较
适用范围
参数检验方法通常需要假定数据分布的形式,适用范围相对较窄 ;而非参数检验方法无需假定分布形式,适用范围更广。
解释性
参数检验方法通常可以提供具体的参数估计和效应量估计,解释性 较强;而非参数检验方法的解释性相对较差。
计算复杂性
参数检验方法的计算过程通常较为复杂,需要使用复杂的数学公式 和推导;而非参数检验方法的计算过程相对简单。
详细描述
符号检验通过计算两组数据中正例和负例的差异数,并利用二项分布的概率公 式来计算差异显著的p值。该方法适用于小样本数据,并且对数据的分布没有严 格要求。
威尔科克森符号秩检验
总结词
威尔科克森符号秩检验是用于比较两个独立样本的差异是否显著的统计方法。
详细描述
该方法通过比较两个样本的秩和,利用威尔科克森符号秩公式计算差异显著的p 值。该方法适用于处理数据量较小的情况,并且对数据的分布没有严格要求。
05
非参数假设检验的未来 发展与展望
现有研究的不足与局限性
方法适用范围有限
01
目前非参数假设检验方法主要适用于特定类型的数据和问题,
对于复杂数据或特定领域的适用性有待提高。
理论基础尚不完备
02
非参数检验

➢ 编秩:数据相等则取平均秩,
➢ 求秩和
➢ 计算检验统计量H值
H 12 N(N 1)
Ri2 3( N 1) ni
出生体重(kg)xij ABCD
相应秩次 Rij A BCD
2.7 2.9 3.3 3.5
3
4
7 11
2.4 3.2 3.6 3.6
2 5.5 12.5 12.5
2.2 3.2 3.4 3.7
χ 2 12
R
2 i
3(N1)
N(N1) ni
χ2
12 14(14 1)
152
4
152 3
37.52 4
37.52 3
3(14
1)
χ 2 9.375
χ
2 c
1
χ2
(t
3 j
t
j
)
n3 n
1
(23
9.375 2) (33 3) (23
143 14
2)
9.50
四、随机区组设计资料的秩和检验 (Friedman test)
正态近似法
如果n1或n2-n1超出附表的范围,可按下式 计算u值:
u | T n1(N 1) / 2 | 0.5 n1n2 (N 1) / 12
在相同秩次较多时,应用下式进行校正:
uC u / C
C 1
(t
3 j
t
j
)
/(N
3
N)
tj为第j组相同秩次的个数
频数表资料(或等级资料)两样本资料比较
xi (2) 86 71 77 68 91 72 77 91 70 71 88 87
12 对双胞胎兄弟心理测试结果
后出生者得分 差 值
非参数检验方法 PPT课件

对于符合参数统计分析条件者,采用 非参数统计分析,其检验效能较低
秩和检验
秩和检验(rank sum test):一类常用 的非参数统计分析方法;基于数据的秩次与 秩次之和
两独立样本差别的秩和检验 配对设计资料的秩检验 完全随机设计多组差别的秩和检验
两独立样本比较的秩和检验 Wilcoxon rank sum test
n1=8 T1=216 n2=7
21 26 24 27
T2=134
11.7 11.7 12.0 12.3 12.4 13.6
n3=9
14 15 16 16 20 25
T3=123.5
10.5 10.5 10.5 10.9 11.0 11.5
n4=8
6 7 9 10 12
T4=54.5
假设检验步骤
建立假设检验 • H0:四组鼠脾DNA含量的总体分布相同。 • H1:四组鼠脾DNA含量的总体分布位置不全相
第九章
非参数检验方法
参数统计
(parametric statistics)
已知总体分布类型,对 未知参数(μ、π)进 行统计推断
依赖于特定分布类 型,比较的是参数
非参数统计
(nonparametric statistics)
对总体的分布类 型不作任何要求
不受总体参数的影响, 比较分布或分布位置
适用范围广;可用于任何类型 资料(等级资料,或“>50mg” )
对于计量数据,如果资料方差相等,且服从 正态分布,就可以用 t 检验比较两样本均数。
如果此假定不成立或不能确定是否成立,就 应采用秩和时间(月)
无淋巴细胞转移
有淋巴细胞转移
时间
秩次
时间
秩次
非参数检验

非参数检验第九章非参数检验知识引入比较两个总体间的差异,我们比较熟悉的是可依据总体方差是否已知,选择使用正态Z检验或t检验法。
但如果有明显的证据表明,这些参数型检验法不能使用时又该如何呢?非参数检验法对此提供了解决方案。
作为参数检验的一种推广,非参数检验有何特点?它的使用有什么样的要求?本章首先对非参数检验进行概述,接着按照和参数检验对应的原则分别介绍用于两组比较的非参数检验法和用于多组比较的非参数检验法。
第一节非参数检验概述假设检验分为参数检验和非参数检验。
参数检验是在已知总体分布的条件下(一般要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验,有时还要求某些总体参数满足一定条件。
如独立样本的T检验和方差分析不仅要求总体符合正态分布,还要求各总体方差齐性。
教材第八章之前所介绍的统计方法都是参数检验法。
非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一般性假设(如总体分布的位置是否相同,总体分布是否正态)进行检验。
非参数检验方法简便,不依赖于总体分布的具体形式因而适用性强,但灵敏度和精确度不如参数检验。
一般而言,非参数检验适用于以下三种情况:①顺序类型的数据资料,这类数据的分布形态一般是未知的;②虽然是连续数据,但总体分布形态未知或者非正态,这和卡方检验一样,称自由分布检验;③总体分布虽然正态,数据也是连续类型,但样本容量极小,如10以下(虽然T检验被称为小样本统计方法,但样本容量太小时,代表性毕竟很差,最好不要用要求较严格的参数检验法)。
因为这些特点,加上非参数检验法一般原理和计算比较简单,因此常用于一些为正式研究进行探路的预备性研究的数据统计中。
当然,由于非参数检验许多牵涉不到参数计算,对数据中的信息利用不够,因而其统计检验力相对参数检验也差得多。
前面所学到的参数检验法在非参数法中都能找到替代的方法,因此按照和参数检验法相对应的原则可对非参数检验法进行如下分类:第二节非参数两组比较法该类方法实际上对应两总体比较的t检验法。
非参数检验教学课件

如果多个配对样本得分布存在显著得差异, 那么数值普遍偏大得组秩和必然偏大,数值普 遍偏小得组,秩和也必然偏小,各组得秩之间就 会存在显著差异。如果各样本得平均秩大致相 当,那么可以认为各组得总体分布 没有显著差 异。
2、多配对样本得Kendall协同系数检验
多配对样本得Kendall协同系数检验和 Friedman检验非常类似,也就是一种多配对样 本得非参数检验,但分析得角度不同。多配对 样本得Kendall协同系数检验主要用在分析评 判者得判别标准就是否一致公平方面。她将每 个评判对象得分数都看作就是来自多个配对总 体得样本。一个评判对象对不同被判定对象得 分数构成一个样本,其零假设为:样本来自得多 个配对总体得分布无显著差异,即评判者得评 判标准不一致。
非参数检验教学课件
但许多调查或实验所得得科研数据,其总 体分布未知或无法确定。因为有得数据不就是 来自所假定分布得总体,或者数据根本不就是 来自一个总体,还有可能数据因为某种原因被 严重污染,这样在假定分布得情况下进行推断 得做法就有可能产生错误得结论。此时人们希 望检验对一个总体分布形状不必作限制。
非参数检验根据样本数目以及样本之间得关系 可以分为单样本非参数检验、两独立样本非参数检 验、多独立样本非参数检验、两配对样本非参数检 验和多配对样本非参数检验几种。
6、1 SPSS单样本K-S检验
6、1、1 统计学上得定义和计算公 式 定义:单样本K-S检验就是以两位前苏联数
学家Kolmogorov和Smirnov命名得,也就是一种 拟合优度得非参数检验方法。单样本K-S检验 就是利用样本数据推断总体就是否服从某一理 论分布得方法,适用于探索连续型随机变量得 分布形态。
Kendall协同系数检验中会计算Friedman 检验方法,得到friedman统计量和相伴概率。 如果相伴概率小于显著性水平,可以认为这10 个节目之间没有显著差异,那么可以认为这5个 评委判定标准不一致,也就就是判定结果不一 致。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
3 合计
2 5
2 4
7
6
11~17
18~23
14.0
20.5
28
41 T-=91
70
82 T+=185
3、查表与结论
查T界值,T0.05(23)=73~203
T=min(T+,T-)=T-=91>73,P>0.05,按α=0.05水准,不拒绝H0, 即对28名有轻度牙周疾病的成年人,指导他们实行良好的口腔卫 生习惯,6个月后,牙周情况尚无显著好转。
1.计量资料的多个样本比较 2.等级资料的多个样本比较
基本思想和步骤
(一)基本思想:如果各组来自同一总体,即H0成立时,对 各组观测值混合编秩次后,各组的平均秩和应近似相等;否 则拒绝H0,可以推断数据的总体分布不同。 (二)步骤 1、建立假设检验 H0:各抽样总体分布相同
H1:各抽样总体的分布不同或不全相同
H0:差值总体中位数为0;
H1:差值总体中位数不为0 ;
α=0.05
2、计算统计量
(1)按差值的绝对值自小到大排秩次,并保留原差数的
正负号;
(2)差数的绝对值相等,但符号相反时,取平均秩次;
(3)差数为零时,弃之,总的对子数相应减少; (4)将正负秩次分别相加,得到T+和T-,并以绝对值较 小者作为统计量T值。
表9-6 各组鼠脾DNA含量(mg)的秩和计算
正常脾
患自发性白血 病脾
患移植白血病的脾 (甲组)
患移植白血病的脾 (乙组)
含量 秩次
12.3 18
含量 秩次
10.8 8
含量
9.3
秩次
1
含量
9.5
秩次
2
13.2
13.7 15.2 15.8 16.9 17.3 17.4
n1=8
22
26 28 29 30 31 32
. . . . . . .
+3 +2 +1 0 -1 -2 -3
4 5 6 5 4 2 2
1、建立假设检验
H0:差值总体中位数为0; H1:差值总体中位数不为0;
α=0.05。
2、计算统计量
表9-3 正负秩和计算表 d 1 - + 总 4 6 10 秩次范围 1~10 平均秩次 5.5 负秩和 22 正ቤተ መጻሕፍቲ ባይዱ和 33
T1=216
11.6
12.3 12.7 13.5 13.5 14.8
13
18 21 23 24 27
10.3
11.1 11.7 11.7 12.0 12.3 12.4
3.5
11 14 15 16 18 20
10.3
10.5 10.5 10.5 10.9 11.0 11.5
n4=8
3.5
5 6 7 9 10 12
例9.2 对28名患有轻度牙周疾病的成年人,指导他们实 行良好的口腔卫生习惯,6个月后,牙周情况好转程度 依高到低给予分数+3,+2,+1;牙周情况变差程度依 次给予分数-1,-2,-3;没有变化给予0分。
表9-2 实行良好口腔卫生习惯6个月后牙周情况的变化程度
6个月后
6个月前
变化对应的分数
人数
. . . . . . .
3、查表,确定P值范围
n≤25时,查配对资料符号秩和检验用T界值表,T在
界值内时,P>α。当T在界值时或以外时,P值一般都 小于对应的概率值。
n>25时,近似正态分布用u检验,公式为:
2 T~ ( T , T )
T n(n 1) / 4 T n(n 1)(2n 1) / 24
+ ++ +++ 合计
1、建立假设检验及确定检验水准 H0:两组总体分布相同;
H1 :两组总体分布不相同;
α=0.05。
2、计算统计量
3、确定P值,作出统计推断 由于u0.05=1.96,u> u0.05,P<0.05,有统计学意义,所以 拒绝H0,接受H1,可认为两总体分布不同。
第三节 多个样本比较的秩和检验 应用情况
T与n(n+1)/4的差距越大,相应的P值就越小。当P ≤α时,拒绝
H0。
1、建立假设检验,确定检验水准
H0:差值总体中位数为0;
H1:差值总体中位数不为0;
α=0.05。
2、计算统计量
T=min(T+,T-)= T-=3
3、查表及结论 n=8,界值表T0.05(8)=3~33,T=3恰好落在界点上,所以 P≤0.05,按α=0.05水准,拒绝H0 ,可认为白癍部位与 正常部位的白介素IL-6有差异。
例9.6 霍乱菌苗不同途径免疫21天后血清抗体滴度水平 测定结果,问各组间的血清抗体滴度水平之间差异是否 有统计学意义?
表9-7 不同途径免疫21天后血清抗体滴度的分布与秩和计算 抗体 滴度 1:10 1:20 1:40 1:80 1:160 1:320 合计 气雾组 80 亿 2 15 10 5 1 33 100 亿 4 7 12 7 2 32 皮下 注射 组 2 1 13 9 5 1 31 累 计 8 23 秩次范 围 1-8 9-31 平均 秩次 4.5 20 49 77 91.5 96 秩和 80亿
3.常用的非参数检验方法有:符号检验、秩和 检验、等级相关检验及Radit分析等。
秩和检验(rank sum test):用秩号代替原始数据后, 所得某些秩号之和,称为秩和,用秩和进行假设检验 即为秩和检验。
举例:
“秩”即按数据大小排定的次序号,又称秩号。编秩就是将观察 值按顺序由小到大排列,所得某些秩次号之和,即按某种顺序 排列的序号之和,称为秩和。设有以下两组数据: A组 4.7 6.4 2.6 3.2 5.2 B组 1.7 2.6 3.6 2.3 3.7
16
28
19
5
能否用卡方检验?
表9-5-2
嗜酸性 粒细胞 数
两组人痰嗜酸性粒细胞的秩和计算
例数 健康人 5 18 16 5 44 病人 11 10 3 0 24 范围 1-16 17-44 45-63 64-68
例数较小组 的秩和 平均秩次 8.5 30.5 54.0 66.0 93.5 305.0 162.0 0.0 T1=560.5
12.5
17 19 20 21 23 24
12
12 17 21 24 29 30 34 36 40 48
4.5
4.5 7 8 9 12.5 14 15 16 18 22
n1=10
T1=162
n2=14
T2=138
1、建立假设检验及确定检验水准
H0:两组生存时间总体分布相同; H1 :两组生存时间总体分布不相同;
T4=54.5
13.6
n2=7 T2=134 n3=9
25
T3=123.5
1、建立假设检验确定检验水准
H0:四组鼠脾DNA含量的总体分布相同;
H1:四组鼠脾DNA含量的总体的分布不同或不全相同 ;
α=0.05。
2、计算统计量
3、查表及结论
现k=4,υ=k-1=4-1=3查卡方界值表χ20.05(3)=7.81,P<0.05按 α=0.05水准,拒绝H0,接受H1,故可认为四组DNA含量有差别。
例9.1 临床某医生研究白癜风病人的白介素IL-6水平 (u/ml)在白癍部位与正常部位有无差异,调查的资料 如下表:
表9-1 白癜风病人的不同部位白介素IL-6指标(u/ml)
病人号 1 2 3 4 5 6 7 8 合计
白癍部位 40.03 97.13 80.32 25.32 19.61 14.50 49.63 44.56
查u值表,u0.05=1.96,u< u0.05 ,P>0.05,按α=0.05水准,接受H0。 两种方法结果相同。
第二节 两样本比较的秩和检验
一、一般步骤 1、建立假设检验及确定显著水准 H0:两总体分布相同; H1:两总体分布不同; α=0.05。
2、计算统计量 (1)编秩号 两样本观察值从小到大混合编秩,属于不同组的相同观察值取 原秩次的平均秩次。 (2)求秩和,确定统计量T n1和n2为两样本含量,N= n1+n2。分别计算秩次T1和T2,取样 本含量小的n的秩和T为统计量T值。当n1=n2,取任 意T值。
优点:应用范围广,方法简便。 缺点:检验效率低。犯第二类错误的可能性大 于参数检验法。
对于适合参数统计的资料或经变 量变换后适合于参数统计的资料, 最好还是用参数检验。
第一节 配对资料的符号秩和检验
配对资料的符号秩和检验(Wilcoxon signed rank test)是配对设计的非参数检验。
•计 数 资 料——二项分布、POISSON分布等。
2.非参数检验 (nonparametric test) 可以不考虑总体的参数和总体的分布类型,而 对总体的分布或分布位置进行检验。
样本所来自的总体分布,难以用某种函数形式来表达, 还有一些资料的总体分布的函数式是未知的,只知道总 体分布是连续型的或离散型的,解决这类问题需要一种 不依赖总体分布的具体形式的统计方法。
α =0.05。 2、计算统计量 将两样本24个数据由小到大统一编秩。两组例数各为 10、14,取较小者为n1=10,T1=162,故统计量 T=T1=162。
3、查表与结论
n2-n1=4,按α=0.05,查T值表(附表9)得范围 91~159。T=162>159,所以P<0.05,拒绝H0,即两组 患者的平均生存时间不同。
2、计算统计量
α=0.05
(1)编秩次,将各组数据从小到大统一编秩次,如不同组有 相同数值,应取平均秩次。 (2)求秩和, 分别计算各组的Ti。