第九章 非参数检验
非参数检验方法.

统 计 量:有明确的理论依据(t分布、u分布) 有严格的适用条件,如:
•正态分布 •总体方差齐 •数据间相互独立 Normal Equal Variance Independent
条件不满足时——采用非参数统计的方法。
接受H1
2018/9/24
17
陈学芬
(3)确定P值并作出推断结论: 本例: n=9 , T+=15.5, T+ (5-40) T0.05(9)=5-40
所以 P>0.05,按α=0.05的检验水准,不拒绝H0 ; 尚不能认为治疗前后患者的白细胞总数差别有统 计学意义。
2018/9/24
18
陈学芬
第九章 非参数检验方法
(nonparametric test)
陈学芬
检验方法的选择及应用条件
t 检 验:
u 检 验:
方差分析:
2018/9/24
2Leabharlann 陈学芬参数检验:若样本所来自的总体分布已知(如 正态分布),对其总体参数进行假设检验,则 称为参数检验。
2018/9/24
3
陈学芬
参数检验的特点:
分析目的:对总体参数(μ π)进行估计或检验。 分 布:要求总体分布已知,如:
取较小的T作为检验的统计量T 本例取T=T+=15.5。
2018/9/24
16
陈学芬
(3)确定P值并作出推断结论: 根据T值( T+=15.5 或 T-=29.5 )查T界值表 ( P258附表8 )确定P值 原 则:如果T位于检验界值区间内,P>,不拒 绝H0;如果T位于检验界值区间外,P,拒绝H0,
SAS第9章

指定要分析(比较其均值)的变量名。缺省值:每个数值型变量。
• BY语句:
按指定变量分组统计,要求数据集事先按分组变量排序。缺省值: 不分组。
• CLASS语句:
指定识别变量(分类变量),用于识别观测所在的组,此变量中只 可出现2个不同的值( 2个水平)。
2021/4/4
14
• 例:检验sashelp.class男女学生的身 高均值是否相同。
• 3.F分布
– 特征:
• F=1,取值区间[0,)
• 分布曲线仅取决于df1和df2
2021/4/4
5
• 4.u检验与t检验
– 参数方法与非参数方法
• 参数方法:依赖于某种分布假设的统计方法 • 非参数方法:不依赖于数据分布类型的统计方法
– 目的:
• 进行总体均值与样本均值的比较 • 或两样本均值的比较
分)
标准误
分类 变量
因变量
2021/4/4
均值
观测个数
均值置 信区间 上下限
标准差
标准差置 信区间上
下限
最小最 大值
16
检验方差是否 相等的结果
自由度
检验方法
用于检验两组 均值相等这一 零假设的t值
在零假设下, 大于t绝对值的
概率
2021/4/4
F分布的 自由度
检验统计量F值
大于F统计量 的概率
17
• 两组无显著差异
– p值大于临界概率值,则不能拒绝零假设。 – 对独立组,两组的均值无显著差异; – 对成对组,平均差值与零的差异不显著。
• 说明:结论不能说明两组均值相等或平均差值为零。
2021/4/4
11
• 3.两样本t检验
非参数检验方法

非参数检验方法一、什么是非参数检验非参数检验(Nonparameteric Tests)是指检验假设(比如均值、方差、分布类型)不依赖样本参数的方法,也可以称为不参数检验,将数据的描述性统计量和判别量作为假设检验的基本工具,而不主张假设服从某个具体的概率分布。
二、非参数检验的优点1、可以使用描述性统计量作为假设检验的基本工具,而不主张数据服从某个具体的概率分布,使得检验更加简单。
2、非参数检验的统计量倪比较有针对性,无论样本量大小,无论是否假定样本服从某个具体概率分布,它都能比较有效计算统计量的有效性、准确性。
3、非参数检验的抽样复杂度较低,当数据量较小时,可以获得较精确的结果。
4、非参数检验可以应用于连续变量或离散变量检验假设,使得非参数检验成为一种常见的统计检验方法。
三、常见的非参数检验方法1、Wilcoxon符号秩检验:Wilcoxon符号秩检验是用于比较两组数据之间不同水平上的秩和的检验,它的统计量是组间的秩和比,假设多个样本的总体服从同一分布,可以用来检验两组数据间的均值或中位数的差异性,即表明两个样本的分布是否有差异。
2、Kruskal-Wallis H检验:Kruskal-Wallis H检验是一种无序秩检验,它能检验总体中多组数据间的均值或中位数的比较,即用来检验多个样本构成的总体是否服从同一分布,要求多组样本的体积相等。
3、Friedman检验:Friedman检验是一种用于多个样本比较的非参数检验,它的检验统计量是秩求和检验,可以检验多个样本构成的总体是否服从相同的分布,从而比较多个样本之间的均值,中位数或众数相对应的所有统计量。
4、Spearman秩相关系数:Spearman秩相关系数是一种测量两个变量相关性程度的方法,它不要求变量服从某种分布,仅要求变量是分类变量或连续变量。
5、Cochran Q检验:Cochran Q检验是变量若干观测值服从同一分布的依赖性检验,可以检验多组数据的差异性是否具有统计学意义,一般用于比较不同实验组间的得分或响应相对于对照组的得分或响应的差异性。
第九讲-2 非参数检验-差异显著性检验

单个样本的Wilcoxon符号秩和检验
• 单个样本中位数和总体中位数比较,目的 是推断样本所来自的总体中位数M与某个已 知的中位数M0是否有差别。
• 用样本各变量与M0的差值,即推断差值的 总体中位数和0是否有差别。
• 已知某地正常人尿氟含量的中位数为 45.30µmol/L,今在该地某厂随机抽取12名 工人,测得尿氟含量如表所示。
T界值表(配对比较的符号秩和检验用)
N
单侧:0.05 双侧:0.10
5 0--15
6 2--19
7 3--25
8 5--31
9 8--37
10 10--45
11 13--53
12 17--61
单侧:0.025 单侧:0.01 单侧:0.005 双侧:0.05 双侧:0.02 双侧:0.010
0--21
秩和检验概述
“秩”:按数据大小排定的次序号,又称秩次号。 编秩:将观察值按顺序由小到大排列,并用序号代替原始
变量值本身。 用秩次号代替原始数据后,所得某些秩次号之和,即按某
种顺序排列的序号之和,称为秩和,反映了一组数据在 分布上的范围位置。 基本思想: 基于秩次(通过编秩,用秩次代替原始数据信息来进行检 验)。 即检验各组的平均秩或秩和是否相等。如果经检验得各组 的平均秩和秩和不相等,则可以推论数据的分布不同。
非参数检验
• 许多调查或实验所得的科研数据,常常具有如下特点: (1)资料的总体分布类型未知或无法确定; (2)资料分布类型已知,但不符合正态分布; (3)某些变量可能无法精确测量如等级资料。 (4)一端或两端为不确定数值的资料 这时做统计分析就不能使用参数检验,而是要采用非参
数检验:即不考虑总体分布类型是否已知,不比较总 体参数,只比较总体分布的位置是否相同的统计方法。
8非参数检验

②正态近似法:
u | T n0 ( N 1) / 2 | n1n2 ( N 1) / 12
本例u 2.205 0.05/ 2 1.96
N3 N ; 3 3 N N (ti ti )
i
*校正公式(当相同秩次较多时)
uc u c; c
ti为第i个相同秩号的数据个数
假定:两组样本的总体分布形状相同
如果两总体 分布相同
基本思想
两样本来自同一总体 任一组秩和不应太大或太小
T 与平均秩和 n0 (1 N ) / 2 应相差不大
较小例数组的秩和, n1 n2 T min( R1 , R2 ), n1 n2
N n1 n2 n0 min( n1 , n2 )
控制 显效 有效 近控
65 18 30 13 126
107 24 53 24
1-107 108-131 132-184 185-208
54 119.5 158 196.5
编号 1 2
病情 单纯型 单纯型合并肺气肿
疗效 控制 显效
3
4 … 206 207
单纯型合并肺气肿
单纯型 … 单纯型 单纯型合并肺气肿
10 12(12 1) / 4 | R n(n 1) / 4 | u 2.275 n(n 1)(2n 1) / 24 12(12 1)(2 12 1) / 24
查标准正态分布表,得 P 值 校正公式: (当相同秩次个数较多时)
u
| R n(n 1) / 4 | n(n 1)(2n 1) / 24 (ti3 ti ) / 48 10 12(12 1) / 4
第一节 非参数检验的概念
第九章 非参数检验方法

胃癌患者,观察其生存 时间如表9-4所示,问两 组患者的生存时间是否 不同?
n1=10
T1=162
假设检验的要点
1. 2. 3. 4. 混合编秩、数据相等时取平均秩 分别求两组的秩和 以样本量较小组的秩和为T 查成组设计的T界值表、确定P值
1.建立检验假设: H0:两组患者生存时间的总体 分布相同 H1:两组患者生存时间的总体 分布不同 α=0.05 2.计算检验统计量T值 ⑴编秩 ⑵求秩和,确定统计量T 3.确定P值(T界值:91~159); 做出推断结论
n1=8
T1=26
n2=7
T2=134
n3=9
n4=8
T4=54.5
秩和检验的两两比较
1、扩展的t检验 2、Nemenyi法检验
习题
• P105~P107 第1、3、5、7题
T1 16.2,T2=9.86
n1=10
T1=162
• 正态近似法
①当n1≤10,n2n1≤10 ,查T界值表(两样本比较的秩和 检验用)确定P值;
②当n1>10或n2>20的大样本时,对T进行u转换,则可用 正态近似法:
| T n1 ( N 1) / 2 | 0.5 u n1n2 ( N 1) /12
1312312051211iitnnuttnnnnn?????????????????二等级资料的秩和检验表95两组人痰液嗜酸性粒细胞的秩和计算例数统一编秩嗜酸性粒细胞数健康人病人范围平均秩次例数较小组病人组的秩和51111685935181810101744174430530530503050?若选行列表资料的卡方检验只能推断两组样本疗效构成比的差别有无统计学意义损失疗效的等级信息应采用秩和检验可推断两组等级强度的差别有无统计学意义比较两组病情的疗效
第九章 非参数检验

第九章非参数检验(医学统计之星)上次更新日期:非参数统计是统计分析的重要组成部分。
可是与之很不相称的是它的理论发展远远不及参数检验完善,因而比较完善的可供使用的方法也不多。
在SAS中,非参数统计主要由UNIVARIATE过程、MEANS过程和NPAR1WAY过程来实现,前两者在前面的章节中已经介绍,它们可以进行配对设计差值的符号秩和检验(WILCOXON配对法);后者是一个单因素的非参数方差分析过程,可进行成组设计的两样本(WILCOXON法)或多样本比较(KRUSKAL-WALLIS法)的秩和检验。
本章将主要介绍NPAR1WAY过程。
由于在理论上还有争议,作为权威性的统计软件,SAS不提供非参检验两两比较的方法。
据我所知,其余统计软件里也只有PEMS提供这一功能(因为她是医统·医百的配套软件,而非参两两比较是写入了该书的)。
如果你需要这一结果,那么恐怕只有手算了。
9.0.1 语法格式NPAR1WAY过程不能处理按频数输入的资料。
这意味着如果你的数据是以频数方式输入的,那么除非你将资料想办法转换成按例记录的资料,否则SAS 无法处理。
有的同学将“NPAR1WAY”打成了“NPARLWAY”,可以这样来记:“NPAR”即“非参”的英文缩写,“WAY”是维数,更明确的说是因素的意思,而“1WAY”就代表一个因素,合起来“NPAR1WAY”说的是“单因素的非参数检验”。
怎么样,明白这个过程在做什么了吧!9.0.2 语法说明【过程选项】NPAR1WAY过程常用的选项有:∙MISSING 将缺失值也用于统计分析∙ANOV A 同时进行方差分析∙MEDIAN 要求进行中位数检验∙NOPRINT 禁止统计结果在OUTPUT视窗内输出∙SA V AGE 要求对样本进行SA V AGE得分分析∙WILCOXON 要求进行WILCOXON秩和检验我们常用的秩和检验就是WILCOXON秩和检验,对于其它方法,有兴趣的读者可参阅有关统计书籍。
09 第九章 非参数检验

通过查阅正态分布表来把握观察的显著性水平, 进而做出否定或保留虚无假设的统计决断。
第三节 中位数检验
一、两个样本中位数差异的检验
二、多个样本中位数差异的检验
中位数检验法是通过对来自两个或多个独立总体的 两个或几个样本的中位数的研究,以判断这两个或 多个总体取值的平均状况是否存在显著性的差异。 其基本思想是假设这两个或多个总体具有相同的分 布律,那么它们的取值将具有相同的平均状态。 中位数检验法的具体做法是:先将几组数 据 X1 、 X 2 、… X k 合并成一个容量为 N n1 n2 nk 的样本,再找出这个样本的中位数 Md 。然后统计出 X1 中大于中位数的数据个数 a ,小于或等于中位数 的数据个数 b ;X 2 中大于中位数的数据个数 c ,小 于或等于中位数的数据个数 d ,…,即分别统计出 每个样本中大于和小于等于中位数的数据个数,再 进行“ r c ”表的 2 检验。
一、小样本的情况
当两个独立样本的容量都小于10,进行秩和检验的 步骤一般为: (1)编排秩次:将两列变量 X1 、X 2 共计 n1 n2 个数据 混合起来,由小到大编排秩次。最小的一个数据的 秩次为1,最大的一个数据的秩次为 n1 n2 。对若干 个数值相等的数据,则取它们相应的秩次的中位数。 (2)求秩和:累计容量较小的样本中的 n1 个数据的 秩次之和,并且记为 T 。 (3)把握显著性水平与统计决断:根据两个独立样本 的容量 n1 和 n2 ,以及显著性水平 ,查阅秩和检验 表。将实际求得的秩和 与表中相应的理论临界值 (下限 T1 和上限 T2 )做比较。如果由样本资料得到 T 的实际秩和 T T1 或 T T2 ,则可以在 显著性水平 上否定无差异的虚无假设;如果实际求得的秩和满 足: T1 T T2 ,则应保留虚无假设。
第九章非参数统计

二、配对设计资料的符号秩和检验
用于有具体数字的配对资料,相当于配对t检验 效率较符号检验法高
例9.2 某研究中心为观察溶脲脲原体(UU)感 染对家兔精子质量的影响,分别测定10只兔子感染 UU前后的精子密度(109/L),数据见表9.2,试分 析溶脲脲原体是否影响家兔的精子密度。
H0:Md=0,即差值的总体中位数等于零。
<0.005 0.05 0.015 0.40 0.005 <0.005 0.025 <0.005 0.01
0.05
0.025 0.05 0.005 0.035 0.1 0.01 <0.005 0.015 0.02
<0.005
26
二、等级资料两样本比较的秩和检验
例9.8 某药对不同类型支气管炎的疗效见表9.8中1-3栏所 示,分析该药对两种类型的支气管炎的治疗效果是否有差 异?
医学统计学
第九章 非参数统计
上海交通大学医学院生物统计学教研室 张莉娜
分机776444 zhanglina@
参数统计
(parametric statistics)
已知总体分布类型,对 未知参数进行统计推断
非参数统计
(nonparametric statistics)
对总体的分布类 型不作任何要求
假定样本所来自的总体分布为已知的函数 形式,这类统计推断方法称为参数统计。
非参数统计是一种不依赖总体分布的具体 形式的统计方法
3
非参数统计适用情况
适用于:
(1)资料不具备参数方法所需条件,
如:未知分布类型的资料或偏态资料, 方差不齐资料的总体均数的比较。
(2)不能或未加以精确测量的资料,
如:等级资料 不能测量的过大或过小数据。
第9章 非参数检验

9.7多个独立样本比较秩和检验
1.多组计量资料的非参数检验
对于多组计量资料不服从正态性、方差齐性条件或 经转换后也不满足,则采用H检验法
例9-8研究白血病时,测定四组鼠脾DNA的含量,结 果如下表,分析各组DNA含量有无差别?(α=0.05)
正常脾
12.3
患自发性白血病的脾 10.8
患移植白血病的脾(甲组) 9.3
列联表(二维列联表按两个属性分类的表)分类: 1)双向无序表(检验法:Pearson卡方检验) 2)双向有序表(检验法:McNemar检验、Kappa检验) 3)单向有序表(等级资料,检验法:非参数检验)
Guiyang College of Traditional Chinese Medicine
例9-7《成都中医药大学学报》2004年第2期《益 心钦口服液治疗冠心病心率失常的疗效》一文, 调查数据如下表,判断其疗效与对照组是否相同? (α=0.05)
Guiyang College of Traditional Chinese Medicine
2.等级资料两样本比较秩和检验
医药学研究中的等级资料: 1)疗 效: 痊愈、显效、有效、无效、恶化 2)化验结果: - ++ +++ 3)体格发育: 下等、中下、中等、中上、上等 4)心功能分级:I、II、III… 5)营养水平: 差、一般、好
1959 30.5 1969 11.8
1960 24.5 1970 12.4
Guiyang College of Traditional Chinese Medicine
SPSS操作步骤
1)建立数据文件:变量名为x 2)Analyze→Nonparametric Tests→Runs,
第09章 非参数检验

秩和检验
第一节 第二节 第三节 配对资料符号秩和检验 两样本比较的秩和检验 多个样本比较的秩和检验
第一节 配对资料符号秩和检验 (Wilcoxon singed rank test)
适用条件 1. 配对设计的计量资料,但不服从 正态分布或分布未知 2. 配对设计的等级资料
第一节
一般步骤
配对资料符号秩和检验
假设检验步骤
1. 建立建设:H0:两总体分布相同,
H1:两总体分布不同;
=0.05 ⒉ 计算统计量 将两个样本由小到大的顺序统一编次,数值相等时取 平均秩次,求出两组秩和, 以样本含量较小组的秩和作为检验统计量T,T1=162 ⒊ 查表及结论 n=n2-n1,查T界值表 T0.05(4)=91~159, T1 =162落在 界值范围外,所以P<0.05,拒绝H0,认为两组患者的 平均生存时间不同。
若T值在界值范围内,不拒绝H0,
当T值在界值上或界值范围外,H0成立的概率很小,拒 绝H0 ,认为两总体分布不同
例9.1 临床某医生研究白癜风病人的白介素 IL-6水平(u/ml)在白斑部位与正常部位有无差 异,调查的资料如下表
白癜风病人不同部位白介素IL-6指标(u/ml) 病人号 1 2 3 4 5 6 7 8 合计 白斑部位 40.03 97.13 80.32 25.32 19.61 14.50 49.63 44.56 正常部位 88.57 80.00 123.72 39.03 24.37 92.75 121.57 89.76 d=正常-白斑 48.54 -17.13 43.40 13.71 4.76 78.25 71.94 45.20 T+=33 秩次 6 -3 4 2 1 8 7 5 T-=3
例9.3 对无淋巴细胞转移与有淋巴细胞转移的胃 癌患者,观察其生存时间,问两组患者的生存时间是 否不同?
非参数检验

非参数检验非参数检验是一种统计方法,用于比较两组或多组数据的差异或关联性,它并不依赖于数据的分布假设。
相比于参数检验,非参数检验通常更为灵活,可应用于各种数据类型和样本量,尤其在数据不满足正态分布的情况下表现优势。
本文旨在介绍非参数检验的基本原理、应用领域以及常见方法。
首先,非参数检验的基本原理是依赖于样本中的秩次,即将原始数据转化为秩次数据进行统计分析。
秩次是数据在全体中的相对位置,将数据转化为秩次可以消除异常值对统计结果的影响,并使数据的分布不再成为限制因素。
非参数检验的应用领域广泛,包括但不限于以下几个方面。
一、假设检验非参数检验可用于假设检验,比如检验两组样本的中位数是否存在差异。
常见的方法有Wilcoxon符号秩检验、Mann-Whitney U检验等。
在实际应用中,如果数据的分布无法满足正态分布假设,非参数检验则是一种理想的选择。
二、相关性分析非参数检验可用于判断两个变量之间的关联性。
常见的方法有Spearman秩相关系数检验、Kendall秩相关系数检验等。
这些方法的核心思想是将原始数据转化为秩次数据,通过秩次数据之间的比较来判断两个变量之间是否存在显著相关。
三、分组比较非参数检验可用于比较多个样本之间的差异。
常见的方法有Kruskal-Wallis检验、Friedman检验等。
这些方法可用于比较三个以上的样本组之间的差异,而不依赖于数据的分布假设。
在实际应用中,非参数检验需要注意以下几个问题。
一、样本容量非参数检验对样本容量的要求相对较低,适用于小样本和大样本。
然而,在样本容量较小的情况下,非参数检验可能会产生较大的误差,因此应根据实际情况选择合适的方法。
二、数据类型非参数检验可应用于各种数据类型,包括连续型数据和离散型数据。
但对于有序分类数据、定序数据和名义数据,非参数检验相较于参数检验有更好的适用性。
三、分布假设非参数检验不需要对数据的分布做出假设,这使得它更加灵活。
但是,如果数据满足正态分布假设,参数检验也是一种较为有效的选择。
第9章 非参数检验

(4)求秩和并确定检验统计量:
分别求出正负秩次之和,正秩和以T+ 表示,负秩和的绝对值以T-表示。T+及T之和等于n(n+1)/2。此式可验证T+和T-的 计算是否正确。如本例T+=19.5,T-=25.5, 其和为45,n=9(因舍去三对差值为0的数 据),9(9+1)/2=45。取T+和T-中较小者 作为检验统计量T,本例取T=19.5。
多个样本间两两比较的秩和 检验(Nemenyi法)
样本例数相等的两两比较秩 和检验 各样本例数不同或不全相同 的两两比较的秩和检验
非参数检验又称为任意分布检验 (distribution-free test),它不考 虑研究对象总体分布具体形式,也不对总 体参数进行统计推断,而是通过检验样本 所代表的总体分布形式是否一致来得出统 计结论。
4.确定P值和作出推断结论 本例样本含量较多,超出附表6的 范围,需用下式求u值来判断结论。又 因频数表资料相同秩次数较多(超过总 样本数25%),故需用校正公式。
u
T n1 ( N 1) / 2 0.5 n1n 2 ( N 1) 12 8780.5 82( 208 1) / 2 0.5
当n1>20或(n2-n1)>10时,附表6中 查不到P值,则可采用正态近似法求u值来 确定P值,其公式如下:
T n1 ( N 1) / 2 0.5 n1n 2 ( N n2 分别为两样本含量,N=n1+n2,0.5这连 续性校正数。上式为无相同秩次时使用 或作为相同秩次较少时的近似值。当两 样本相同秩次较多(超过总样本数的 25%)时,应按下式进行校正,u经校正 后可略增大,P值则相应减小。
uc u
统计学非参数检验

非参数检验的弱点
可能会浪费一些信息 特别当数据可以使用参数模型
的时候 大样本手算相当费事 一些表不易得到
参数检验
〔parametric 总体分t布es类t〕型,对未知
➢ 在参数检验和非参数检验都可以使用的情况下, 非参数检验的成效〔power〕要低于参数检验方 法。
以下情况下应当首选非参数方法
➢ 参数检验中的假设条件不满足,从而无法应用。例 如总体分布为偏态或分布形式未知,且样本为小样 本时。
➢ 检验中涉及的数据为定类或定序数据。 ➢ 所涉及的问题中并不包含参数,如判断某样本是否
在非正态总体小样本的情况下,假如要对总体 分布的位置进展推断,由于t检验不适用,也 可使用符号检验的方法。
在数据呈偏态分布的情况下,我们可能对总体 的中位数更感兴趣,希望对总体的中位数作出 推断,这时可以使用符号检验的方法。
例6.3 在某地区随机调查了60个家庭的月收入。 〔数据文件:家庭月收入.sav〕。根据样本数 据能否认为总体中家庭月收入的中位数等于 5000元〔显著性程度a=0.05〕?
c2统计量的分布与自由度有关; c2统计量描绘了观察值与期望值的接近程度
拟合优度检验〔goodness of fit test〕
用c2统计量进展统计显著性检验的重要内容之 一;
根据总体分布状况,计算出分类变量中各类别 的期望频数,与分布的观察频数进展比照,判 断期望频数与观察频数是否有显著差异,从而 到达对分类变量进展分析的目的。
非参数统计的名字中的“非参数(nonparametric) 〞意味着其方法不涉及描绘总体分布的有关参 数;
非参数检验

若n>50,超出附表9的范围,可用正态近似法作u检验,按 下式计算u值。
对秩的差值,省略所有差值为0的对子数,令余下的有效对子数
为n;最后按n个差值编正秩和负秩,求正秩和或负秩和。但对 于等级资料,相同秩多,小样本的检验结果会存在偏性,最好 用大样本。
的多个独立样本所来自的多个总体分布是否有差别。在理论
上检验假设H0应为多个总体分布相同,即多个样本来自同一 总体。由于H检验对多个总体分布的形状差别不敏感,故在实
际应用中检验假设H0可写作多个总体分布位置相同。对立的
备择假设H1为多个总体分布位置不全相同。
1.原始数据的多个样本比较
方法步骤见例8-5.
样本所来自的两个总体中位数是否有差别。方法步骤见例8l。
例8-1 对12份血清分别用原方法(检测时间20分钟)和新 方法(检测时间10分钟)测谷-丙转氨酶,结果见表8-1的(2)、 (3)栏。问两法所得结果有无差别?
血清谷-丙转氨酶不知是否符合正态分布,本例为小样 本资料,其配对差值经正态性检验得0.1<P<0.2,虽可用配对t 检验,为保守起见,现用Wilcoxon符号秩检验。
用于推断计量资 料或等级资料的两个独立样本所来
自的两个总体分布是否有差别。
在理论上检验假设H0应为两个总体分布相同,即 两个样本来自同一总体。由于秩和检验对于两个总体分布 的形状差别不敏感,对于位置相同形状不同但类似的两个 总体分布,如均数相等、方差不等的两个正态分布,推断
不出两个总体分布(形状)有差别,故对立的备择假设Hl不
zh9非参数检验

当n1>20或(和)n2>20时,用正态
近似法计算u值。
n1n2 |U | 0.5 2 u n1n2 (n1 n2 1) 12
35
第三节
成组设计多个样本 比较的秩和检验
完全随机(成组)设计多样本比较,
如不能满足参数检验的要求,或为等级
资料,多选用Kruskal-Wallis H检验。
10
⑤分别求秩和:T+、T-。
T+与T-和等于n(n+1)/2。 ⑥可任取其一秩和作检验统计量,
本例T-=22。
11
3、确定P值和结论
n≤50时,查T界值表(P208) Tα下界<T<上界Tα P>α
T落在Tα上下界之外 P<α T等于Tα上界或下界 P<α
12
n=16-1=15 ( 1个秩次=0)
查表:
T0.05,15=25~95
T-=22或T+=98在界外
P<0.05 ,按α=0.05水准,拒绝H0,
接受H1,差别有统计学意义。可认为两种测
定结果不同。
13
n>50时,作u检验
| T n(n 1) / 4 | 0.5 u n(n 1)(2n 1) / 24
当相同的“差值绝对值”较多时,u值 偏小,应用校正公式计算:
… … 13 7 9 3.5 T+=98
1 2 … …
T-=22
9
d 20 10 -2 -2 13 31 0 -7 -5 36 -20 37 32 12 15 5
正T
负T
10.5 6 1 2 8 12 5 3.5 14 10.5 15 13 7 9 3.5
2、计算T值
①差值绝对值从小到
大编秩
第九章 非参数检验方法

20
n>25时,近似正态分布用u检验,公式为:
2 T~ ( T , T )
T n(n 1) / 4 T n(n 1)(2n 1) / 24
2013-7-24
u
T T
T
21
当相同秩次较多时(>25%),采用校正公式:
其中 ti 为相同秩次的个数
2013-7-24
1~10 5.5 22
正秩和 33
2
3 合计
2 5
2 4
7
6
11~17
18~23
14.0
20.5
28
41 T-=91
70
82 T+=185
24
2013-7-24
3、查表与结论
查T界值,T0.05(23)=73~203 T=min(T+,T-)=T-=91>73,P>0.05, 按α=0.05水准,不拒绝H0,即对28名有轻度牙周疾病的成年人, 指导他们实行良好的口腔卫生习惯,6个月后,牙周情况尚无显 著好转。
B 组: 1 2 3.5 6 7
A组的秩和:3.5+5+8=9+10=35.5 B组的秩和:1+2+3.5+6+7=19.5
2013-7-24
13
本章主要内容
配对设计差值比较的符号秩和检验
成组设计两样本比较的 Wilcoxon
Mann-Whitney检验 成组设计多个样本比较的秩和检验
某医院医生为了解矽肺病人血清黏蛋白含量,随机抽取正常人和I期矽肺病
人各10例,详细情况见下表。该医生根据此资料算得正常人的血清黏蛋白
含量的均数
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
七、两个配对样本检验非参数检验
2 related Samples Test
• (一)概念:在总体分布不清楚的情况下,对两个配对样 概念 本分别进行检验。配对即是同一个被测试者,前后测两次, 彼此相关。 • 有三种检验方法: • 1.两配对样本的McNemar检验 1.两配对样本的McNemar检验 两配对样本的McNemar • 它是通过两组样本前后变化的频率,计算二项分布的概率 值。 • 2.符号(Sign)检验 • 它是利用两样本数据相减所取正负号的个数进行检验 • 3.Wilcoxon符号等级检验 • 例如:分析10个学生训练前后成绩的差异状况。
三、单样本变量随机性检验
• 概念: 概念 • 单样本变量的随机性检验是对某变量的取值是否是随机的 进行检验,也叫游程检验。 • 游程 游程指样本序列中连续出现的变量值的次数。 • 其零假设 其零假设为:总体某变量的变量值的出现是随机的。 • 例题:某村发生一种地方病,其住户沿一条河排列,调查 时发病住户标记为1,非发病住户标记为0,共35户。
• (二)分析路径 • 1.Analyze-> Nonparametric Tests-> K independent Samples。 • 2.将因变量(成绩)添加到Test variable list中,将自变量 (班级)添加到Grouping variable中。 • 在test框中 • Kruskal-Wailis:检验多个样本总体分布是否有差异。 • Median:检验多个样本是否来自具有相同中位数的总体。 • 3.单击define range按钮,然后定义最大值好最小值。 • 4.单击Option选项(可不选) • 例如:随机抽取三个班的学生得到21个学生成绩样本,问 三个班学生总体成绩是否存在显著性差异。
• 分析路径 • (1)Analyze-> Nonparametric Tests-> 2 independent Samples • (2)将“使用寿命”添加到Test variable list中,将厂家 添加到Group Variable 中 • (3)单击Define Group按钮,定义组别。 • (4)单击Option按钮(可不按)
• (二)分析路径 • 1. Analyze-> Nonparametric Tests-> k related Samples 。 • 2.在弹出的对话框中,将要比较的变量添加到test variable 在弹出的对话框中,将要比较的变量添加到 在弹出的对话框中 根据不同的数据选择不同的比较方法。 中,根据不同的数据选择不同的比较方法。 • 3.单击 单击statistics按钮,选择 按钮, 单击 按钮 选择Descriptive. • 例如(1)检验10个人服用减肥药后,三次所称体重有无显 著性差异。( Friedman ) • (2)5个评为对5个节目打分判断标准是否一致(Kendall) • (3)调查10个用户对3个品牌电视机的满意度(Cochran)
• 分析路径 • (1) Analyze-> Nonparametric Tests->1-Sample KS • (2)将左侧“人数”添加到Test variable list中 • 在test distribution中选择理论分布
五、两独立样本非参数检验
• 概念 • 通过分析两个样本数据,推断它们各自的总体的分布是否 存在显著性差异。 • 零假设 零假设是样本来自的两独立总体的分布无显著性差异。 • 有四种检验方法 有四种检验方法: • Mann-Whitney U 检验 Mann检验:判别两独立样本的总体均值是否有 差异; • K-S Z检验 检验:推测两独立样本是否来自相同分布的总体; • Moses extreme reactions极端反应检验 reactions 极端反应检验:检验观测值散 极端反应检验 布范围是否有差异,检验两独立样本是否来自相同分布的 总体; • Wald Wolfwitz Runs 游程检验 Runs游程检验 游程检验:考察两独立样本是否来自 相同分布的总体。 • 例题:随机抽取两个厂家的灯泡的使用寿命存在显著性差 异。
二、二项分布检验
• 二项分布检验 二项分布检验是根据搜集到的样本数据,推断总体分布是否服从某个 指定的二项分布。其零假设是:样本来自的总体与某指定的二项分布 无显著性差异。 • 例题:某地某一时期出生35名婴儿,其中19名女婴,16名男婴,问 该地方婴儿出生性别比率是否与通常的男女比率相同? • 分析路径 • (1)Analyze Noneparametric Tests Binomial Test • (2)把gender添加到Test variable list中,在test proportion中键入0.5。 • Define dichotomy定义样本的取值范围 • Get from data 所有数据都参与检验 • Cut point 将不是二分的变量选择一个分割点,变成二分变量。 • (3)单击Opti •
分析路径 (1)Analyze Noneparametric Tests run Test (2)将“发病”添加到Test variable list中 Cut point有四个选项 Median以中位数作为分割点 Mode Mode以众数作为分割点 Mean以均数作为分割点 Custom 用户指定 3)单击Option按钮(可不按)
第九章 非参数检验
是指在总体不服从正态分布且分布情况不明时,用来检验数 据资料是否来自同一个总体假设的一类检验方法。由于这 些方法一般不涉及总体参数故得名。 • 这类方法的假定前提比参数性假设检验方法少的多,也容 易满足,适用于计量信息较弱的资料且计算方法也简单易 行,所以在实际中有广泛的应用。
• 非参数检验的概念
• (二)分析路径 • 1.Analyze-> Nonparametric Tests-> 2 related Samples • 2.在弹出的对话框中,将左侧两配对的连续变量 连续变量添加到 连续变量 test pairs list 中,选择Wilcoxon和Sign检验 Wilcoxon和 检验。完成操作 Wilcoxon Sign检验 • 3.再将左侧两配对的分类变量 分类变量添加到test pairs list 中,选 分类变量 择McNemar检验。 McNemar检验 McNemar检验。
• 非参数检验 非参数检验是指在总体不服从正态分布且分布情况不明时, 用来检验数据资料是否来自同一个总体假设的一类检验方 法。 • 这类方法的假定前提比参数性检验少得多,也容易满足, 适用于计量信息较弱(顺序等级、名义资料)的资料且计 算方法也简单易行,所以在实际中有广泛的应用。
非参数检验的类型
• • • • • • • • 1. Chi-Square test 卡方检验 2. Binomial test 二项分布检验 3. Runs test 游程检验 4. 1-Sample Kolmogorov-Smirnov test 一个样本柯尔莫哥 洛夫-斯米诺夫检验 5. 2 independent Samples Test 两个独立样本检验 6. K independent Samples Test K个独立样本检验 7. 2 related Samples Test 两个相关样本检验 8 . K related Samples Test 两个相关样本检验
六、多个独立样本的非参数检验
(K independent Samples Test)
• (一)概念:通过分析多个样本数据,推断它们的分布是 概念 否存在显著性差异。 • 有三种检验方法 有三种检验方法: • 1.中位数检验 1.中位数检验 • 分析多组独立样本的中位数是否存在显著性差异。 • 2.K-W检验 2.K• 它是Kruskal-Wailis的缩写,是一种推广的平均秩检验。 • 基本方法 基本方法是:将多组数据混合按升序排列,并求出每一个 观察值的秩,然后对多组样本的秩分别求平均秩。 • 3.多独立样本的Jonkheere-Terpstra检验 3.多独立样本的Jonkheere-Terpstra检验 多独立样本的Jonkheere • 用于分析样本来自的多个独立总体是否存在显著性差异。
一、总体分布的χ2检验
• 总体分布的χ2检验 总体分布的χ 检验适用于配合度检验,即根据样本的实 际频数推断总体分布与期望分布或理论分布是否有显著性 差异。其零假设为样本来自总体分布形态和期望分布或理 论分布无显著性差异。 • 其原理是:如果从一个随机变量X中抽取若干个观察样本, 这些观察样本落在X的k个互不相交的子集中的观察频数服 从一个多项分布,该多项分布在当k趋于无穷时,就近似 服从X的总体分布。 • 在实际中总体分布的χ2检验适合于一个因素的多项分类 在实际中总体分布的χ 数据的配合度检验。 数据的配合度检验。 • 例题:某地一周内患抑郁症人数分布见表,请检验每天患 抑郁症人数是否满足1:1:2:2:1:1:1。
四、单样本K-S检验 单样本K
• 单样本K-S检验是利用样本数据推断总体是否服从某一理 单样本K 检验 论分布,适用于探索连续型随机变量的分布形态(判断定 距变量的分布情况)。 • 单样本K-S检验 单样本K 检验可以将一个变量的实际频数分布与正态分 布(Normal )、均匀分布(Uniform) 、泊松分布 (Poisson) 、指数分布(Exponential)进行比较 。 • 零假设 零假设为:样本来自的总体与指定的理论分布无显著性差 异。 • 例题:某地144个周岁儿童身高是否符合正态分布
八、多个相关样本检验
K related Samples Test
• (一)检验方法 • 三种 • 1. Friedman检验:利用秩实现多个配对总体分布的检验, 数据要求为等距数据。 • 2.Kendall和谐系数检验:主要评价者的评判标准是否一致 或是否公平。 • 3Cochran Q检验:它所处理的变量为二分变量。
• 分析路径 分析路径: • (1)在数据编辑窗口定义变量 • (2)Data weight cases weight case by抑郁 人数,并添加到Frequency variable中。 • (3)Analyze Noparametric tests chi-square • (4)将变量“周日 周日”添加到 test wariable list中 周日 • 在Expected range中,get from data 表示所有观察数据 都参与检验,use specified range表示用户自定义范围。 • 在Expected Values中 • All categories equal 表示所有分组的期望概率相同, Values表示用户输入期望的频率数,输入后点击add即可。 • (5)单击Option按钮(可点看不点)