第7章 非参数检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

例:猝死人数与日期关系是否为 2.8:1:1:1:1:1:1
举例
7.1.2 二项检验
二项检验属于拟合优度型检验, 该检验法适用于只能划分为两类的数 据总体,如:男生和女生、小于或等 于某值的数和大于该值的数。对于取 自该总体的所有可能结果,要么是这 两类中的某一类,要么是另一类,不 可能同时属于对立分类中的两类,称 具有这种分类特征的数据所服从的分 布为二项分布。
Chi-Square过程
Chi-Square过程其分析目的是检验分类 数据样本所在总体分布 (各类别所占比例) 是否与已知总体分布相同,是一个单样本检 验。
常用的行×列表卡方检验也是属于卡方 检验系列的一种,但其分析目的是比较两个 分类资料样本所在的总体分布是否相同,在 SPSS中应当使用 Crosstabs过程来完成。
3.Jonkheere-Terpstra检验
7.4两配对样本的非参数检验
1.Wilcoxon符号秩检验
2.符号检验 3.Mcnemar变化显著性检验
7.5多配对样本的非参数检验
1.Frieman检验
2.Kendall协和系数检验
3.Cochran’s Q检验
对比:参数检验
参数检验是在已知总体分布 的条件下,对相应分布的总体参 数进行估计和检验。比如单样本 u检验就是假定该样本所在总体 服从正态分布,并已知方差,然 后来推断总体的均数是否和已知 的总体均数相同。
Wilcoxon W统计量和MannWhitney U统计量
1. Wilcoxon W=Wx,若m>n; Wilcoxon W=Wy,若m<n; Wilcoxon W为第一个观测值所在样本的 W值,若m=n; 2. Mann-Whitney U=W-n(n+1)/2 在小样本下U统计量服从曼-惠特尼分布, 大样本下U近似服从正态分布。
Kruskal-Wallis H检验
实质为Mann-Whitney U检验的推广,其基本思路: (1).多组样本混合按升序排列,并求出各变量的秩; (2)考察各组秩的均值是否存在显著差异。 研究各组秩的均值差异可利用方差分析法。
若秩的均值存在显著差异,则认为多总体的分布 有显著差异。
Kruskal-Wallis H检验
Nonparametric Tests 菜单
Nonparametric Tests 分类
1.分布类型检验方法
检验样本所在总体是否服从已知的理论分布。
具体包括检验多项/二项分类变量分布的Chi-Square过程; 检验二项分类变量分布的Binomial过程;检验样本序列 随机性的Runs过程;以及检验样本是否服从各种常用分 布的l-Sample K-S过程
基本操作步骤:
1. Analyze->Nonparametric Tests -> 2 Independent Sample; 2.选择待检验变量到Test Variable框中; 3.指定存放样本标志值的变量到Grouping Variable 框; 4.选择非参数检验方法。
SPSS实现1
中位数检验
(2)卡方检验要求样本容量一般大于50。
(3)当样本数据的分类只有两类时,用二 项检验。样本容量小到卡方检验不能用时, 二项检验是唯一可用的检验。
比较
(4)资料分类是若干离散型类别,以 及当期望的频数足够大时,最好用卡方 检验。
(5)样本数据为连续分布时,最好用 K-S检验。
That’s
you!
其中,Qi=归入第i类中的观测数目;
Ei=零假设成立时第i类中的期望事件数。
此公式先将每一类别中的观测和期望的频 数之差的平方除以相应的期望频数,然后对所有 的k类求和。 如果观测和期望的频数接近一致,则其差 (Qi—Ei)就小,因而Χ2就小;反之,若其差大, 则Χ2 的值也越大。当Χ2 越大时,观察的频数就 越不可能是来自于以零假设为基础的整体。
Nonparametric Tests 优点
1. 可应用于各种不同的情况,不受 总体分布的限制;
2. 适合处理无法精确数量化的名目 资料和小样本资料;
3. 计算通常较简单且容易理解。
Nonparametric Tests 缺点
1. 将量的资料转换为质的资料时, 漏失了数据的一些信息;
2. 检验的敏感度和效果均不如参 数检验好。 但是:根据国外的一项研究,有些方 法的检验效能大约在参数检验方法的 95%左右,并非低得不能接受。
Jonkheere-Terpstra检验
基本思想与Mann-WhitneyU检验类似: (1).计算 U; ij i组样本的观测值小于j组样本 的观测值的个数; U ij i<j范围求和,产生 (2)对所有的 在 Jonkheere-Terpstra统计量
J T U ij
i j
若J-T统计量远大于或远小于J-T均值,则 认为多总体的分布有显著差异。
7.1.1 卡方检验(Chi-Square过程)
Χ2检验就是根据样本数据推断总体的 分布与期望分布或某一理论分布是否有显著 H0 差异。它的原假设是 :样本来自的总体其 分布形态与期望分布无显著差异。进行检验 时,需要构造统计量:
2 ( O E ) 2 i i Ei i 1 k
2 ( O E ) i 2 i Ei i 1 k
选择何种检验方法
取决因素:成本、时间、效度、可用资料 的总数、可用资料的形式、抽样方法、总体的 属性、以及第I、Ⅱ类错误的概率(α和β)等。 在检验中,若可以获得参数检验所需的假 设资料,当然选择适当的参数检验法,若对于 来自神秘总体或较稀少的试验,可能使用非参 数检验较为合适,但当面对等级化资料时,则 只能使用非参数检验方法。
all…
Thank
Mann-Whitney U检验
该检验可用来检验两个独立样本是否取自 同一总体,它是最强的非参数检验之一, 基本思路(1)将样本X和样本Y混合后作升序排 列,计算每个数据的秩; (2)分别对两样本的秩求平均,得到两个平均 秩,分别用W1=WX/m和W2=WY/n表示。 若W1和W2比较接近,则说明两个样本来自相 同分布的总体,若W1和W2差异较大,则说明 两个样本来自不同的总体。
例:产品一级品率是否为90%
7.1.3 单样本K-S检验
该检验为拟合优度检验,可以检验 样本数据是否服从指定的理论分布,适 用于探索连续型随机变量的分布形态, 如正态分布、均匀分布、指数分布等。
原假设:样本来自的总体与指定的理论 分布无显著差异
单样本K-S检验基本思路
假定F0(x)是一个已知的分布函数,Fn(x) 是未知的总体分布函数F(x)的样本经验 分布函数,取检验统计量: D=max︳Fn(x)- F0(x)︳ 在样本数据服从指定分布时,D的观测 值应该较小,如果D的观测值较大,则 零假设可能不成立。
一、卡方检验
二、二项检验 三、柯尔莫哥洛夫—斯米诺夫检验 四、游程检验
7.2两个独立样本的非参数检验
1.Mann-Whitney U检验 2.柯尔莫洛夫—斯米诺夫双样本检验 3. Wald-Wolfowitz游程检验 4. Moses极端反应检验
7.3多个独立样本的非参数检验
1.中位数检验
2.Kruskal-Wallis H检验
Chi-Square过程具体做法
Chi-Square检验先按照已知总体的构成 比分布计算出样本中各类别的期望频数,然 后求出观测频数和期望频数的差值,最后计 算出卡方统计量,利用卡方分布求出P值, 以得出检验结论。
Chi-Square过程具体做法
(1)菜单Analyze->Nonparametric Test>Chi Square (2)选定待检验的变量到Test Variable框 中 (3)在Expected Range框中确定待检验样本 的取值范围 (4)在Expected Values框中给出期望分布 的频数
K—S双样本检验
该检验可用来检验两个独立样本是否取自同 一总体。 基本思路 (1)将样本X和样本Y混合后作升序排列; (2) 分布计算两组样本秩的累计频数和每个点 上的累计频率Fn1(x)和Fn2(x); (3) 计算D=max[Fn1(x)- Fn2(x)] 如果D 较小,则可以认为两个样本取自同一 个总体;如果D较大,大到一定程度,则可以 认为两个样本不是取自同一总体的。
第七章
定义:
非参数检验
非参数检验的着眼点不是总体的某个 (或某些)参数,而是总体的分布情况— —即研究目标总体的分布是否与已知理 论分布相同;或者各样本所在总体的分 布位置、形状是否相同。
由于这一类方法并不涉及总体参数, 因而被称为非参数方法。
非参数检验所要处理的问题
• (1)只涉及一个总体时,检验总体的分 布是否为某指定的已知分布; • (2)涉及多个总体时,检验它们的分布 是否相同 注:两种分布是否相同,一般看两者 类型及参数(均值、方差等)是否完全 一致。如果两个总体的分布类型相同, 而参数不同,也被视为概率分布不同。
单样本K-S检验具体做法
(1)菜单Analyze->Nonparametric Test->1-Sample K-S (2)选定待检验的变量到Test Variable list框中 (3)在test distribution框中选 择理论分布。
例:周岁儿Байду номын сангаас身高的总体分布是否为 正态分布
7.1.4 游程检验
Wald-Wolfowitz游程检验
Moses极端反应检验
Moses极端反应检验
基本思路: (1).将一样本作为控制样本,另一样本作为 实验样本。两样本混合后按升序排列; (2).找出控制样本的跨度(最低秩和最高秩 间的样品数)和截头跨度(去掉控制样 本的最小值和最大值后的跨度)。 若跨度(截头跨度)很小,认为样本存在 极端反应。
单样本变量值随机检验具体做法 (1)菜单Analyze->Nonparametric Test->Runs (2)选定待检验的变量到Test Variable list框中 (3)在Cut Point框中确定计算游 程数的分界点。
例:设备工作是否正常
比较
(1)当检验的假设是关于样本是否来自一 指定分布总体的问题时,可采用三种具有 拟合优度类型的检验方法中的一个,即卡 方检验、二项检验和K-S检验。
二项检验基本思路
原假设:样本来自的总体与具有指定的二 项分布无显著差异。 精确检验:计算二项分布概率。 近似检验:样本量大于30时,采用修正后 的Z统计量 x 0.5 np
Z np(1 p)
X>n/2时取减号,X<n/2时取加号
二项分布检验具体做法
(1)菜单Analyze->Nonparametric Test>Binomial (2)选定待检验的变量到Test Variable框 中 (3)在Expected Range框中确定待检验样本 的取值范围 (4)在Test框中给出二项分布的检验概率值
2.分布位置检验方法
用于检验样本所在总体的分布位置/形状是否相同.
具体包括用于成组资料分布位置检验的2 Independent Samples与K Independent Samples过程;以及用于配对 资料分布位置检验的2 Related Samples与K Related Samples过程
7.1单个样本的检验
基本操作步骤:
1. Analyze->Nonparametric Tests -> K Independent Sample; 2.选择待检验变量到Test Variable框中; 3.指定存放样本标志值的变量到Grouping Variable 框; 4.选择非参数检验方法。
假设观测结果可以表示为0和1的序列, 把0和1连续出现构成的数据段称为一个游 程,总的数据段称为游程总个数。
例如:把下面序列:0011101100 中,00、111、0、11、00当作游程,游程 总个数为5。
当游程总数太大(周期性)或太小 (不随机)时,认为样本数据不是随机序列。
游程检验
游程检验有游程最大长度检验和游 程总数检验两种检验方法,SPSS采用的 是游程总数检验方法,用该法可以检验 一组样本数据是否来自同一总体(或差 异不明显服从同一分布),即考察按随 机顺序得到的一组样本的观测值是否表 现出足够的随机性。
相关文档
最新文档