第6章非参数检验

合集下载

非参数检验 PPT课件

非参数检验 PPT课件
如果此假定不成立或不能确定是否成立, 就应采用秩和检验来分析两样本是否来自同 一总体。
例9.3 对无淋巴细胞转移与有淋巴细胞转移的胃癌患者,观察其 生存时间,问两组患者的生存时间是否不同?
基本思想
混合编秩 分别计算两组的秩和 假定H0成立 任一组秩和不应太大或太小 与平均理论秩和 N(N+1)/4 应相差不大
思考:单样本计量资料当数据不满足正 态性时如何去分析?
例9.2 对28名有轻度牙周疾病的成年人,指导他们实行良好的 口腔卫生习惯,6个月后,牙周情况好转程度依高到低给予分 数+3,+2,+1;牙周情况变差程度依次给予分数-1,-2,-3,没有 变化的给予0分,请对此项指导结果进行评价。
T0.05(23)=73-203
非参数检验 PPT课件
▪ 单样本t检验(正态分布) ▪ 配对样本t检验(差值满足正态分布) ▪ 两独立样本t检验(正态分布、方差齐性) ▪ 完全随机设计方差分析(正态分布、方差齐性) ▪ 随机区组设计方差分析(正态分布) ▪ 等级资料
当上述统计方法所对应的条件不满足,该如何对数据做分析?
非参数检验适用的资料
=0.05。
编秩:混合编序.先在各组内从小到大排队,再将几组统 一编秩:同组相同数据,秩次顺列;不同组相同数据,取 平均秩次。 求秩和:R1,R2、R3、R4 ……
下结论: 当处理组数小于等于3组时,且各组例数小于等于5.查附表 11,确定P值.
当 n 较大时,计算统计量H值, H 近似服从 = k – 1 的 2 分布。故可按 2 分布获得概率 P,作出统计推
本例秩和T1=162,T2=138。
查表 T0.05n1n249 115,取9较小样本量者为统计量, T=162,恰好落在界点外,所以P<0.05,按0.05水准, 拒绝H0,即两组患者的平均生存时间不同。

第6章 非参数检验

第6章 非参数检验

第六章非参数检验在前面的章节中我们介绍了多种假设检验的方法,例如单个总体的t检验、基于两个独立样本的t检验、基于两个匹配样本的t检验、方差分析等。

在这些检验都需要对总体的分布特征作出某些假设(例如在t检验和方差分析中都需要假设总体服从正态分布),然后根据检验统计量的抽样分布对总体参数(如均值、比率等)进行检验。

这类检验方法称为参数检验。

我们前面强调过,在需要的假设条件不满足的情况下,特别是小样本的情况下,t检验、F检验都是不适用的。

那么,如何检验数据是否来自正态分布或者其他分布?在参数检验假设条件不满足的情况下如何对相应的问题进行分析?非参数检验方法可以帮助我们回答这类问题。

在这一章中,我们将首先简要说明非参数检验的概念和优缺点,然后介绍几种常见的非参数检验方法及其在SPSS中的实现方法。

第一节非参数检验概述非参数检验(nonparametric tests)也称为与总体分布无关的检验(distribution free tests),与参数检验相比,在非参数检验中不需要对总体分布的具体形式作出严格假设,或者只需要很弱的假设。

大部分非参数检验都是针对总体的分布进行的检验,但也可以对总体的某些参数进行检验。

与参数检验相比,非参数检验主要有以下几个方面的特点:(1)非参数检验不需要严格假设条件,因而比参数检验有更广泛的适用面。

(2)非参数检验几乎可以处理包括定类数据和定序数据在内的所有类型的数据,而参数检验通常只能用于定量数据的分析。

(3)虽然对于满足参数检验的假设条件的数据也可以采用非参数检验法进行分析,但在参数检验和非参数检验都可以使用的情况下,由于非参数检验没有充分利用样本内所有的数量信息,因此其检验的功效(power)要低于参数检验方法。

也就是说,在备择假设为真的情况下,采用参数检验方法拒绝原假设的概率要高于非参数检验的方法,从而更容易发现显著的差异。

在假设检验中,犯取伪错误的概率记为β,则1-β越大,意味着当备择假设为真时,拒绝原假设的概率越大,检验的判别能力就越好;1-β越小,意味着当备择假设为真时,拒绝原假设的概率越小,检验的判别能力就越差。

第6章 非参数检验

第6章 非参数检验
8.5
3 1
17
8.5
8 4
5 2
13 6
7 3
19 10
8+9 = 8.5 2
中央财经大学统计学院 37
Wilcoxon符号秩检验:基本原理 符号秩检验: 符号秩检验
分别计算出差值序列中正数的秩和以及负 数的秩和。 显然,如果零假设成立,W+与W-应该比较 接近。如果二者过大或过小,则说明零假 设不成立。 将正数的秩和或者负数的秩作为检验统计 量,根据其统计分布计算p值,从而可以得 出检验的结论。
中央财经大学统计学院 38
特别说明
符号检验在匹配数据分析应用中只用到差 值的符号,而对差值数值的大小未能考虑, 因而失去了部分信息。Wilcoxon符号秩检 验既考虑差值的符号,又考虑差值的大小, 因此在所需的假设条件满足时其功效比符 号检验高。 Wilcoxon符号秩检验也可以用于单样本中 位数的非参数检验,这时只需要将第二个 样本的值设为零假设中的数值即可。
中央财经大学统计学院 33
符号检验
对于差值序列中正数的个数和负数的个数 按照符号检验的方法进行假设检验
中央财经大学统计学院
34
Wilcoxon符号秩检验:基本原理 符号秩检验: 符号秩检验
计算差值绝对值的秩 。 将差值绝对值从小到大排序,其位次就是 的秩(rank),等于0值不参与排序。
中央财经大学统计学院
中央财经大学统计学院 18
软件操作
在SPSS软件中打开数据文件,选择“分析” “非参数检 验” “1样本K-S”,在弹出的对话框中将“时间”设定为 检验变量;检验分布为默认的“常规”(正态分布)。单 击 “确定”
中央财经大学统计学院
19
结果分析

非参数统计分析第六章课后答案

非参数统计分析第六章课后答案

非参数统计分析第六章课后答案问题1:设有10个教师分别在两个学校中进行教学,分别记录了每位教师每日的教学小时数。

假设这两个学校的教学小时数分布不符合正态分布。

现在我们想要比较这两个学校的教学小时数平均值是否相等。

解答:对于这个问题,我们可以使用非参数统计方法-秩和检验。

首先将每个教师的教学小时数按照从小到大的顺序排列,并为每个小时数分配一个序号,即用秩来代替实际的数值。

然后根据两个学校的秩之和来进行比较。

步骤如下:1.将每个学校的教学小时数按照从小到大的顺序排列,并为每个小时数分配一个序号(秩)。

2.计算两个学校的秩和,并求出差值。

3.利用秩和差值来估计两个学校教学小时数平均值的差异性。

4.根据差异性的大小,进行假设检验,判断两个学校的教学小时数平均值是否相等。

问题2:某农场试验了两种肥料对苹果树生长的影响。

为此,从两个农场中随机选择了64棵苹果树,并给予不同的肥料进行处理。

试比较两种处理的效果是否相同。

解答:对于这个问题,我们可以使用非参数统计方法-符号检验。

符号检验是一种用于比较两个相关样本的方法,适用于样本量较小或者数据不符合正态分布的情况。

步骤如下:1.对于每棵苹果树,比较两种处理对树的生长效果,根据生长情况给予正或负的符号。

2.统计正负符号的个数,得到两种处理的得分。

3.根据得分判断两种处理的效果是否相同:如果得分大致相等,则说明两种处理的效果相同;如果得分明显偏向一种处理,则说明两种处理的效果不同。

问题3:某个城市公交车站每小时通过的乘客数量分别为:20、18、14、26、22、24、16、12、16、20。

我们想要推断乘客数量的中位数。

解答:对于这个问题,我们可以使用非参数统计方法-中位数检验。

中位数是一种非参数的统计量,它不受极端值的影响,适用于数据分布不符合正态分布的情况。

步骤如下:1.将数据按照从小到大的顺序排列。

2.根据数据的个数,找出中间位置的数值,即中位数的位置。

3.如果数据个数为奇数,则中位数即为中间位置的数值;如果数据个数为偶数,则计算中间位置两个数值的平均值作为中位数。

非参数检验

非参数检验

非参数检验的概念
非参数检验又称为任意(不拘) 非参数检验又称为任意(不拘)分布检验 distributiontest), ),这类方法 (distribution-free test),这类方法并不依赖总
非 参 数 检 验
体分布的具体形式,应用时可以不考虑研究变量 体分布的具体形式, 为何种分布以及分布是否已知,进行的是分布之 为何种分布以及分布是否已知, 间而不是参数之间的检验,故又称非参数检验
参数检验的特点
分析目的:对总体参数(µ π)进行估计或检验。 进行估计或检验。 分析目的:对总体参数(
非 参 数 检 验
分布:要求总体分布已知, 分布:要求总体分布已知,如:
•连续性资料——正态分布 连续性资料——正态分布 •计 数 资 料——二项分布、POISSON分布等 ——二项分布 POISSON分布等 二项分布、
序号 (1) 1 2 3 4 5 6 7 8 9 10 11 12
数据 (2) 39 42 45 43 52 45 22 48 40 45 40 49
排秩 ( 3)
非 参 数 检 验
非 参 数 检 验
疗效
A组 (1 ) 15 11 20 8
B组 (2 ) 12 3 7 4
排秩
平均秩次
控制 显效 有效 近控
参数检验方法的局限
非 参 数 检 验
t检验 成组t 成组t检验要求:正态、方差相等、个体独立 配对t 配对t检验要求:差值正态、个体独立 方差分析 单因素多水平比较方差分析要求:正态、方差 相等、个体独立 多个分析因素时方差分析要求:分布、方差、 个体独立性
定性无序分类资料
非 参 数 检 验
两组性别结构是否相同? 两组某种不良反应的发生率是否相同? 多组发生率是否相同? 多组构成是否相同?

参数检验与非参数检验的区别及优缺点.ppt

参数检验与非参数检验的区别及优缺点.ppt

u
T n1(N 1) / 2 0.5
n1n2
12N (N 1)
N
3

N

(t
3 j

tj)
uc=u/c1/2
C20=19-18-1-7∑(t3j-tj)/(N3-N) 感谢你的观看
17
式中tj为第j个相同秩次的个数。 总秩和等于N(N+1)/2
T1=n1(N+1) /2
T2=n2(N+1) /2
复习
参数:反应总体特征的指标; 如: N、 、
统计量:反应样本特征的指标; 如:n、 x、s
2019-8-17
感谢你的观看
1
第十一章 秩和检验
2019-8-17
感谢你的观看
2
参数统计
(parametric statistics)
非参数统计
(nonparametric statistics)
已知总体分布类型,对 未知参数(μ、π)进行 统计推断
2019-8-17
感谢你的观看
12
二 成组设计两样本比较的秩和检验 (Wilcoxon两样本比较法)
1、原始数据的两样本比较;
例11.2 为了比较甲、乙两种香烟的尼古丁含 量(mg),对甲香烟作了6次检测,对乙香烟作了 8次检测,问两种香烟中尼古丁含量有无差别?
2019-8-17
感谢你的观看
13
甲种香烟
2.计算检验统计量T值
(1)编秩 先将两组数据由小到大分别排队,再将 两组数据从小到大统一编秩,如遇相同数据在同 一组内,按位置顺序编;如相同数据不在同一 组内,应取平均秩次 。
(T;2)如求果秩两和样:本含含量量较相小等的,样那就本任计取为一n1,个其样秩本和的记秩和为。

第6章 两组定量资料比较

第6章 两组定量资料比较

H 1 : m1 ¹ m 2
(2)计算检验统计量:
t ' =
X 1 - X
2
2 2 s 1 s 2 + n 1 n 2
分母
S1 S 2 是 X - X 的标准误。 1 2 + n n 1 2
2
2
本例:
t ' = X 1 - X 2 s 2 s 2 1 + 2 n n 1 2
(3)确定P值,判断结果: v = n - 1 1 1
1 2
v = n - 1 2 2
当F>临界值 F0.1, v , v 时,则可以认为 两总体方差不齐,反之不能否认方差齐性 的无效假设。
例6­1的方差齐性检验统计量为
S 2 ( 较大 4 560 2 ) . 1 F = 2 = = 1 426 . 2 S 2 ( 较小) 3 818 .
S =1.35mmol/L 1
, 对照组: n2 = 50 X 2 = 13.2mmol/L,
S =4.20mmol/L 2
试问两种处理疗效的总体均数是否相同?
认为两组资料方差不齐: 进行校正t 检验。
(1)建立检验假设确定检验水准
H 0
: m1 = m2
a = 0. 05
H :资料服从正态分布 0 H :资料不服从正态分布 1
(四)两组独立样本的秩和检验
1. 问题的提出:
前面学习了连续型资料两组样本均数差 异的假设检验方法: ★小样本用t检验,条件是变量服从正态分 布和方差齐。 ★大样本用Z检验(中心极限定理)。
例6­3 某医师为研究血铁蛋白与肺炎的关系,随机 抽查了肺炎患者10名和正常人16名,并测得血铁蛋 白(μg/L)含量。 问肺炎患者与正常人平均血铁蛋白含量有无差 别? 肺炎患者:31 68 237 174 457 492 199 515 599 238 正常人:177 172 34 47 132 54 47 52 47 294 68

SPSS数据分析教程-第6章-非参数

SPSS数据分析教程-第6章-非参数
Moses extreme reaction 比较各组的中位数
Median test
独立样本检验举例
➢ 一个公司把他们的销售代表随机分到三个 不同的组中,进行不同的培训。两个月后 对销售进行考察,我们想通过非参数检验 比较不同组别的销售代表考试得分是否有 显著性差异。这里,不同组别的考试得分 是相互独立的,因此为独立样本数据,我 们采用独立样本非参数检验。

独立样本包括两个独立样本或者两个以上的独 立样本。
➢ SPSS提供的独立样本非参数检验的方法有:
两个独立样本分布的比较
Mann-Whitney U
Kolmogorov-Smimov
Wald-Wolfowitz K个独立样本分布的比较
Kruskal-Wallis
Jonckheere-Terpstra 比较全矩
➢ Wilcoxon符号秩检验用于检验样本所来自的 总体的中位数和所给的值是否有显著区别。 该检验适用于连续型数据(或者尺度数 据),它把观测值和原假设的中心位置之 差的绝对值的秩分别按照不同的符号相加 作为其检验统计量。
➢ Wilcoxon符号秩检验的假设为:
样本所来自的总体的中位数等于给定的数值。
游程检验
➢ 游程检验用于检验某一变量的两个值的出 现顺序是否随机,对于连续型变量的随机 性检验也可以转化为只有两个取值的分类 变量的随机性的检验。游程检验通过对样 本观测值的分析,用来检验该样本所来自 的总体序列是否为随机序列(又称为白噪 声序列)。它也可以用来检验一个样本的 观测值之间是否相互独立。
二项式检验
➢ SPSS的二项式检验通过样本数据检验样本 来自的总体是否服从指定的二项分布。例 如,现代社会男、女的比例是否为1.01:1; 工厂的次品率是否为1%等都可以通过二项 式检验完成。

非参数检验-秩和检验-研-精选文档

非参数检验-秩和检验-研-精选文档

-4.5
T+=15.5 T-=29.5
11
方法步骤:
1、建立检验假设,确定检验水准 H0:患者治疗前后白细胞总数差值的总体中 位数Md=0 H1:……差值的总体中位数Md≠0
α=0.05
12
2、计算检验统计量T值
(1)求差值
(2)编秩次:
按绝对值大小差值为Βιβλιοθήκη 舍去不计秩次相等取平均秩次
(3)求秩和:T+ T- (T++T- =n(n+1)/2)
(4)确定检验统计量T:(任取T+或T- )
13
3、确定P值,作出推断结论
根据T值( T+=15.5 或 T-=29.5 )查T 界值表(P282) 原则:如果T位于检验界值区间内,P>, 不拒绝H0;如果T位于检验界值区间外,
P,拒绝H0,接收H1
14
正态近似法:
n>25时,T分布近似正态分布可用正
4
非参数检验适用于:
非正态分布的资料 方差不齐的资料 等级资料 一端或两端有不确定数值(如>10.0、 <0.1等)的资料 分布不明的资料
5
非参数检验的优缺点:
优点:
适用范围广 对数据要求不严 方法简便、易于理解和掌握
缺点:
损失信息、检验效能低
符合条件 不符合条件 首选参数检验 非参数检验
第七章
非参数检验
(Nonparametric test)
1
检验方法的选择及应用条件:
t检验: u检验: 方差分析:
2
参数: 统计量: 参数检验:若样本所来自的总体分布 已知(如正态分布),对其总体参数 进行假设检验,则称为参数检验。

第6章非参数检验

第6章非参数检验
1. 实例内容 某足球俱乐部想要引进一名优秀的前锋运动员以增强前场攻击力。
下图给出了一名目标球员连续30场比赛进球数据。试用游程检验方法研 究该球员状态,判断其发挥是否稳定。
6.3.3 课堂练习:运动员状态稳定性判断
2. 实例操作
选择菜单栏中的【分析】∣【非参数检验】∣【旧对话框】∣【游程】命令, 弹出如下图所示对话框。
在【单样本K-S检验】对话框的候选变量列表框中选择变量,将其添加至【检验 变量列表】列表框中,选择的变量就是要进行分析的观测变量。
【检验分布】对话框用于指定检验的分布类型,包括以下4个复选框。 【常规】:选择此项,则检验变量是否服从正态分布,这是系统默认选项。 【相等】:选择此项,则检验变量是否服从均匀分布。 【泊松】:选择此项,则检验变量是否服从泊松分布。 【指数分布】:选择此项,则检验变量是否服从指数分布。
0

2
10
5
Fn
(
x)

10

6
10

9
10
1
x 1 1 x 2 2 x4 4 x5 5 x 10 x 10
6.4.2 单样本K-S检验的SPSS操作详解
选择菜单栏中的【分析】∣【非参数】∣【旧对话框】∣【单样本K-S】命 令,弹出【单样本K-S检验】对话框,如下图所示。这是的主操作窗口。
6.4.3 课堂练习:考试成绩是否服从正态分布
1. 实例内容 下图给出了山东某大学某专业30名男生的百米速度。试用单样本K-S检验 方法研究其是否服从正态分布。
6.4.3 课堂练习:考试成绩是否服从正态分布
2. 实例操作 选择菜单栏中的【分析】∣【非参数】∣【旧对话框】∣【单样本

《概率论》第六章假设检验

《概率论》第六章假设检验

例1 某服务系统的相应时间服从正态分布,需求 其平均相应时间在0.5秒之内。若16次抽样测试得 到样本平均值为x=0.56秒,样本标准差为s=0.12秒, 该服务系统工作是否正常?(=0.05)
解:H0 : 0.5 n=16 =0.05 t1 1.753 t x 0 0.56 0.5 =2 >1.753 s n 0.12 16
因此否定H0 即该服务系统工作不正常
(二)未知方差2,关于期望的检验
1.检验假设(单边)H0 : 0 H1 : 0
2.选取检验统计量 T X 0 [ t(n 1)] Sn
3.由备选假设确定拒绝域形式,W=(t c)
4.由显著性水平决定临界值c=t (n 1),
2.选取检验统计量 T X 0 [ t(n 1)] Sn
3.由备选假设确定拒绝域形式,W=(t c)
4.由显著性水平决定临界值c=t1 (n 1),
P T t1 (n 1)
5.求出检验统计量的观测值,判断是否在拒绝域中
即:若t t1 (n 1),则否定H0; 若t t1 (n 1),则接受H0.
因此这实际上需要比较第二个正态总体 的期望值是与第一个正态总体期望值相 等还是比它高?
这种作为检验对象的假设称为原假设, 通常用 H0表示。比如, 例2中的待检假设为:H0:Eξ=3140
如何根据样本的信息来判断关于总体分布的 某个设想是否成立,也就是检验假设H0成立 与否的方法是本章要介绍的主要内容。
P T t (n 1)
5.求出检验统计量的观测值,判断是否在拒绝域中
即:若t<t (n 1),则否定H0; 若t>t (n 1),则接受H0.
(二)未知方差2,关于期望的检验

第6章 SPSS的非参数检验(共109张PPT)

第6章 SPSS的非参数检验(共109张PPT)

0.63 0.95 0.95 0.95 0.91 没有可比
较的
6.2 SPSS 在卡方检验中的应用
1.使用目的 卡方检验〔Chi-Squar Test〕也称为卡方拟合优度检验,是K.Pearson 给出的一种最常用的非参数检验方法。它用于检验观测数据是否与某 种概率分布的理论数值相符合,进而推断观测数据是否是来自于该分 布的样本的问题。
• Step02:选择检验变量
在【Binomial Test(二项式检验)】对话框左侧的候选 变量列表框中选择一个或几个变量,将其添加至【Test Variable List(检验变量列表)】列表框中,表示需要进行 进行二项分布检验的变量。
• Step03:定义二元变量
在【Define Dichotomy(定义二分法)】选项组中可以 定义二元变量。
表6-1 参数检验和非参数检验的效率比较
应用
参数检验
非参数检 验
对正态总 体的 非参 数检 验的 效率 评价
配对样 本数 据
t检验或者 z检验
符号检验 Wilcoxon
两个独 立样 本
多个独 立样
t检验或者 z检验
方差分析 (F检验)
线性相关
无可用的
检验
Wilcoxon 检验
K-W检验 秩相关检

最后,单击【OHK(0确:定)样】按本钮,来操自作完的成。总体与某个指定的二项分布无显著性差异。 966227,9大70于显10著54H性9水187平:09.6样7 9本69 来967自10的01 总994体993与某个指定的二项分布有显著性差异。
P由e于rc三en种tile糖s果的S卡P路SS里会含量自独动立,计故算引入出多二独立项样分本布非参检数验检验相方应法。的检验统计量及对应的概率P值。如果概率P 3 实例分析:值糖小果中于的或卡路等里于用户设定的显著性水平,那么拒绝零假设,认为总体与某个指定的二 (提2-示ta:ile可d)以在项【分Tes布t D有istr显ibut著ion性(检验差分异布);】选相项反组中的选,择检如验果分概布类率型P;值大于显著性水平,那么接受零假设。 在【Test Distrib需uti要on(注检验意分的布)】是选,项二组中项,分用户布需检要选验择过待检程验要的理求论变分布量。必须是数值型的二元变量〔只取两个 就它单此是击数 指 【据在Op你总tio的体可量ns结不】能;论服按是从假值钮什正,的设么态在?分变变弹布出量量且的分〕不对布话。是情框假二况的不【元设明S变变时tat,i量量st用ic是,s来(统检字需计验量符要数)据】型设资选的置料项是组,断否中可点来勾自选以将同【使数一De个用据sc总r重分ip体ti假v编为e设(描码两的述个功一性类)能局】检和将部验【方其,Q法u转将。arti化大les(为于四分数断位值点数)型值】复变的选框,表示输 出根本统计量归。为一组,其余归为另一组。

统计学非参数检验

统计学非参数检验
假定较少 不需要对总体参数的假定 与参数结果接近 针对几乎所有类型的数据形态。 容易计算 在计算机盛行之前就已经开展起来。
非参数检验的弱点
可能会浪费一些信息 特别当数据可以使用参数模型
的时候 大样本手算相当费事 一些表不易得到
参数检验
〔parametric 总体分t布es类t〕型,对未知
➢ 在参数检验和非参数检验都可以使用的情况下, 非参数检验的成效〔power〕要低于参数检验方 法。
以下情况下应当首选非参数方法
➢ 参数检验中的假设条件不满足,从而无法应用。例 如总体分布为偏态或分布形式未知,且样本为小样 本时。
➢ 检验中涉及的数据为定类或定序数据。 ➢ 所涉及的问题中并不包含参数,如判断某样本是否
在非正态总体小样本的情况下,假如要对总体 分布的位置进展推断,由于t检验不适用,也 可使用符号检验的方法。
在数据呈偏态分布的情况下,我们可能对总体 的中位数更感兴趣,希望对总体的中位数作出 推断,这时可以使用符号检验的方法。
例6.3 在某地区随机调查了60个家庭的月收入。 〔数据文件:家庭月收入.sav〕。根据样本数 据能否认为总体中家庭月收入的中位数等于 5000元〔显著性程度a=0.05〕?
c2统计量的分布与自由度有关; c2统计量描绘了观察值与期望值的接近程度
拟合优度检验〔goodness of fit test〕
用c2统计量进展统计显著性检验的重要内容之 一;
根据总体分布状况,计算出分类变量中各类别 的期望频数,与分布的观察频数进展比照,判 断期望频数与观察频数是否有显著差异,从而 到达对分类变量进展分析的目的。
非参数统计的名字中的“非参数(nonparametric) 〞意味着其方法不涉及描绘总体分布的有关参 数;

非参数检验ppt课件

非参数检验ppt课件
非参数检验的优点与缺点
优点: ①适用范围广,不受总体分布的限制; ②对数据的要求不严,如某些指标难以准确测定,只
能以严重程度、优劣等级、先后次序等表示的资料 也可应用; ③方法简便,易于理解和掌握。 缺点: 如果对符合参数检验的资料应用非参数检验,因不能 充分利用资料提供的信息,会使检验效能低于参数 检验;若要使检验效能相同往往需要更大的样本含 量。
4
常见心律失常心电图诊断的误区诺如 病毒感 染的防 控知识 介绍责 任那些 事浅谈 用人单 位承担 的社会 保险法 律责任 和案例 分析现 代农业 示范工 程设施 红地球 葡萄栽 培培训 材料
本章主要内容
• §1 Wilcoxon 符号秩和检验 • §2 Wilcoxon 两样本比较法 • §3 完全随机设计多样本比较的
T++T- = n(n+1)/2,n为不等于0的对子数。 3.确定P值,做出推断结论
当n≤25时,以T值查“附表10 T界值表”(配对设计
用),若检验统计量T值在T界值范围内,则P值大于 相应的概率水平;若T值在T界值范围外或等于界值, 则P值小于或等于相应的概率水平。
9
常见心律失常心电图诊断的误区诺如 病毒感 染的防 控知识 介绍责 任那些 事浅谈 用人单 位承担 的社会 保险法 律责任 和案例 分析现 代农业 示范工 程设施 红地球 葡萄栽 培培训 材料
2
常见心律失常心电图诊断的误区诺如 病毒感 染的防 控知识 介绍责 任那些 事浅谈 用人单 位承担 的社会 保险法 律责任 和案例 分析现 代农业 示范工 程设施 红地球 葡萄栽 培培训 材料
非参数检验(nonparametric test)
• 对总体分布不作严格假定,又称任意分布检验

心理统计分析与SPSS使用教程《第六章 非参数检验(X2检验)》

心理统计分析与SPSS使用教程《第六章 非参数检验(X2检验)》
(1)年末时三种态度的人数是否有显著差异?
(2)一年来公司员工对新的考勤制度的态度有没 有显著变化?
三、双项分类的X2检验
1.用途:
检验一种分类特征与另一种分类特征是否有关联。
例如在例2中,可检验男女生在三种态度上是否有差异, 即性别与态度是否有关系
2.SPSS中数据的输入:
设置三个变量,两个为分类变量,一个为计数变量
数数据的检验,如上例中的按态度分类 (2)双向分类X2检验:对按两个特征进行分类所得的计
数数据的检验.如上例中,还可按家长性别列出不同态 度.
例1:员工对新的薪酬管理制度的看法(单向分类)
部门A
态度
赞成
反对 无所谓
人数
7

10
8
部门B
态度 人数
赞成 12
反对 9
无所谓 6
例2:某年级学生对强制统一穿着校服的态度(双向分类)
态度
赞成
反对
无所谓
性别
男 女男 女 男女
人数
35 44 56 47 34 37
二、单项分类的X2检验
1.单项分类的X2检验的用途
(1)检验分类中各项计数是否差异显著
如例2中,男女生的态度是否有差异,持三种态度的人数是否 有差异
(2)检验各类别分布是否符合另一分布
如例1中,已知另一部门的数据,可检验本部门员工态度与另 一部门员工态度是否类似
2.SPSS中数据的输入:
一般为两个变量,一个为转化为代号的分类变量,一个为计数 变量.不需要原始数据.
二、单项分类的X2检验
3.计算方法:
(1)用weight cases命令确定频数变量
Data- Weight Cases–将计数变量送入Weight cases—OK

SPSS第6章 非参数检验

SPSS第6章 非参数检验
Test)
•现实生活中有很多现象的数据取值仅分两类,例如:学生可以按性别 分成男生和女生,产品可以按质量分成合格和不合格,投掷硬币实验的 结果可能出现正面或反面等。这时,如果某一类情况出现的概率是P, 则另一类情况出现的概率就是Q(即1-P),这种分布称为二项分布。 •【例6-3】根据过去的观察,用旧方法生产某种产品,其不合格率为1%。 现采用新方法,在600件产品中,发现了2件不合格品,问是否可以认为 新方法的不合格率明显低于旧方法的不合格率? •1、方法基本思路 •二项检验属于拟合优度检验,适用于数据只能划分为两类的总体。二 项检验是检验是否认为从样本中观察到的两类比例来自具有指定P的总 体。H0:样本所属总体的分布形态与指定的二项分布无显著差异。 •就例6-3而言,H0:样本所属总体分布是P=1%的二项分布。 •SPSS中的二项分布检验,在样本数小于等于30时,按照计算二项分布概 率的公式进行计算;在样本数大于30时,计算的是Z统计量。SPSS将自 动计算Z统计量,并给出其所对应的概率值。如果Z值对应的概率值小于 或等于给定的显著性水平α,则应拒绝H0,认为样本所属的总体分布形 态与指定的二项分布存在显著差异;如果对应的概率值大于给定的显著 性水平α,则没有足够理由拒绝H0,认为样本所属的总体分布形态与指 定的二项分布无显著差异。
•c.“Expected Values”选项区可设定总体的各类别构成。若选用默认值则表示 所有各类构成比都相等;在“Values”框中可自行定义设定总体的各类构成, 输入的数值的个数和排放次序应和数据文件中的相对应。本例选用默认值。
•d. 单击图6.2主对话框中的“Options”按钮进行统计,“Statistics”用于确定 是否需要输出描述统计指标和分位数。
3、简要评论
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第6章非参数检验非参数检验是针对那些总体分布不能用有限个实参数来刻画,而只能对其作一些诸如分布连续、有密度、具有某阶矩等一般性假定的统计问题。

例如,检验“两个总体有相同分布”这个假设,若只假定两总体的分布为连续,此外一无所知,问题涉及的分布不能用有限个实参数刻画,这就是非参数统计问题。

又如,估计总体分布的期望,若假定总体分布为正态分布,则问题是参数性的;若只假定总体分布的期望值存在,则问题是非参数性的。

不过参数统计与非参数统计之间并没有泾渭分明的界线,有的统计问题,从不同的角度可以理解为参数性的,也可以理解为非参数性的。

例如线性回归(见回归分析)问题,若关心的是估计回归系数,它只是有限个实参数,因而可以看成是参数性的;但如果对随机误差的分布类型没有作任何假定,则从问题总体分布这个角度看,也可以看成是非参数性的。

非参数统计的一个重要特点是非参数统计问题中对总体分布的假定要求的条件很宽,因而使得针对这种问题而构造的非参数统计方法,不致于因为对总体分布的假定不当而导致重大错误,所以它往往有较好的稳健性。

但正是因为非参数统计方法需要照顾范围很广的分布,在某些情况下会导致其效率的降低。

不过,近代理论证明:当一些重要的非参数统计方法,当与相应的参数方法比较时,即使在最有利于后者的情况下,其效率上的损失也很小。

第1节符号检验符号检验是根据正、负符号个数的假设检验方法。

首先需要将原始数据按设定的规则,转换成正、负号,然后计数正、负号的个数做出检验。

该检验可用于样本中位数和总体中位数的比较,数据升降趋势检验,特别可用于总体分布不服从正态分布或分布不明的配对资料,有时当配对比较的结果只能定性的表达时,也可用本方法。

配对资料符号检验的计算步骤为:将成对数据以一定规则编码(或原始数量型数据),然后相减,得到的结果后,计数大于0的样本个数以及小于0的样本个数分别为n+和n-,当样本大小时,计算近似卡方值。

-+-+---=n n n n 22)1|(|χ其自由度df=1,根据卡方值进行统计检验。

例如,某医院对11名患者在膻中穴位测痛,以研究针刺前后痛阈的变化。

在DPS 系统中进行配对符号检验,可将数据编辑、定义成图6-1格式。

然后执行“试验统计”→“非参数检验”下的“符号检验”功能项,得到计算结果N +=6,N -=3,卡方值=0.4444 ,显著水平p=0.5050,即在该穴位针刺前后的痛感没有显著的差异。

第2节 两样本配对Wilcoxon 检验前面的符号检验只用到它们差异的符号,而对数字大小所包含的信息未能考虑。

因此为改进信息的利用效率,可采用两样本配对Wilcoxon 检验。

配对Wilcoxon 检验既考虑了正、负号,又考虑了两者差值的大小。

例如,现有10名注射青霉素、链霉素前后胆红素的改变值,在DPS 系统中进行两样本配对Wilcoxon 检验,可将数据编辑、定义成图6-2格式。

然后执行“试验统计”→“非参数检验”下的“两样本配对Wilcoxon 检验”,得到计算结果为:结果的第一部分是每一配对样本的差数及其按差数的绝对值大小排列后给定的秩。

第二部分是根据秩分别计算正负差数的秩和。

这里,差值为负的秩和T -=48,差值为正的秩和T +=7,取较小的作为统计检验的秩和T =7,根据T 值进行符号秩和检验,得到显著水平p =0.05。

可以认为治疗前后胆红素的变化显著。

第3节 两样本Wilcoxon 检验两样本Wilcoxon 检验适合于未配对样本差异显著性检验。

两样本Wilcoxon 检验步骤是先将两样本混合,再从小到大排列,统一编秩,相同数字一律给予平均秩次。

如分别以n 1,n 2代表两样本含量,并规定n 1≤n 2,将含量我n 1的组的秩和记为T 1,如 n 1=n 2,则可取任意一组的秩和为T 1。

然后据n 1与n 2的值查秩和检验T界值表,并进行统计推断。

如果n 1>20, n 2-n 1>10,这时则计算服从标准正态分布的U值:12/)1(5.02/)1(21212111++-++-=n n n n n n n T U根据U值即可进行统计推断。

例如,现测得克山病流行区的健康人13人和急性克山病患者11人的血磷值,现需统计推断两者之间有没有差异。

在DPS 系统中进行两样本配对Wilcoxon 检验,可将数据编辑、定义成图6-3格式。

然后执行“试验统计”→“非参数检验”下的“两样本Wilcoxon 检验”,得到计算结果为:结果的第一部分是每个样本,混合排序后的所得到秩。

第二部分是计算处理的两组样本的秩和,统计量U及其显著水平。

本例中,秩和等于176.5, 统计量等于2.0518,两组间差异显著水平p =0.04019,可以认为健康人和急性克山病人之间的血磷值有显著差异。

第4节 Kruskal Wallis 检验方差分析过程需要若干条件,F 检验才有奏效。

可有时候所采集的数据常常不能满足这些条件,事实上假使有一个条件不满足都会令我们陷入尴尬之中。

像两样本比较时一样,我们不妨尝试将数据转化为秩统计量,因为秩统计量的分布与总体分布无关,可以摆脱总体分布的束缚。

在比较两个以上的总体时广泛使用的Kruckal-Wallis 检验,正是对两个以上的秩样本进行比较的非参数方法,实质上它是两样本比较时的Wilcoxon 方法在多于两个样本时的推广。

在该测验中,首先计算全体样本中的秩,遇到数据出现相等,即存在“结”的情况时,采用“平均秩”手段让它们分享它们理应所得的秩和,再对数据(秩)进行方差分析,但构造的统计量并不是组间平均平方和除以组内平均平方和,而是KW=组间平方和/总平方和的平均数,KW 表示Kruskal-Wallis 统计量。

KW 统计量的观察值是我们判定各组之间是否存在差异的有力依据,因为我们需要检验的原假设是各组之间不存在差异,或者说各组样本来自的总体具有相同的中心(均值或中位数)。

在这里,我们可以合理地假设四组样本来自的总体除了中心之外有着相同开头的分布,备择假设为这些中心不全相等。

Kruskal-Wallis 统计量的计算步骤为:将k 组数据混合,并从小到大排列,列出等级,如有相同数据则取平均等级,然后计算各个组的等级和T i ,T i 2/n i ,并求和∑ii n T 2。

求各个等级的平方之总和∑ijij T 2,并计算S 2值,()⎪⎪⎭⎫ ⎝⎛+--=∑ij ij n n T n S 4111222然后计算KW 统计量⎪⎪⎭⎫ ⎝⎛+-=∑i i i n n n T S4)1(1KW 222对于选定的显著性水平α,我们的目的是去寻求临界点,使得P (KW ≥c )≈α,那么我们拒绝原假设,数据提示了个总体并非具有相同的中心。

当最小的样本大小增加以及样本组个数增加时,KW 很快地依分布趋于自由度为(k -1)的χ2分布。

只要k 大于3,这种逼近方法总是可以使用,这种方法也可以在k =3担任一样本大小所含数据超过5个的场合下使用。

Kruskal-Wallis 检验同样只能提示人们若干总体的中心可能不全相等,而不能指出哪些总体有着相同的中心,哪些总体存在着位置方面的差异,于是我们必须进行多重比较。

在两两比较时,首先计算各组平均数之间的差值d ij 。

jji i ij n T n T d -=然后根据d ij 计算统计量t 。

kn n S n n d t j i ij---⋅+=KW 1112t 的自由度df=n -k ,根据t 值,可计算得其显著水平p 值。

例如造纸厂生产的纸筒应抽样以验证是否符合规格,纸的规格之一是破损强度。

通过抽样与实验的手段记录了四批产品的破损强度,数据如表6-1所示:表6-1 四批产品的破损强度数据数据分析关心的问题之一是四组样本之间的差异,厂方希望四组样本之间的差异较小,因为这蕴含着产品质量的一致性。

如果这些数据满足方差分析中所需要的条件,我们可以采用F 检验的办法以查明四组的平均数是否全相同。

假使在这些条件根本无法验证与确保的情况下,则应使用非参数的Kruskal-Wallis 方法。

在DPS 数据处理系统中,只要将表6-1中数据定义成数据块(阴影部分)块,执行Kruskal-Wallis分析,即可得到结果。

计算结果的第一部分是各个组各个观察值的秩次。

第二部分是主要结果,即KW统计量=17.05337,近似卡方分布的显著性测验p=0.0007。

可认为各个组之间的差异显著。

分析结果的第三部分是多重比较结果,从多重比较结果可以看出,第三组样本和其它各个组之间有显著差异,而其它各个组之间的差异不显著。

第5节Friedman检验1937年Friedman提出的检验方法有一个特点是独立地在每一个区组内各自对数据进行排秩,这样可以消除区组间的差异以检验各种处理之间是否存在差异。

其基本想法是:倘若k种处理不存在差异(原假设H0),那么无论从哪一个区组去观察,每一种处理所得到的数据在该区组内可能地排秩为1至k中的任何一个数。

因此,对于每一种处理,譬如第i种处理,它关于各区组内所取秩的总和应该相等于其他任何一种处理关于各区组内所排秩的总和,即R i=R j(i≠j),或者这两种处理的秩平均数相等R i=R j。

易知R1+R2+…+R k=b(1+2+…+k)=b/2k(k+1),假如原假设k为真的话,对每一i ,R i 应与b /2(k +1)相距不远,或者其秩平均数R i =R i /b 应与k +1/2相距不远。

仿照方差分析的讲法,由处理产生的“秩变异平方和”应该比较小。

反之,若该平方和较大的话,则为拒绝原假设提供有力证据。

这个平方和究竟怎样算大怎样又算小,统计学的常规处理手法之一还是将它与另外的z 平方和或平均平方和来比较,Friedman 检验统计量就是将这个平方和除以秩的整体平均平方和:要对Friedman 检验建立拒绝或者计算p 值,必然涉及Friedman 统计量的分布。

从理论上看,b 个区间内对k 种处理所得数据的秩的全体可能的排列应有(k !)b 种,在原假设下,每一种排列是等可能的,其发生的概率为1/(k !)b 。

由此,可以对所有的排列计算出的值,然后计算这样的值在(k !)b 种排列中会出现几次,从而得到发生Friedman 统计量观察值的概率。

对于较小的b 与k ,我们可以通过计算给出分布表,一旦b 与k 相当大时,尽管可以通过现代计算机技术进行概率计算,但要列出相应的分布表却是很不方便的。

大样本时的近似手段在这里又起到了重要的作用,对于较大的k 与b ,当k 固定时,b →+∞时,Friedman 检验统计量的分布可以近似地用X 2-(k )来替代,这个结论大大地方便了实际操作。

随机区组试验设计资料,也可直接计算F值作F检验。

相关文档
最新文档