第7章 非参数检验
非参数检验课件
13.71
5
19.61
24.37
4.76
6
14.50
92.75
78.25
7
49.63
121.57
71.94
8
44.56
89.76
45.20
编秩次,求秩和 去掉d=0的对子,总的对子数也要相应减去; 用绝对值︱d︳编秩次,如果出现绝对值相等时(ties) ,则将它们的平均秩次值作为他们的秩次;
第二节 单样本资料的符号秩和检验
• 目的:推断样本中位数与已知总体中位数 (常为标准值或大量观察的稳定值)有无 差别,常用于不满足单样本t检验应用条 件的资料;其检验假设是M=M0.
• 例10-2 已知某地正常人尿氟含量的中位 数为2.15mmol/L.今在该地某厂随机抽取 12名工人,测得尿氟含量,结果见表2。 问该工厂的尿氟含量是否高于当地正常人 ?
参数检验方法
• t检验 两独立样本t检验要求:正态、方差相等、个体独立 配对t检验要求:差值正态、个体独立
• 方差分析 完全随机设计方差分析要求:正态、方差相等、个体独 立
参数检验方法
• 两组性别结构是否相同?
• 两组某种不良反应的发生率是否相同?
• 多组发生率是否相同? • 多组构成是否相同?
定性无序分 类资料
未解决的问题
• 疗效用痊愈、显效、有效、无效四级分类法进行 评价时,两组或多组如何比较?
• 对两组患者空腹胰岛素水平进行比较时,有的病 例测量结果为Ins<2.0 或Ins>300,如何处理?
未解决的问题
• 对应于多分类变量(有序) • 非正态分布 • 不完整数据:如,Ins<2.0 或Ins>300 • 正态分布但方差不相等时
ancova(协方差分析)非参数和随机方法
第7章ANCOV A(协方差分析):非参数和随机方法Peter S. PetraitisSteven J. BeaupreArthur E. Dunham7.1生态学问题生态学参数往往不能满足参数假定的要求。
当这种情况发生时,随机方法是更常用的参数方法,比如协方差分析(ANCOV A)和回归分析的一个很好的替代选择。
使用随机方法很简单,并且由于标准参数ANCOV A为生态学家所熟知,我们用它来激发对非参数和随机方法的优点和存在问题的讨论。
我们通过对检验随机和非参数方法分析性别和生境影响响尾蛇种群的个体大小来进行讨论,年龄在这里被作为一个混淆(confounding)因素考虑。
个体大小的变异常见于许多动物中(即, 无脊椎动物: Paine 1976; Lynch1977; Sebens 1982; Holomuzki 1989; 两栖动物: Nevo 1973; Berven1982;Bruce和Hairson 1990; 有鳞的爬行动物:Tinkle 1972;Dunham 1982; Schwaner 1985; Dunham等1989; 哺乳动物:Boyce 1978;Melton 1982; Ralls和Harvey 1985), 并且由于其与许多繁殖特征, 比如成熟年龄,子代个体的数量和大小,和亲代对子代的投入, 有协变关系,从而引起进化生态学家的极大兴趣,(Stearns 1992; Roff 180, 1992)。
对个体大小变异的解释包括资源的季节性,质量和可利用性(如,Case 1978; Palmer 1984; Schwaner和Sarre 1988), 基于个体大小的捕食性(Paine 1976), 种群密度(Sigurjonsdottir 1984), 特性替代(Huey和Pianka 1974; Huey 等1974)和生长速率的渐变变异(Roff 1980)。
然而个体大小的地理变异可能常由于个体大小决定的生长速率和种群年龄结构的相互作用所致。
SPSS统计学精品课件7-非参数检验
对适宜用参数方法的资料,若用非参数法处理,常损失部 分信息,降低效率。
精选PPT
4
7.3 两个独立样本的非参数检验
例7-1 舌诊白苔与剥脱苔脱落细胞计数结果见表715,问两种舌苔脱落细胞数有无差别?
白 苔 组 14 剥脱苔组 26
表7-1 舌诊白苔与剥脱苔脱落细胞计数结果 42 50 50 66 82 94 99 103 107 109 113 147 339 56 114 195 199 215 228 270 448 543 548 620 685 873
表 7-2 四组大白鼠耻骨间隙增加量
组别
xi (耻骨间隙增加量,mm)
1
0.15
0.30
0.40
0.40
0.50
——
2
1.20
1.35
1.40
1.50
1.90
2.30
3
0.50
1.20
1.40
2.00
2.20
2.20
4
1.50
1.50
2.50
2.50
——
——
分析步骤如下:
(1)数据录入:如图7-6示。
SPSS for Windows10.0
第七讲
非参数检验
精选PPT
1
内容提要
7.1 非参数检验概述 7.2 非参数检验的优缺点 7.3 两个独立样本的非参数检验 7.4 多个独立样本的非参数检验
精选
2
7.1 非参数检验概述
已知分布的总体指标称为参数。统计推断的目的如果是 对样本所属的已知分布的总体的未知参数进行估计或检验,这
7
(3)选择变量和统计方法:
第7章spss非参数检验
Statistics按钮: 计算卡方值,用于行列
变量的独立性检验
计算pearson和spearman 相关系数
定类资料的行列变 量相关性检验
定序资料的行列变 量相关性检验
定序与定距资料的行 列变量相关性检验
评判内部一致性 相关风险比例 两相关二项分类变量的非参检验
二项分类变量的因、自变量独立性检验
p(1 p) / n
17
【界面设置】
检验的落入第一组的 概率常数值
分组值,小于该值为1 组,其余为1组
注意大小样本的选择
18
【结果形式】
19
7.3 Runs 游程检验 主要用于对二分变量(数值型)或利用断点分 为两组的变量,检验取值的分布随机性或两总体分 布是否一致,即一个case的取值是否影响下一个。 统计原假设H0:样本二分值分布是随机的或两总体分 布相同。
5、 2 Independent Samples 两独立(成组)样本检验
6、 K Independent Samples K个独立样本检验 5、 2 Related Samples 两关联(配对)样本检验 6、 K Related Samples K个关联样本检验
2
7.1 Chi-Square
1、卡方拟合优度检验 (Nonparametric Tests - Chi-Square) 主要用于分析实际频数与理论频数(已知)拟合情况;χ2 值反映了实际频数和理论频数的吻合程度。χ2值越小, 说明实际频数与理论频数越吻合。 适用于一个变量的多项分类数据的检验分析。 统计原假设:实际频数与理论频数相等或实际构成比等于 已知构成比。 k ( f 0 f e )2 卡方统计量为 2
25
【界面设置】
第七章SPSS非参数检验
二、SPSS两独立样本非参数检验
(一)目的 由独立样本数据推断两总体的分布是否存在显著差异
(或两样本是否来自同一总体)。 (二)基本假设 H0:两总体分布无显著差异(两样本来自同一总体) (三)数据要求 样本数据和分组标志
•第七章SPSS非参数检验
二、SPSS两独立样本非参数检验
– 与样本在相同点的累计频率进行比较。如果相差较小,则认为样
本所代表的总体符合指定的总体分布。
•第七章SPSS非参数检验
一、SPSS单样本非参数检验
(三)K-S检验 (4)基本步骤
菜单选项:analyze->nonparametric tests->1-sample k-s 选择待检验的变量入test variable list 框 指定检验的分布名称(test distribution)
将两样本混合并按升序排序 分别计算两个样本在相同点上的累计频数和累计频率 两个累计频率相减。 如果差距较小,则认为两总体分布无显著差异
应保证有较大的样本数
案例:7-5 p194使用寿命
•第七章SPSS非参数检验
二、SPSS两独立样本非参数检验
3.游程?检验(Wald-Wolfowitz runs)
一、SPSS单样本非参数检验
(二)总体分布的二项分布检验 (1)目的
通过样本数据检验样本来自的总体是否服从指定的 概率p的二项分布根据 (2)原假设 样本来自的总体与指定的二项分布无显著差异。 (3)案例7-2 p187 产品合格率
•第七章SPSS非参数检验
一、SPSS单样本非参数检验
(三)K-S检验 (1)目的
•第七章SPSS非参数检验
五、SPSS多配对样本非参数检验
第7章 SPSS非参数检验
两独立样本的游程检验中,游程数依赖于 变量的秩。将两组样本混合后按升序排列, 然后按对应的组标记值序列计算游程数。 7.2.4极端反应检验(Moses 极限反应) 原假设:两独立样本来自的两个总体的分 布无显著差异。 将一组样本作为控制样本,另一组样本作 为实验样本,以控制样本作为对照,检验 实验样本相对于控制样本是否出现了极端 反应。
7.1.2二项分布检验 二项分布检验是通过样本数据检验样本来自的总 体是否服从指定概率为p的二项分布。 原假设:样本来自的总体与指定的二项分布无显 著差异。 一、二项分布检验的基本思想 变量只有两个取值0和1,如果进行n次相同的实 验,则出现两类(0和1)的次数可以分别用离散 型随机变量X来描述,如果随机变量值X为1的概 率设为p,则随机变量X值为0的概率便等于1-p, 形成二项分布。
典型的卡方统计量:Pearson卡方:
0 e 2 ( f f 2 i i ) 0 f i 1 i k
式中,k为子集的个数; f i 为观察频数; f i e为期望频数;= npi
0
如果卡方值较大,则说明观测频数分布与期望频数分布 差距较大;反之,则说明观测频数与期望频数分布较接 近。如果卡方的概率值小于显著性水平,则拒绝原假设, 认为样本来自的总体分布与期望分布存在显著性差异; 反之,则接受原假设,认为样本来自的总体分布与期望 分布无显著性差异。
2.选择待检验变量到[检验变量列表]框中 3.在[割点]框中确定计算游程的分界值。其中,中位数表 示以样本中位数为分界值;众数表示以样本众数为分界值; 均值表示以样本均值为分界值;设定表示以用户输入的值 为分界值,小于该值的为一组,大于等于该值的为另一组。
7.2 两独立样本的非参数检验
SPSS软件应用-第七章非参数检验
病例号 照射前 照射后
1
1.0 0.0
2
1.0 18.0
3
0.0 6.7
4
1.2 0.0
5
1.0 29.0
6
1.0 17.0
7
1.0 5.0
8
1.0 6.0
9
1.0 10.0
10
4.0
7.0
Questions &
Answers
饲料
肝脏内铁含量(μg)
A 2.23 1.14 2.63 1.00 1.35
B 5.59 0.96 6.96 1.23 1.61
C 4.50 3.92 10.33 8.23 2.07
练习2
10例食管癌病人在某种药物保护下,做 6000γ的放射照射,观察血中淋巴细胞 畸变百分数,结果如下表。问照射前后 血中淋巴细胞畸变百分数有无差别。
7.1 拟合优度检验(1-Sample K-S Test)
以例7-1数据(数据文件名“diameter_sub.sav”)为例,试检验变量 “trueap_mean”(矢状面管径)是否服从正态分布。
7.1 拟合优度检验(1-Sample K-S Test)
7.1 拟合优度检验(1-Sample K-S Test)
第二步:Analyze Nonparametric Test Legacy Dialogs 2 Related Samples Test
7.5 两个相关样本的非参数检验
7.5 两个相关样本的非参数检验
7.5 两个相关样本的非参数检验
7.6 多个相关样本的非参数检验
牙齿 普通 RPI Y型 编号 卡环 卡环 卡环
7.2 样本率与总体率比较的二项分布检验(Binomial)
非参数检验
两种方法治疗扁平足效果观察
建立假设
病例号
原始记录 A法 B法
量化值 A法 B法
差值
秩次
H0:两法疗效差值的总体中位数
1 2
为0;
3
4
H1:差值的总体中位数不为0。
5
6
=0.05
7
8
计算检验统计量
9
10
编秩:
11
12
求秩和:T+=61.5,T-
13
=4.5
14 15
好
差
好
好
好
差
好
中
差
中
中
差
好
中
好
差
秩和(rank sum): 同组秩次之和;在一定程度上反映了等级 的分布位置。
秩和检验:就是通过秩次的排列求出秩和,进行假设检验。
11
非参数检验 (nonparametric test )
非参数检验的最常用方法——秩和检验( rank test ) 利用秩的大小进行推断就避免了不知道背景分布的
困难。这也是非参数检验的优点。 多数非参数检验明显地或隐含地利用了秩的性质;
但也有一些非参数方法没有涉及秩的性质。 掌握对数据进行编秩的方法是学习秩和检验的基本
要求。
12
非参数检验 (nonparametric test )
非参数检验的最常用方法——秩和检验( rank test )
A组: - 、、+、+、+、+、++、++、++、++、+++、+++
适用条件: (1)上述两种设计类型的资料不满足参数检 验条件。 (2)配对设计等级资料的比较。
非参数检验
非参数检验非参数检验是一种统计方法,用于比较两组或多组数据的差异或关联性,它并不依赖于数据的分布假设。
相比于参数检验,非参数检验通常更为灵活,可应用于各种数据类型和样本量,尤其在数据不满足正态分布的情况下表现优势。
本文旨在介绍非参数检验的基本原理、应用领域以及常见方法。
首先,非参数检验的基本原理是依赖于样本中的秩次,即将原始数据转化为秩次数据进行统计分析。
秩次是数据在全体中的相对位置,将数据转化为秩次可以消除异常值对统计结果的影响,并使数据的分布不再成为限制因素。
非参数检验的应用领域广泛,包括但不限于以下几个方面。
一、假设检验非参数检验可用于假设检验,比如检验两组样本的中位数是否存在差异。
常见的方法有Wilcoxon符号秩检验、Mann-Whitney U检验等。
在实际应用中,如果数据的分布无法满足正态分布假设,非参数检验则是一种理想的选择。
二、相关性分析非参数检验可用于判断两个变量之间的关联性。
常见的方法有Spearman秩相关系数检验、Kendall秩相关系数检验等。
这些方法的核心思想是将原始数据转化为秩次数据,通过秩次数据之间的比较来判断两个变量之间是否存在显著相关。
三、分组比较非参数检验可用于比较多个样本之间的差异。
常见的方法有Kruskal-Wallis检验、Friedman检验等。
这些方法可用于比较三个以上的样本组之间的差异,而不依赖于数据的分布假设。
在实际应用中,非参数检验需要注意以下几个问题。
一、样本容量非参数检验对样本容量的要求相对较低,适用于小样本和大样本。
然而,在样本容量较小的情况下,非参数检验可能会产生较大的误差,因此应根据实际情况选择合适的方法。
二、数据类型非参数检验可应用于各种数据类型,包括连续型数据和离散型数据。
但对于有序分类数据、定序数据和名义数据,非参数检验相较于参数检验有更好的适用性。
三、分布假设非参数检验不需要对数据的分布做出假设,这使得它更加灵活。
但是,如果数据满足正态分布假设,参数检验也是一种较为有效的选择。
非参数检验
➢ 编秩:数据相等则取平均秩,
➢ 求秩和
➢ 计算检验统计量H值
H 12 N(N 1)
Ri2 3( N 1) ni
出生体重(kg)xij ABCD
相应秩次 Rij A BCD
2.7 2.9 3.3 3.5
3
4
7 11
2.4 3.2 3.6 3.6
2 5.5 12.5 12.5
2.2 3.2 3.4 3.7
χ 2 12
R
2 i
3(N1)
N(N1) ni
χ2
12 14(14 1)
152
4
152 3
37.52 4
37.52 3
3(14
1)
χ 2 9.375
χ
2 c
1
χ2
(t
3 j
t
j
)
n3 n
1
(23
9.375 2) (33 3) (23
143 14
2)
9.50
四、随机区组设计资料的秩和检验 (Friedman test)
正态近似法
如果n1或n2-n1超出附表的范围,可按下式 计算u值:
u | T n1(N 1) / 2 | 0.5 n1n2 (N 1) / 12
在相同秩次较多时,应用下式进行校正:
uC u / C
C 1
(t
3 j
t
j
)
/(N
3
N)
tj为第j组相同秩次的个数
频数表资料(或等级资料)两样本资料比较
xi (2) 86 71 77 68 91 72 77 91 70 71 88 87
12 对双胞胎兄弟心理测试结果
后出生者得分 差 值
非参数检验
若n>50,超出附表9的范围,可用正态近似法作u检验,按 下式计算u值。
对秩的差值,省略所有差值为0的对子数,令余下的有效对子数
为n;最后按n个差值编正秩和负秩,求正秩和或负秩和。但对 于等级资料,相同秩多,小样本的检验结果会存在偏性,最好 用大样本。
的多个独立样本所来自的多个总体分布是否有差别。在理论
上检验假设H0应为多个总体分布相同,即多个样本来自同一 总体。由于H检验对多个总体分布的形状差别不敏感,故在实
际应用中检验假设H0可写作多个总体分布位置相同。对立的
备择假设H1为多个总体分布位置不全相同。
1.原始数据的多个样本比较
方法步骤见例8-5.
样本所来自的两个总体中位数是否有差别。方法步骤见例8l。
例8-1 对12份血清分别用原方法(检测时间20分钟)和新 方法(检测时间10分钟)测谷-丙转氨酶,结果见表8-1的(2)、 (3)栏。问两法所得结果有无差别?
血清谷-丙转氨酶不知是否符合正态分布,本例为小样 本资料,其配对差值经正态性检验得0.1<P<0.2,虽可用配对t 检验,为保守起见,现用Wilcoxon符号秩检验。
用于推断计量资 料或等级资料的两个独立样本所来
自的两个总体分布是否有差别。
在理论上检验假设H0应为两个总体分布相同,即 两个样本来自同一总体。由于秩和检验对于两个总体分布 的形状差别不敏感,对于位置相同形状不同但类似的两个 总体分布,如均数相等、方差不等的两个正态分布,推断
不出两个总体分布(形状)有差别,故对立的备择假设Hl不
7非参数检验
T
nn 12n 1
24
检验统计量可计算为:
Z T T T
T nn 1/ 4 nn 12n 1
24
(17.3)
例4:32人的射击小组经过三天集中训 练,训练后与训练前测验成绩见表17-8。 问三天的集中训练有无显著效果?
表17-8 集训前后成绩计算表
序号 前测 后测 序号 前测 后测 序号 前测 后测 序号 前测 后测
表17-4 集训前后成绩
序号 前测 后测 序号 前测 后测 序号 前测 后测 序号 前测 后测
1 42 40 9 60 64 17 50 44 25 20 36 2 38 35 10 47 39 18 25 26 26 60 42 3 53 56 11 12 15 19 63 59 27 51 44 4 49 41 12 32 30 20 45 37 28 28 23 5 24 21 13 65 61 21 39 32 29 34 30 6 54 60 14 48 58 22 48 53 30 62 68 7 43 34 15 54 52 23 66 56 31 60 60 8 51 40 16 62 58 24 57 54 32 49 45
非参数检验不要求样本所属的总体呈 正态分布,一般也不是对总体参数进行检 验。非参数检验不仅适用于非正态总体名 义变量和次序变量的资料,而且也适用于 正态总体等距变量和比率变量的资料。
一. 两相关样本的检验
两相关样本的数据是一一对应的成对 数据,因此相关样本又称为配对样本。 对两相关样本的数据进行非参数检验 的方法主要有符号检验法和符号等级检 验法。
在零假设条件下,二项分布的平均 数和标准差分别为
np n
2
假设 : p 1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例:产品一级品率是否为90%
7.1.3 单样本K-S检验
该检验为拟合优度检验,可以检验 样本数据是否服从指定的理论分布,适 用于探索连续型随机变量的分布形态, 如正态分布、均匀分布、指数分布等。
原假设:样本来自的总体与指定的理论 分布无显著差异
单样本K-S检验基本思路
假定F0(x)是一个已知的分布函数,Fn(x) 是未知的总体分布函数F(x)的样本经验 分布函数,取检验统计量: D=max︳Fn(x)- F0(x)︳ 在样本数据服从指定分布时,D的观测 值应该较小,如果D的观测值较大,则 零假设可能不成立。
Wald-Wolfowitz游程检验
Moses极端反应检验
Moses极端反应检验
基本思路: (1).将一样本作为控制样本,另一样本作为 实验样本。两样本混合后按升序排列; (2).找出控制样本的跨度(最低秩和最高秩 间的样品数)和截头跨度(去掉控制样 本的最小值和最大值后的跨度)。 若跨度(截头跨度)很小,认为样本存在 极端反应。
Nonparametric Tests 优点
1. 可应用于各种不同的情况,不受 总体分布的限制;
2. 适合处理无法精确数量化的名目 资料和小样本资料;
3. 计算通常较简单且容易理解。
Nonparametric Tests 缺点
1. 将量的资料转换为质的资料时, 漏失了数据的一些信息;
2. 检验的敏感度和效果均不如参 数检验好。 但是:根据国外的一项研究,有些方 法的检验效能大约在参数检验方法的 95%左右,并非低得不能接受。
(2)卡方检验要求样本容量一般大于50。
(3)当样本数据的分类只有两类时,用二 项检验。样本容量小到卡方检验不能用时, 二项检验是唯一可用的检验。
比较
(4)资料分类是若干离散型类别,以 及当期望的频数足够大时,最好用卡方 检验。
(5)样本数据为连续分布时,最好用 K-S检验。
That’s
you!
选择何种检验方法
取决因素:成本、时间、效度、可用资料 的总数、可用资料的形式、抽样方法、总体的 属性、以及第I、Ⅱ类错误的概率(α和β)等。 在检验中,若可以获得参数检验所需的假 设资料,当然选择适当的参数检验法,若对于 来自神秘总体或较稀少的试验,可能使用非参 数检验较为合适,但当面对等级化资料时,则 只能使用非参数检验方法。
单样本变量值随机检验具体做法 (1)菜单Analyze->Nonparametric Test->Runs (2)选定待检验的变量到Test Variable list框中 (3)在Cut Point框中确定计算游 程数的分界点。
例:设备工作是否正常
比较
(1)当检验的假设是关于样本是否来自一 指定分布总体的问题时,可采用三种具有 拟合优度类型的检验方法中的一个,即卡 方检验、二项检验和K-S检验。
7.1.1 卡方检验(Chi-Square过程)
Χ2检验就是根据样本数据推断总体的 分布与期望分布或某一理论分布是否有显著 H0 差异。它的原假设是 :样本来自的总体其 分布形态与期望分布无显著差异。进行检验 时,需要构造统计量:
2 ( O E ) 2 i i Ei i 1 k
2 ( O E ) i 2 i Ei i 1 k
基本操作步骤:
1. Analyze->Nonparametric Tests -> 2 Independent Sample; 2.选择待检验变量到Test Variable框中; 3.指定存放样本标志值的变量到Grouping Variable 框; 4.选择非参数检验方法。
SPSS实现1
中位数检验
2.分布位置检验方法
用于检验样本所在总体的分布位置/形状是否相同.
具体包括用于成组资料分布位置检验的2 Independent Samples与K Independent Samples过程;以及用于配对 资料分布位置检验的2 Related Samples与K Related Samples过程
7.1单个样本的检验
3.Jonkheere-Terpstra检验
7.4两配对样本的非参数检验
1.Wilcoxon符号秩检验
2.符号检验 3.Mcnemar变化显Frieman检验
2.Kendall协和系数检验
3.Cochran’s Q检验
对比:参数检验
参数检验是在已知总体分布 的条件下,对相应分布的总体参 数进行估计和检验。比如单样本 u检验就是假定该样本所在总体 服从正态分布,并已知方差,然 后来推断总体的均数是否和已知 的总体均数相同。
Wilcoxon W统计量和MannWhitney U统计量
1. Wilcoxon W=Wx,若m>n; Wilcoxon W=Wy,若m<n; Wilcoxon W为第一个观测值所在样本的 W值,若m=n; 2. Mann-Whitney U=W-n(n+1)/2 在小样本下U统计量服从曼-惠特尼分布, 大样本下U近似服从正态分布。
其中,Qi=归入第i类中的观测数目;
Ei=零假设成立时第i类中的期望事件数。
此公式先将每一类别中的观测和期望的频 数之差的平方除以相应的期望频数,然后对所有 的k类求和。 如果观测和期望的频数接近一致,则其差 (Qi—Ei)就小,因而Χ2就小;反之,若其差大, 则Χ2 的值也越大。当Χ2 越大时,观察的频数就 越不可能是来自于以零假设为基础的整体。
例:猝死人数与日期关系是否为 2.8:1:1:1:1:1:1
举例
7.1.2 二项检验
二项检验属于拟合优度型检验, 该检验法适用于只能划分为两类的数 据总体,如:男生和女生、小于或等 于某值的数和大于该值的数。对于取 自该总体的所有可能结果,要么是这 两类中的某一类,要么是另一类,不 可能同时属于对立分类中的两类,称 具有这种分类特征的数据所服从的分 布为二项分布。
第七章
定义:
非参数检验
非参数检验的着眼点不是总体的某个 (或某些)参数,而是总体的分布情况— —即研究目标总体的分布是否与已知理 论分布相同;或者各样本所在总体的分 布位置、形状是否相同。
由于这一类方法并不涉及总体参数, 因而被称为非参数方法。
非参数检验所要处理的问题
• (1)只涉及一个总体时,检验总体的分 布是否为某指定的已知分布; • (2)涉及多个总体时,检验它们的分布 是否相同 注:两种分布是否相同,一般看两者 类型及参数(均值、方差等)是否完全 一致。如果两个总体的分布类型相同, 而参数不同,也被视为概率分布不同。
基本操作步骤:
1. Analyze->Nonparametric Tests -> K Independent Sample; 2.选择待检验变量到Test Variable框中; 3.指定存放样本标志值的变量到Grouping Variable 框; 4.选择非参数检验方法。
all…
Thank
Mann-Whitney U检验
该检验可用来检验两个独立样本是否取自 同一总体,它是最强的非参数检验之一, 基本思路(1)将样本X和样本Y混合后作升序排 列,计算每个数据的秩; (2)分别对两样本的秩求平均,得到两个平均 秩,分别用W1=WX/m和W2=WY/n表示。 若W1和W2比较接近,则说明两个样本来自相 同分布的总体,若W1和W2差异较大,则说明 两个样本来自不同的总体。
K—S双样本检验
该检验可用来检验两个独立样本是否取自同 一总体。 基本思路 (1)将样本X和样本Y混合后作升序排列; (2) 分布计算两组样本秩的累计频数和每个点 上的累计频率Fn1(x)和Fn2(x); (3) 计算D=max[Fn1(x)- Fn2(x)] 如果D 较小,则可以认为两个样本取自同一 个总体;如果D较大,大到一定程度,则可以 认为两个样本不是取自同一总体的。
Kruskal-Wallis H检验
实质为Mann-Whitney U检验的推广,其基本思路: (1).多组样本混合按升序排列,并求出各变量的秩; (2)考察各组秩的均值是否存在显著差异。 研究各组秩的均值差异可利用方差分析法。
若秩的均值存在显著差异,则认为多总体的分布 有显著差异。
Kruskal-Wallis H检验
Chi-Square过程具体做法
Chi-Square检验先按照已知总体的构成 比分布计算出样本中各类别的期望频数,然 后求出观测频数和期望频数的差值,最后计 算出卡方统计量,利用卡方分布求出P值, 以得出检验结论。
Chi-Square过程具体做法
(1)菜单Analyze->Nonparametric Test>Chi Square (2)选定待检验的变量到Test Variable框 中 (3)在Expected Range框中确定待检验样本 的取值范围 (4)在Expected Values框中给出期望分布 的频数
假设观测结果可以表示为0和1的序列, 把0和1连续出现构成的数据段称为一个游 程,总的数据段称为游程总个数。
例如:把下面序列:0011101100 中,00、111、0、11、00当作游程,游程 总个数为5。
当游程总数太大(周期性)或太小 (不随机)时,认为样本数据不是随机序列。
游程检验
游程检验有游程最大长度检验和游 程总数检验两种检验方法,SPSS采用的 是游程总数检验方法,用该法可以检验 一组样本数据是否来自同一总体(或差 异不明显服从同一分布),即考察按随 机顺序得到的一组样本的观测值是否表 现出足够的随机性。
单样本K-S检验具体做法
(1)菜单Analyze->Nonparametric Test->1-Sample K-S (2)选定待检验的变量到Test Variable list框中 (3)在test distribution框中选 择理论分布。
例:周岁儿童身高的总体分布是否为 正态分布