SPSS教程 CHAP12 非参数检验

合集下载

SPSS应用之非参数检验

SPSS应用之非参数检验

SPSS应⽤之⾮参数检验统计学的假设检验可以分为参数检验和⾮参数检验,参数检验是根据⼀些假设条件推算⽽来,当这些假设条件⽆法满⾜的时候,参数检验的效能会⼤打折扣,甚⾄出现错误的结果,⽽⾮参数检验通常是没有假设条件的,因此应⽤范围⽐参数检验要⼴。

⾮参数检验在不做任何假设的情况下,最⼤限度的使⽤样本信息,利⽤统计学、数学的⽅法和技巧构造统计量并加以检验,在某些情况下,⾮参数检验⽐参数检验拥有更⾼的效能,尽管如此,我们也不能⼀味的使⽤⾮参数检验,毕竟参数检验更加严谨,通常都是在数据不符合参数检验的条件是,才使⽤⾮参数检验,因此,对于数据的前期观察是⾮常重要的。

⾮参数检验⽅法⾮常多,但是绝⼤部分⾮参数检验⽅法都是基于秩和结来构造统计量的,中⾮参数检验是⼀个独⽴的过程,也保留了旧对话框,新对话框按照样本情况分类,根据样本情况来选择⽅法,并且更倾向于⾃动化分析,旧对话框的分类则不是很明确,分我们按照新对话框来进⾏介绍分析—⾮参数检验—单样本⼀、单样本1.⼆项式检验⼆项式检验也称为⼆项分布检验,⽤来检验样本是否来⾃⼆项分布,也就是检查样本的观测值的频数与某⼀特定⼆项分布下的期望频数是否⼀致。

不仅可以针对于⼆分类变量,对于连续变量也可以当做⼆分类变量来处理,例如成绩的及格与否,产品的合格与否等。

本例中是想检验三门学科的及格率是否都在95%以上2.卡⽅检验卡⽅检验是最常⽤的多分类⾮参数检验,卡⽅统计量也⼴泛被其他检验所引⽤,卡⽅检验依据卡⽅分布,主要包括适应性检验和独⽴性检验,适应性检验⽤于检验实际观察频数与期望频数是否⼀致,独⽴性检验⽤于检验两组或多组计数资料是否相互独⽴。

3.K-S检验全称为Kolmogorov-Smirnow检验,在探索性中,也曾出现过⽤它来检验是否服从正态分布。

该检验属于⾮参数检验,⽤来检验某⼀单样本是否服从某⼀理论分布。

4.Wilcoxon符号秩检验该检验将符号和秩相结合,效能⽐单纯的符号检验和秩和检验都⾼,因此⽐较常⽤5.游程检验我们知道样本的随机性很重要,⽽游程检验就是⽤来检验样本数据是否是随机抽取的。

《SPSS数据分析教程》——非参数检验

《SPSS数据分析教程》——非参数检验

动手练习

细菌污水处理厂的微生物生态系统中最重要的 组成部分。水资源管理工程师认为在某个指定 工厂收集的污水样本中活性细菌的百分数的中 位数为40。如果活性细菌的百分数的中位数大 于40,则应该调整污水处理过程。数据 Water.sav记录了含有10个污水样品的随机样 本中活性细菌的百分数。在显著性水平为5%的 条件下,该样本提供了充分证据表明污水样本 中活性细菌的百分数的中位数大于40吗?
6.3独立样本非参数检验

独立样本非参数检验使用一个或多个非参数检 验方法来识别两个或更多个组间的差别。对于 两个分布未知的总体,或者两个总体的分布不 服从正态时,我们无法应用T检验来比较两个 总体。可以转而应用非参数的方法来比较两个 总体的中心位置的差异。独立样本是指样本来 自的总体相互独立。

二项式检验

SPSS的二项式检验也是非参数检验方法的一种, 它适用于对二分类变量的拟合优度检验。其基 本功能是通过样本的频数分布来推断总体是否 服从特定二项分布。这种检验过程是通过分析 实际的频数与理论的频数之间的差别或者说吻 合程度来完成的。例如,现代社会男、女的比 例是否为1.01:1;工厂的次品率是否为1%等 都可以通过二项式检验完成。
选项设置
检验结果分析

聚类条形图显示检验字段每个类别的观察频率 和假设频率。悬停在条形上将在工具提示中显 示观察频率和假设频率及其差别(残差)。观 察和假设条形中的可见区别表明检验字段可能 没有假设的分布。
实例分析:人员结构的调动

某公司经营多年,形成了一套成熟的企业文化 和管理体系。例如,根据多年的运营经验,经 理层、监察员、办事员三种职务类别人员比例 大约在15:5:80为宜,这样运行效率最高。 目前公司进行人事调整,公司人员结构发生变 化,有员工担心人事调整是否已经导致职务类 型比例失调。请利用数据6-2-1来解决该问题

SPSS的非参数检验

SPSS的非参数检验
非参数检验可以提供更准确的统计推断,特别是在 数据特征不明或数据量较小的情况下。
02
SPSS非参数检验概述
定义与特点
定义
非参数检验是在统计分析中,相对于参数检验的一种统计方法。 它不需要对总体分布做严格假定,只关注数据本身的特点,因此 具有更广泛的适用范围。
特点
非参数检验对总体分布的假设较少,强调从数据本身获取信息, 具有灵活性、稳健性和适用范围广等优点。
局限性
计算量大
对于大规模数据集,非参数检验的计算量可 能较大,需要较长的计算时间。
对数据要求高
非参数检验要求数据具有可比性,对于不可 比的数据集可能无法得出正确的结论。
解释性较差
非参数检验的结果通常较为简单,对于深入 的统计分析可能不够满足。
对异常值敏感
非参数检验对异常值较为敏感,可能导致结 果的偏差。
THANK YOU
感谢聆听
常用非参数检验方法
独立样本非参数检验
用于比较两个独立样本的差异 ,如Mann-Whitney U 检验 、Kruskal-Wallis H 检验等。
相关样本非参数检验
用于比较相关样本或配对样本 的关联性,如Wilcoxon signed-rank 检验、Kendall's tau-b 检验等。
等级排序非参数检验
案例二:两个相关样本的非参数检验
总结词
适用于两个相关样本的比较,如同一班级内不同时间点的成绩比较。
描述
使用SPSS中的两个相关样本的非参数检验,如Wilcoxon匹配对检验,可以比较两个相关样本的总体分布是否相 同。
案例二:两个相关样本的非参数检验
01
步骤
02
1. 打开SPSS软件,输入数据。

SPSS教程-非参数检验

SPSS教程-非参数检验
两独立样本的非参数检验是在对总体分布不很 了解的情况下,通过分析样本数据,推断样本 来自的两个独立总体分布是否存在显著差异。
一般用来对两个独立样本的均数、中位数、离 散趋势、偏度等进行差异比较检验。
两个样本是否独立,主要看在一个总体中抽取 样本对另外一个总体中抽取样本有无影响。
Mann-Whitney检验
=0.18576
计算表
SPSS基本操作
SPSS基本操作
SPSS基本操作
SPSS基本操作
SPSS基本操作
单样本K-S检验
利用样本数据推断样本来自的总体是否服从某一理论 分布,是一种拟合优度的检验方法,适用于探索连续 型随机变量的分布
步骤
计算各样本观测值在理论分布中出现的理论累计概率值F(x) 计算各样本观测值的实际累计概率值S(x) 计算理论累计概率值与实际累计概率值的差D(x) 计算差值序列中最大绝对差值D
针麻效果
(1) Ⅰ Ⅱ Ⅲ Ⅳ

肺癌 (2) 10 17 19 4
三种病人肺切除术的针麻效果比较肺化脓症Fra bibliotek肺结核
(3)
(4)
24
48
41
65
33
36
7
8
合计 (5) 82 123 88 19
SPSS基本操作
与例7的操作相同
随机区组设计资料的秩和检验
M检验(Friedman法)法计算步骤
将每个区组的数据由小到大分别编秩 计算各处理组的秩和Ri 求平均秩:R=1/2b(k+1) 计算各处理组的( Ri-R) 求M 查M界值表,F近似法
参数统计(parametric statistics) : 在 统计推断 中,若样本所来自的总体分布为已知的函数形式 (正态/近似正态分布),但其中的参数未知,统 计推断的目的就是对这些未知参数进行估计/检验, 这类统计推断方法称参数统计。

非参数检验-SPSS

非参数检验-SPSS

非参数检验-SPSS什么是非参数检验?非参数检验是一种统计假设检验方法,它不依赖于总体的任何假设条件,如总体分布的正态性、方差的同一性等。

与参数检验相比,非参数检验更加灵活,能够适应更多的数据情况。

为什么需要非参数检验?当我们的数据不满足正态分布等假设条件时,就需要使用非参数检验。

此外,非参数检验还有以下优点:1.不需要知道总体分布的具体形态,从而更加适用于实际情况2.对于离群值和极端值并不敏感3.数据缺失并不会影响检验结果SPSS中的非参数检验现在我们来介绍SPSS中的非参数检验。

1. Wilcoxon符号秩检验Wilcoxon符号秩检验旨在检验两组配对样本的中位数差异是否为零。

它的原假设是两组样本中位数相同。

首先,我们需要打开SPSS,导入数据集,然后点击菜单栏中的“数据”-“配对样本T检验”-“Wilcoxon符号秩检验”。

接下来,我们需要在弹出的对话框中选择配对变量,然后点击“OK”即可得到检验结果。

2. Mann-Whitney U检验Mann-Whitney U检验是一种非参数检验方法,用于检验两组独立样本的中位数是否相同。

它的原假设是两组样本中位数相同。

要进行Mann-Whitney U检验,我们需要打开SPSS,导入数据集,然后点击菜单栏中的“分析”-“非参数检验”-“2独立样本”。

接着,在弹出的对话框中选择两组样本的变量,并设置分析的方法为“Mann-Whitney U检验”。

最后点击“OK”即可得到检验结果。

3. Kruskal-Wallis检验Kruskal-Wallis检验是一种非参数检验方法,用于检验多个独立样本的中位数是否相同。

它的原假设是多组样本中位数相同。

要进行Kruskal-Wallis检验,我们需要打开SPSS,导入数据集,然后点击菜单栏中的“分析”-“非参数检验”-“Kruskal-Wallis检验”。

接着,在弹出的对话框中选择多组样本的变量,并点击“OK”即可得到检验结果。

使用SPSS软件进行非参数检验

使用SPSS软件进行非参数检验

使用SPSS软件进行非参数检验非参数检验是数理统计学中对样本数据进行检验的一种重要检验方法,文章具体讲述了SPSS统计软件对3个班级中21个学生的成绩样本进行非参数检验分析,得出总体成绩存在显著性差异,说明了SPSS统计软件应用于概率论与数理统计教学的可行性。

标签:SPSS软件;非参数检验;显著性差异;可行性非参数检验是数理统计学的一个分支,它与参数检验相对应。

参数检验是一种适应于在特定环境下的检验,对总体分布参数的均值或方差等进行推断的方法。

非参数检验是假定总体分布的具体形式未知,从样本的数据获得需要的信息,对总体分布的类型和位置进行检验。

1 非参数检验方法的特点和分类非参数检验适用性很广,不要求有精确的观测值,SPSS软件是一种易学易操作的软件,软件中包括8种非参数检验的分析方法,这8种方法被分为了两大类:分布类型检验方法和分布位置检验方法,在第二大类中包括以下4中检验:两个独立样本显著性差异、多个独立性样本显著性差异、两个相关样本差异的显著性检验和多个相关样本差异的显著性检验。

文章主要研究多个独立性样本的显著性差异。

2 应用实例随机抽取3个班级的学生,得到21个学生的成绩样本,成绩如表1所示,问总体成绩是否存在显著差异?(1)假设H0:總体成绩没有显著差异(2)操作步骤:a.在SPSS软件的数据编辑窗口中输入数据,两个变量(banji,chengji),21个样本,即输入2列21行;b.单击分析→非参数检验→K个独立样本命令,打开多个独立样本对话框;c.将变量chengji移入到检验变量列表,将banji移入分组变量列表,在分组变量定义框内定义分组变量的范围,最小值为1,最大值为3,选择检验类型中的前两个,第三种方法不适合本题目;如图1所示。

d.单击OK按钮,即在输出窗口显示Kruskal-Wallis检验和中值检验的计算结果。

3 结果分析在输出窗口中显示了Kruskal-Wallis检验和中值检验的计算结果,见表2、表3。

spss使用教程非参数检验

spss使用教程非参数检验
第23页/共152页
SPSS二项分布检验就是根据收集到的样本 数据,推断总体分布是否服从某个指定的二项 分布。其零假设是H0:样本来自的总体与所指 定的某个二项分布不存在显著的差异。
第24页/共152页
SPSS中的二项分布检验,在样本小于或等 于30时,按照计算二项分布概率的公式进行计 算;样本数大于30时,计算的是Z统计量,认 为在零假设下,Z统计量服从正态分布。Z统计 量的计算公式如下
人数 2 4 7 16 20 25 24 22 16 2 6 1
第49页/共152页
实现步骤
图10-12 在菜单中选择“1-Sample K-S”命令
第50页/共152页
图10-13 “One-Sample Kolmogorov-Smirnov Test”对话框
第51页/共152页
图10-14 “One-Sample K-S:Options”对话框
第28页/共152页
表10-2
35名婴儿的性别
婴儿
Sex
婴儿
Sex
婴儿
Sex
1
1
13
1
25
1
2
0
14
1
26
1
3
1
15
1
27
0
4
1
16
1
28
0
5
1
17
0
29
0
6
1
18
0
30
0
7
0
19
0
31
1
8
0
20
0
32
0
9
0
21
0
33
0
10

SPSS中非参数检验方法

SPSS中非参数检验方法

1. 总体分布的卡方(Chi-square)检验 2. 二项分布检验 3. SPSS单样本变量的随机性检验 4. SPSS单样本的K-S检验 5. 两个独立样本的非参数检验 6. 多个独立样本的非参数检验 7. 两个配对样本的非参数检验 8. 多配对样本的非参数检验
本章主要介绍总体分布的卡方(Chi-square) 检验、二项分布(Binomial)检验、单样本K-S ( Kolmogorov-Smirnov ) 检 验 、 单 样 本 变 量 值 随机性检验(Runs Test);两独立样本非参数 检验、多独立样本非参数检验、两配对样本非 参数检验、多配对样本非参数检验等8类常用的 非参数检验方法。
前面已经讨论的统计分析方法,对总体有特殊的要求,如T检 验要求总体符合正态分布;F检验要求误差呈正态分布,且各 组方差齐,等等。这些方法常用来估计或检验总体参数,统 称为参数检验。
现实中,许多调查或实验所得的科研数据,其总体分布未知 或无法确定。因为有的数据不是来自所假定分布的总体,或 者数据根本不是来自一个总体;还有可能数据因为某种原因 被严重污染。这样在假定分布的情况下进行推断的做法,就 有可能产生错误的结论。此时人们希望检验对一个总体分布 形状不必作限制。
人数 2 4 7 16 20 25 24 22 16 2 6 1
实现步骤
在菜单中选择“1-Sample K-S”命令
“One-Sample Kolmogorov-Smirnov Test”对话框
“One-Sample K-S:Options”对话框
4.3 结果和讨论
(1)本例输出结果如下表所示。
总体分布的卡方检验的数据是实际收集到 的样本数据,而非频数数据。
1.2 SPSS中实现过程

spss教程第十二章

spss教程第十二章

spss教程第十二章第十二章非参数检验――Nonparametric Tests菜单详解(医学统计之星:张文彤)最后一次更新时间:12.1 概论12.2 One-Sample Kolmogorov-Smirnov Test12.3 Two-Independent-Samples Tests§12.1概论作为二十一世纪统计理论的三大发展方向之一,非参数统计是统计分析的重要组成部分。

可是与之很不相称的是他针对一般性统计分析的理论发展远远不及参数检验完善,因而比较完善的可供使用的方法也不多。

比如多组均数间的两两比较,虽然已有好几种方法可资利用,但由于在理论上仍存在争议,几种权威的统计软件(如SAS和SPSS)均没有提供这方面的方法。

虽然这些洋统计软件没有提供两两比较的非参数方法,但国产的统计软件大都是提供了的(国情不同嘛),因此建议大家:如果真的要做这方面的非参数分析,不如直接用PEMS、SPLMWIN、NOSA等国产软件,免得用SPSS等只能做一半。

在SPSS中,几乎所有的非参数分析方法都被放入了Nonparametric Tests 菜单中,具体来讲有以下几种:Chi-square test:用卡方检验来检验变量的几个取值所占百分比是否和我们期望的比例没有统计学差异。

比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%,我随便写的)。

请注意该检验和我们一般所用的卡方不太一样,我们一般左的卡方要用crosstable菜单来完成,而不是这里。

Binomial Test:用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以使连续性变量,然后按你给出的分界点一刀两断。

Runs Test:用于检验某变量的取值是否是围绕着某个数值随机地上下波动,该数值可以是均数、中位数、众数或人为制定。

利用SPSS进行非参数检验

利用SPSS进行非参数检验

利用SPSS进行非参数检验(卡方检验)
一、启动SPSS
二、建立数据文件
1、定义两个数值型变量:组限L和频数f(先确定变量名称,
变量类型的默认值为数值型)。

2、输入组限L和频数f的实际数据。

3、用Data菜单中的Weight cases将f变成Frequency(频率)。

三、单击Analyze s菜单,选择Nonparametric Test中的
Chi-Square选项,打开相应的对话框。

选择要进行检验的变量L。

四、根据需要选择相应的选择项:
1、在Expected Range中选择Get from data或Use specified
range,后者需指定Lower(下限)和Upper(上限)。

2、在Expected Values指定期望值:如检验总体是否服从均匀分
布,只需选定All categories equal项;如检验总体是否服从某
个给定的分布,需选定Values,并键入相应各组所对应的由
给定分布计算而得的期望值。

五、选定所需的各项后,单击Ok即可得所需结果。

SPSS非参数检验

SPSS非参数检验

SPSS⾮参数检验实验⽬的:学会使⽤SPSS的简单操作,掌握⾮参数检验。

实验内容: 1.中位数符号检验,检验总体中位数是否等于某个假定的值。

设⼀个随机样本有n个数据,总体中位数的实际值为M,假设的总体中位数值为。

当样本中的数据⼤于假设的中位数时,⽤“+”号表⽰,⼩于假设的中位数时,⽤“-”表⽰;对于恰好等于假设的中位数的数据予以剔出。

若关⼼实际的M与假设的是否有差别,应建⽴假设:;计算检验统计量S+和S-。

S+表⽰每个样本数据与与差值符号为正的个数;S-表⽰每个样本数据与差值符号为负的个数。

计算P值并作出决策。

若P<,拒绝原假设。

2.Wilcoxon符号秩检验,检验总体参数(如中位数)是否等于某个假定的值。

它是对符号检验的⼀种改进,弥补了符号检验的不⾜,要⽐单纯的符号检验更准确⼀些(对应的参数检验—单样本均值检验)。

检验步骤:①计算各样本观察值与假定的中位数的差值,并取绝对值;②将差值的绝对值排序,并找出它们的秩;③计算检验统计量和P值,并作出决策。

3.独⽴样本的检验,Mann-Whitney检验不需要诸如总体服从正态分布且⽅差相同等之类的假设,但要求是两个独⽴随机样本的数据⾄少是顺序数据;Kruskal-Wallis检验不需要总体服从正态分布且⽅差相等这些假设。

该检验可⽤于顺序数据,也可⽤于数值型数据。

要检验k个总体是否相同,提出如下假设。

:所有总体都相同,:并⾮所有总体都相同或等价于,不全相同。

4.秩相关检验,对两个顺序变量之间相关程度的⼀种度量。

Spearman秩相关系数也称等级相关系数,记为,计算公式为,的取值范围为[-1,1];,两种排序之间完全相关;若,两种排序之间为负相关;若,两种排序之间为正相关;若,两种排序之间不相关;越趋于1,相关程度越⾼;越趋于0,相关程度越低。

实验步骤: 1.中位数符号检验SPSS操作,点击【分析】→【⾮参数检验】→【相关样本】,打开【⾮参数检验、两个或更多相关样本】对话框。

SPSS非参数检验

SPSS非参数检验

SPSS非参数检验非参数检验 SPSS单样本非参数检验是对单个总体的分布形态等进行推断的方法,其中包括卡方检验、二项分布检验、K-S检验以及变量值随机性检验等方法。

参数检验与非参数检验的区别:参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。

但是,在数据分析过程中,由于种种原因,人们往往无法对总体分布形态作简单假定,此时参数检验的方法就不再适用了。

非参数检验正是一类基于这种考虑,在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。

由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数检验”。

一、几种常见的非参数检验1、总体分布的卡方检验卡方检验方法可以根据样本数据,推断总体分布与期望分布或某一理论分布是否存在显著差异,是一种吻合性检验,通常适于对有多项分类值的总体分布的分析。

它的原假设是:样本来自的总体分布与期望分布或某一理论分布无差异。

例如,医学家在研究心脏病人猝死人数与日期的关系时发现:一周之中,星期一心脏病人猝死者较多,其他日子则基本相当。

当天的比例近似为2.8:1:1:1:1:1:1。

现收集到心脏病人死亡日期的样本数据,推断其总体分布是否与上述理论分布相吻合。

2、二项分布检验SPSS的二项分布检验正是要通过样本数据检验样本来自的总体是否服从指定的概率为P的二项分布,其原假设是:样本来自的总体与指定的二项分布无显著差异。

在生活中有很多数据的取值是二值的,例如,人群可以分成男性和女性,产品可以分成合格和不合格,学生可以分成三好学生和非三好学生,投掷硬币实验的结果可以分成出现正面和出现反面等。

通常将这样的二值分别用1或0表示。

如果进行n次相同的实验,则出现两类(1或0)的次数可以用离散型随机变量X来描述。

如果随机变量X为1的概率设为P,则随机变量X值为0的概率Q便等于1-P,形成二项分布。

从某产品中随机抽取23个样品进行检测并得到检测结果。

非参数检验 SPSS操作

非参数检验 SPSS操作

非参数检验的SPSS操作前面一章介绍的二项分布的比率检验、配合度检验——卡方检验和1-Sample K-S检验等都属于非参数检验。

这一节我们主要结合前面参数假设检验一章讲过的t检验以及方差分析一章讲过的方差分析,来进一步分析,当参数检验的前提条件不满足时,两个样本和多个样本平均数差异的SPSS操作方法。

一、两个独立样本的差异显著性检验两独立样本的的差异显著性检验只有在满足如下条件时才能进行T检验:变量为正态分布的连续测量数据。

若数据不满足这样的条件,强行进行T检验容易造成错误的结论。

在数据不能满足这种参数检验的条件下,我们可以选择非参数检验方法进行。

与两独立样本差异显著性检验相对应的方法可以在SPSS主菜单Analyze / Nonparametric Tests / 2 Independent Samples…中得到。

1.数据采用本章第一节中例2的数据(数据文件“9-4-1.sav”),具体介绍操作过程。

2.理论分析对于数据文件9-4-1.sav中的数据,目的是检验男女生之间注意稳定性是否存在显著差异,注意稳定性测量的结果虽然是测量数据但是从总体上来看不满足正态分布的前提假设,另外不同性别的学生可以看成是两组独立的样本,因此对上述资料的检验可以用非参数的独立样本的检验方法。

2.操作过程(1)在SPSS主菜单中选择Analyze / Nonparametric Tests / 2 Independent Samples…得到两个独立样本非参数检验的主对话框(图9-1),把因变量atten选入到检验变量表列(Test Independent-SampleTests)中去,把gender选到分组变量(Grouping Variable)中,并单击Define Groups…,在随后打开的对话框中分别键入1与2,单击Continue回到主对话框如图9-1所示。

在Test Type中有四个可选项,其中最常用的是第一种方法Mann-Whitney U(又称秩和检验法)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Test Variable:一等品 Test Proportion:0.9 比较有用的结果:两组个数和sig=.193>0.5,不能拒绝零假 设,认为该批产品的一等品率达到了90% .
12.3 游程检验Runs test
单样本变量随机性检验是对某变量值出现是否随机进行 检验. 实例1(同二项分布检验) :掷一枚比赛用的挑边器 31次,变量tbh,1为出现A面,2为出现A面,试问这 挑边器出现AB面是否随机.数据data12-03( 31个 cases).
实例 :甲乙两种安眠药服用后的效果.数据data12-06(2个变量: 组别zb和延长时间ycss, 20个cases).试问这两种药物的疗效 是否有显著性差异.
Analyze-> Nonparametric Tests-> 2 independent Samples
Test Variable: ycss Grouping: zb(1,2) Test type:四种均选 比较有用的结果:比较四个sig值,有三个sig>.5,不能拒绝零 假设认为疗效无显著性差异.
非参数检验的过程
1. Chi-Square test 卡方检验 2. Binomial test 二项分布检验 3. Runs test 游程检验 4. 1-Sample Kolmogorov-Smirnov test 一个样本 柯尔莫哥洛夫-斯米诺夫检验 5. 2 independent Samples Test 两个独立样本检验 6. K independent Samples Test K个独立样本检验 7. 2 related Samples Test 两个相关样本检验 8 . K related Samples Test 两个相关样本检验
12.6 多个独立样本检验 K independent Samples Test
通过分析多个样本数据,推断它们的分布是否存在显著性差异.方 法有三种:
实例 :某车间用四种不同的操作方法检测产品优等品率的实验数 据.数据data12-07(2个变量: 方法ff和优等品率ydpl, 21个 cases).试问这四种不同的操作方法对产品优等品率是否有显著 性差异.
12.1 卡方检验 Chi-Square test 个水平是否有同样比例或者等于你所想象的比例(如 5:4:1) 实例1:掷骰子300次,变量LMT,1,2,3,4,5, 6分别代表六面的六个点,试问这骰子是否均匀.数据 data12-01(300个cases).
经典统计的多数检验都假定了总 体的背景分布. 但也有些没有假定总体分布的具 体形式,仅仅依赖于数据观测值 的相对大小(秩)或零假设下等 可能的概率等和数据本身的具体 总体分布无关的性质进行检验. 这都称为非参数检验.
为什么用非参数方法?
这些非参数检验在总体分布未知时有很大的优越 性.这时如果利用传统的假定分布已知的检验, 就会产生错误甚至灾难. 非参数检验总是比传统检验安全. 但是在总体分布形式已知时,非参数检验就不如 传统方法效率高.这是因为非参数方法利用的信 息要少些.往往在传统方法可以拒绝零假设的情 况,非参数检验无法拒绝. 但非参数统计在总体未知时效率要比传统方法要 高,有时要高很多.是否用非参数统计方法,要 根据对总体分布的了解程度来确定.
同一个被测试者,前后测两次,彼此相关.方法有四种. 实例 :某校15名男生的长跑锻炼后晨脉变化数据.数 据data12-08(2个变量: 锻炼前dlq和锻炼后dlh优, 21个cases).试问锻炼前后的晨脉有无显著性差异.
Analyze-> Nonparametric Tests-> 2 related Samples Test Pairs: dlq-dlh
TBH 2 31 21 1.469 .142
User-specified.
12.4 一个样本柯尔莫哥洛夫-斯米诺夫检验 1-Sample Kolmogorov-Smirnov test
单样本K-S检验是利用样本数据推断总体是否服从某一理论分布, 适用于探索连续型随机变量的分布形态(判断定距变量的分布情 况):Normal正态分布,Uniform均匀分布,Poisson泊松分布, Exponential指数分布. 实例 :卢瑟福和盖革作了一个著名的实验,他们观察了长为7.5秒 的时间间隔里到达某个计数器的由某块放射物资放出的alfa粒子质 点数,共观察了2608次.数据data12-05(1个变量zd, 2608 个cases,按0-10排序).试问这种分布规律是否服从泊松分布 Analyze-> Nonparametric Tests->1-Sample K-S Test Variable: zd One-Sample Kolmogor ov-Smir nov Test Test Distribution: Poisson ZD N 2608 比较有用的结果: Poisson Parameter Mean 3.8673 Most Extreme A bsolute .012 均值(3.8673), Differences Positiv e .010 sig=.850>0.5, Negative -.012 不能拒绝零假设, Kolmogorov -Smirnov Z .611 A sy mp. Sig. (2-tailed) .850 认为服从泊松分布.
Test type:选一种或多种 比较有用的结果:看sig值,sig<.05, 拒绝零假设, 认为锻炼前后的晨脉有显著性的差异.
12.8 多个相关样本检验 K related Samples Test
对多个被测试者,多个打分,看打分是否有显著性差异. 方法有三种:
Cochran Q:要求样本数据为二值的(1-满意 0-不满意) Friedman:利用秩实现 Kendall协同系数检验:H0:协同系数为0(评分标准不相关的 或者是随机的) 实例 :9个顾客对三种款式衬衫的喜爱程度(1-最喜爱 2-其 次 3-不喜爱).数据data12-09(3个变量: 款式A,款式B, 款式C, 27个cases).试问顾客对三种款式衬衫的喜爱程度 是否相同. Analyze-> Nonparametric Tests-> k related Samples
Test Variable:死亡日期 Expected Values: 2.8:1:1:1:1:1:1 比较有用的结果:sig=.256>0.5,不能拒绝零假设,认为心 脏病人猝死人数与日期的关系为2.8:1:1:1:1:1:1 .
12.2 二项分布检验 Binomial test
二项分布:在现实生活中有很多的取值是两类的,如人 群的男和女,产品的合格和不合格,学生的三好学生和 非三好学生,投掷硬币的正面和反面.这时如果某一类 出现的概率是P,则另一类出现的概率就是1-P.这种 分布称为二项分布. 实例1:掷一枚比赛用的挑边器31次,变量tbh,1为 出现A面,2为出现A面,试问这挑边器是否均匀.数据 data12-03(31个cases).
Analyze-> Nonparametric Tests-> Runs Test Variable: tbh Runs Test Cut Point:Custom:2 比较有用的结果: Test Value a 总case数(31), Total Cases 游程Run数(21), Number of Runs sig=.142>0.5, Z 不能拒绝零假设, Asymp. Sig. (2-tailed) 认为挑边器出现AB面是随机的. a.
Grouping: ff(1,4) Test type:三种均选 比较有用的结果:比较三个sig值,K-W方法的sig=.009<.05, 拒绝零假设,认为这四种不同的操作方法对产品优等品率是有显 著性差异.其他二个方法的sig>.5,但不用,原因是观测量太 少.
12.7 两个相关样本检验 2 related Samples Test
补充:卡方检验实例
实例:心脏病人猝死人数与日期的关系,收集168个观 测数据.其中用1,2,3,4,5,6,7表示是星期几 死的.而人数分别为55,23,18,11,26,20,15. 推断心脏病人猝死人数与日期的关系是否为 2.8:1:1:1:1:1:1.(变量2个:死亡日期和死亡人数, Cases 7个) 加权:Data->Weight Cases:死亡人数 Analyze-> Nonparametric Tests->Chi Square
实 例 1 的 数 据 可 以 组 织 成 : 两 个 变 量 ( side 面 和 number次数),6个cases.但在卡方检验前要求用 number加权.结果同.
Analyze-> Nonparametric Tests->Chi Square Test Variable: lmt 想要检验的变量 由 于 这 是 一 个 均 匀 分 布 检 测 , 使 用 默 认 选 择 ( Expected Values:All categories equal作为零假设); 比较有用的结果:sig=.111>0.5,不能拒绝零假设,认为均 匀.
实 例 1 的 数 据 可 以 组 织 成 : 两 个 变 量 ( side 面 和 number次数),2个cases.但在二项分布检验前要 求用number加权.结果同.
Analyze-> Nonparametric Tests-> Binomial Test Variable: tbh 由 于 这 是 一 个 均 匀 分 布 检 测 , 使 用 默 认 选 择 ( Test Proportion:0.5); 比较有用的结果:两组个数和sig=1.00>0.5,不能拒绝零假 设,认为挑边器是均匀.
Median:是通过对中位数的研究来实现推断的 K-W:是通过对推广的平均秩的研究来实现推断的 J-T:与两个独立样本检验的Mann-Whitney U类似
相关文档
最新文档