SPSS非参数检验之卡方检验

合集下载

SPSS非参数检验之一卡方检验

SPSS非参数检验之一卡方检验

SPSS非参数检验之一卡方检验

一、卡方检验的概念和原理

卡方检验是一种常用的非参数检验方法,用于检验两个或多个分类变量之间的关联性。它利用实际观察频数与理论频数之间的差异,来判断两个变量是否独立。

卡方检验的原理基于卡方分布,在理论上,如果两个变量是独立的,那么它们的观测频数应该等于理论频数。卡方检验通过计算卡方值来度量观察频数与理论频数之间的差异程度,进而判断两个变量是否独立。

卡方值的计算公式为:

卡方值=Σ((观察频数-理论频数)²/理论频数)

其中,观察频数为实际观察到的频数,理论频数为理论上计算得到的频数。

二、卡方检验的步骤

卡方检验的步骤包括以下几个方面:

1.建立假设:首先需要建立原假设和备择假设。原假设(H0)是两个变量之间独立,备择假设(H1)是两个变量之间存在关联。

2.计算理论频数:根据原假设和已知数据,计算出各组的理论频数。

3.计算卡方值:利用卡方值的计算公式,计算观察频数与理论频数之间的差异。

4.计算自由度:自由度的计算公式为自由度=(行数-1)*(列数-1)。

5.查表或计算P值:根据卡方值和自由度,在卡方分布表中查找对应

的临界值,或者利用计算机软件计算P值。

6.判断结果:判断P值与显著性水平的关系,如果P值小于显著性水平,则拒绝原假设,认为两个变量存在关联;如果P值大于显著性水平,

则接受原假设,认为两个变量是独立的。

三、卡方检验在SPSS中的应用

在SPSS软件中,进行卡方检验的操作相对简单。下面以一个具体的

案例来说明:

假设我们有一份数据,包括了男性和女性在健康习惯(吸烟和不吸烟)方面的调查结果。我们想要检验性别与吸烟习惯之间是否存在关联。

医学统计学之卡方检验SPSS操作

医学统计学之卡方检验SPSS操作

医学统计学之卡方检验SPSS操作

卡方检验(Chi-Square Test)是一种常用的统计方法,用于比较两

个或多个分类变量的分布是否存在差异。该方法主要用于处理分类数据,

例如比较男女性别和吸烟与否对癌症发生的关系。

在SPSS(Statistical Package for the Social Sciences)软件中,进行卡方检验的操作主要分为数据准备、假设设定和计算步骤。

第一步:数据准备

首先,需要在SPSS中导入数据。假设我们需要在一个样本中比较男

女性别和吸烟与否的关系,我们可以将性别和吸烟状况作为两个分类变量,分别用“Male”和“Female”表示性别,“Smoker”和“Non-smoker”表

示吸烟状况。将这些数据输入到SPSS中的一个数据表中。

第二步:假设设定

接下来,需要设置假设。在卡方检验中,我们通常有一个原假设和一

个备择假设:

-原假设(H0):两个或多个分类变量之间没有显著差异。

-备择假设(H1):两个或多个分类变量之间存在显著差异。

在本例中,原假设可以是“性别和吸烟状况之间没有显著差异”,备

择假设可以是“性别和吸烟状况之间存在显著差异”。

第三步:计算步骤

进行卡方检验的计算步骤如下:

1.打开SPSS软件并导入数据。

2. 选择“分析(Analyse)”菜单,然后选择“非参数检验(Nonparametric Tests)”子菜单,最后选择“卡方(Chi-Square)”选项。

3.在弹出的对话框中选择两个分类变量(性别和吸烟状况),并将它们添加到变量列表中。

4.点击“确定(OK)”按钮,开始进行卡方检验的计算。

spss-非参数检验-K多个独立样本检验( Kruskal-Wallis检验)案例解析

spss-非参数检验-K多个独立样本检验( Kruskal-Wallis检验)案例解析

spss-非参数检验-K多个独立样本检验( Kruskal-Wallis检验)案例解析2011-09-19 15:09

最近经常失眠,好痛苦啊!大家有什么好的解决失眠的方法吗?希望知道的能够告诉我,谢谢啦,今天和大家一起探讨和分下一下SPSS-非参数检验--K个独立样本检验( Kruskal-Wallis检验)。

还是以SPSS教程为例:

假设:HO: 不同地区的儿童,身高分布是相同的

H1:不同地区的儿童,身高分布是不同的

不同地区儿童身高样本数据如下所示:

提示:此样本数为4个(北京,上海,成都,广州)每个样本的样本量(观察数)都为5个

即:K=4>3 n=5, 此时如果样本逐渐增大,呈现出自由度为K-1的平方的

分布,(即指:卡方检验)

点击“分析”——非参数检验——旧对话框——K个独立样本检验,进入如下界面:

将“周岁儿童身高”变量拖入右侧“检验变量列表”内,将“城市(CS)变量” 拖入“分组变量”内,点击“定义范围” 输入“最小值”和“最大值”(这里的变量类型必须为“数字型”)如果不是数字型,必须要先定义或者重新编码。

在“检验类型”下面选择“秩和检验”( Kruskal-Wallis检验)点击确定

运行结果如下所示:

对结果进行分析如下:

1:从“检验统计量a,b”表中可以看出:秩和统计量为:13.900

自由度为:3=k-1=4-1

下面来看看“秩和统计量”的计算过程,如下所示:

假设“秩和统计量”为 kw 那么:

其中:n+1/2 为全体样本的“秩平均” Ri./ni 为第i个样本的秩平均 Ri.代表第i个样本的秩和, ni代表第i个样本的观察数)

SPSS非参数检验之一卡方检验

SPSS非参数检验之一卡方检验

SPSS 中非参数检验之一:总体分布的卡方(Chi —square )检验

在得到一批样本数据后,人们往往希望从中得到样本所来自的总体的分布形态是否和某种特定分布相拟合.这可以通过绘制样本数据直方图的方法来进行粗略的判断。如果需要进行比较准确的判断,则需要使用非参数检验的方法。其中总体分布的卡方检验(也记为χ2检验)就是一种比较好的方法。

一、定义

总体分布的卡方检验适用于配合度检验,是根据样本数据的实际频数推断总

体分布与期望分布或理论分布是否有显著差异。它的零假设H0:样本来自的总体分布形态和期望分布或某一理论分布没有显著差异。 总体分布的卡方检验的原理是:如果从一个随机变量尤中随机抽取若干个观察样本,这些观察样本落在X 的k 个互不相交的子集中的观察频数服从一个多项分布,这个多项分布当k 趋于无穷时,就近似服从X 的总体分布。 因此,假设样本来自的总体服从某个期望分布或理论分布集的实际观察频数同时获得样本数据各子集的实际观察频数,并依据下面的公式计算统计量Q

()2

1

k

i i i i O E Q E =-=∑

其中,Oi 表示观察频数;Ei 表示期望频数或理论频数.可见Q 值越大,表示观察

频数和理论频数越不接近;Q 值越小,说明观察频数和理论频数越接近.SPSS 将自动计算Q 统计量,由于Q 统计量服从K-1个自由度的X 平方分布,因此SPSS 将根据X 平方分布表给出Q 统计量所对应的相伴概率值。

如果相伴概率小于或等于用户的显著性水平,则应拒绝零假设H0,认为样本来自的总体分布形态与期望分布或理论分布存在显著差异;如果相伴概率值大于显著性水平,则不能拒绝零假设HO ,认为样本来自的总体分布形态与期望分布或理论分布不存在显著差异. 因此,总体分布的卡方检验是一种吻合性检验,比较适用于一个因素的多项分类数据分析.总体分布的卡方检验的数据是实际收集到的样本数据,而非频数数据。

SPSS 非参数检验

SPSS 非参数检验

实例结果及分析
(1)频数表
SPSS的结果报告中列出了期望频数和实际频数。 显然残差值越小,说明实际频数与期望频数越接近。
Observed N-Expected N
Observed N Clerical 363 27 84 474 Expected N 379.2 23.7 71.1 Residual -16.2 3.3 12.9
• Step02:选择检验变量 在【Chi-Square Test(卡方检验)】对话框左侧的候选 变量列表框中选择一个或几个变量,将其添加至【Test Variable List(检验变量列表)】列表框中,表示需要进 行进行卡方检验的变量。 • Step03:确定检验范围 在【Expected Range(期望全距)】选项组中可以确定检 验值的范围,对应有两个单选项。 • Step04:选择期望值 在【Expected Values(期望值)】选项组中可以指定期 望值 ,对应有两个单选项。
表1 参数检验和非参数检验的效率比较
对正态总体的非 参数检验的效 率评价
应用
参数检验
非参数检验
配对样本数据 两个独立样本 多个独立样本 相关 随机性
t检验或者z检验 t检验或者z检验 方差分析(F检验) 线性相关 无可用的参数检验
符号检验 Wilcoxon检验 Wilcoxon检验 K-W检验 秩相关检验 游程检验

spss使用教程非参数检验

spss使用教程非参数检验
定义:单样本K-S检验是以两位前苏联数 学家Kolmogorov和Smirnov命名的,也是一种 拟合优度的非参数检验方法。单样本K-S检验 是利用样本数据推断总体是否服从某一理论分 布的方法,适用于探索连续型随机变量的分布 形态。
第43页/共152页
单样本K-S检验可以将一个变量的实际频 数分布与正态分布(Normal)、均匀分布 (Uniform)、泊松分布(Poisson)、指数 (Exponential)分布进行比较。其零假设H0 为样本来自的总体与指定的理论分布无显著差 异。
人数 2 4 7 16 20 25 24 22 16 2 6 1
第49页/共152页
实现步骤
图10-12 在菜单中选择“1-Sample K-S”命令
第50页/共152页
图10-13 “One-Sample Kolmogorov-Smirnov Test”对话框
第51页/共152页
图10-14 “One-Sample K-S:Options”对话框
第54页/共152页
两个样本是否独立,主要看在一个总体中抽取 样本对另外一个总体中抽取样本有无影响。如 果没有影响,则可以认为两个总体是独立的。 SPSS提供了4种两独立样本的非参数检验方法。
第55页/共152页
1.两独立样本的Mann-Whitney U检验
两独立样本的Mann-Whitney U检验的零假设H0 为样本来自的两独立总体均值没有显著差异。

配对卡方检验spss步骤

配对卡方检验spss步骤

配对卡方检验spss步骤

配对卡方检验SPSS步骤

引言:

配对卡方检验是一种常用的统计方法,用于比较两个相关变量之间的关系是否显著。在SPSS软件中进行配对卡方检验非常方便,本文将详细介绍使用SPSS进行配对卡方检验的步骤。

步骤一:准备数据

在进行配对卡方检验之前,首先需要准备数据。假设我们有两个相关的分类变量X和Y,且每个变量都有两个或多个水平(例如,男性和女性)。确保数据已经输入到SPSS,每个变量拥有自己的列。

步骤二:导入数据到SPSS

打开SPSS软件并选择“文件”选项,然后选择“打开”命令来导入数据文件。确保选择正确的文件路径,并选择数据文件。在弹出窗口中选择适当的选项,然后点击“确定”按钮将数据导入到SPSS 软件中。

步骤三:选择配对卡方检验

在SPSS软件中,选择“分析”选项,并从下拉菜单中选择“非参数检验”,然后选择“配对样本”和“卡方检验”选项。

步骤四:设定变量

在弹出的“配对样本卡方检验”对话框中,将需要进行配对卡方检验的变量移动到“变量对”框中。确保变量的顺序与数据文件中的顺序一致。

步骤五:设定统计量

在同一对话框中,选择“卡方相关系数”以计算配对变量之间的关系强度。选择“精确度”选项以获取更加精确的结果。如果选择“对称测验”,则将计算渐近P值,并且结果会更快。

步骤六:运行配对卡方检验

点击对话框底部的“确定”按钮来运行配对卡方检验。SPSS将计算卡方统计量和与之相关的P值。结果将以表格形式呈现在输出窗口中。

步骤七:解读结果

配对卡方检验的结果将显示在输出窗口中的“卡方相关系数”表格中。首先,关注卡方值(χ^2)的大小。如果卡方值较大,则意味着两个变量之间的关系较强。其次,观察P值。如果P值小于事先

spss卡方检验

spss卡方检验

spss卡方检验

SPSS卡方检验

SPSS(统计软件包 for the Social Sciences)是一种功能强大的统计软件,在社会科学、商业智能和市场调研等领域得到广泛应用。其中,卡方检验是SPSS中常用的统计方法之一。本文将介绍SPSS 中使用卡方检验进行数据分析的基本步骤、原理和注意事项。

一、卡方检验的基本概念

卡方检验,又称为卡方拟合优度检验,用于比较观察样本与理论预期分布之间的差异。它基于卡方统计量,可以用于分析分类数据的关联性和独立性。卡方检验的结果可以帮助研究人员判断观察数据与理论模型之间的差异程度以及独立性。

二、SPSS中进行卡方检验的步骤

1. 收集数据并导入到SPSS中。

2. 在SPSS中选择“分析”菜单,点击“描述统计”下的“交叉表”。

3. 在交叉表对话框中,选择需要比较的两个变量。

4. 点击“统计”按钮,选择“卡方”选项。

5. 点击“继续”按钮,然后点击“OK”按钮生成交叉表结果。

三、SPSS卡方检验的原理

SPSS中的卡方检验基于卡方统计量,该统计量用于衡量观察值与理论期望值之间的差异。卡方统计量的计算公式如下:

\\[ X^2 = \\sum \\frac{(O-E)^2}{E} \\]

其中,O表示观察值,E表示理论期望值。卡方统计量服从自由度为(k-1) × (m-1)的卡方分布,其中k表示列数,m表示行数。通过计算卡方统计量,可以得到卡方值和P值。如果P值小于设定的显著性水平(通常为0.05),则认为观察值与理论期望值存在显著差异,拒绝原假设。

四、卡方检验的应用场景

spss--第八讲:Nonparametric

spss--第八讲:Nonparametric

非参数检验

非参数检验,又称为分布检验,与前面介绍的t、F检验的着眼点不同,它并不对总体的参数进行检验,而是研究目标总体的分布情况是否与理论相同,或分布位置及形状是否相同。常见的非参数检验如卡方检验、秩和检验、二项分布检验、游程检验等。

本讲内容主要分为两个部分:分布检验(即所谓的拟合优度检验,包括Chi-square、Binomial、Runs、1-Sample K-S命令)与位置检验(2 Independent Samples、K Independent Samples、2 Related Samples、K Related Samples命令)。

一、分布检验

Chi-Square:

请注意,这里所指的Chi-square不是教科书上的卡方检验(课本中的卡方检验使用的是Crosstabs 命令),准确的说应该称为卡方拟合优度检验。其检验目的在于分析分类数据的频数分布是否满足特定的概率分布。例如:一颗骰子投掷300次,各点出现的频数结果见骰子.sav,问该骰子是否是六面均匀的。我们假设骰子是均匀的,则每一个面出现的理论频数均为50次,但是由于抽样误差所以300次投掷所组成的一个样本中并非每个面出现的频率均为50次,如果假设成立的话,实际频数与理论频数的差距应该不大,这就需要用到拟合优度检验。

由于提供的数据已经是经过整理后的频数表数据,所以分析时要对点出现的频数加权:

上图为Chi-square的主对话框,讲点数选入test variable list中,expected range为设定检验变量的取值范围,默认是所有变量值都进入分析;Expected values为理论值,默认情况下认为每个类别是均匀分布的;对于本例由于所有变量取值都进入分析,而且假设每个面出现的概率均相同,所以不必对上述界面作变动。接着点击Exact选择是否进行精确概率运算:

SPSS显著性分析解析

SPSS显著性分析解析

SPSS显著性分析解析

在统计学中,显著性分析是用来确定统计结果的意义是否具有统计学

上的差异或重要性的一种方法。在SPSS中进行显著性分析,通常使用t

检验、方差分析和卡方检验等方法。下面将就这几种方法进行详细解析。

1.t检验

t检验用于比较两个样本平均值之间是否存在差异。SPSS中可以通过

选择"分析"-"比较手段"-"独立样本t检验"或"配对样本t检验"来进行t

检验。

对于独立样本t检验,需要选择两个独立的样本变量,并将其分组进

行比较。输出结果中将给出均值、标准差、置信区间和显著性水平等信息,可以通过显著性水平来判断两组之间的差异是否具有统计学意义。

对于配对样本t检验,需要选择一个变量,并对其进行两次测量,然

后进行比较。输出结果中同样包含了显著性水平来判断差异是否具有统计

学意义。

2.方差分析

方差分析用于比较三个或更多样本之间的平均值是否存在差异。SPSS

中可以通过选择"分析"-"比较手段"-"方差分析"来进行方差分析。

在方差分析中,需要选择一个因素变量和至少一个依赖变量。输出结

果将给出各组均值、标准差、方差分析表和显著性水平等信息,可以通过

显著性水平来判断不同组之间的差异是否具有统计学意义。

3.卡方检验

卡方检验用于比较两个或更多分类变量之间的差异。SPSS中可以通

过选择"分析"-"非参数检验"-"卡方"来进行卡方检验。

在卡方检验中,需要选择一个或多个分类变量,然后进行比较。输出

结果将给出卡方检验的结果,包括卡方值、自由度和显著性水平等信息,

可以通过显著性水平来判断不同组之间的差异是否具有统计学意义。

卡方检验实验报告

卡方检验实验报告

竭诚为您提供优质文档/双击可除

卡方检验实验报告

篇一:实验报告卡方检验

试验报告

解:组数:1→对照,2→新措施。

存活与死亡数:1→存活数,2→死亡数。

在spss中输入数据后选择选择数据→加权个案,然后

再选择分析→描述统计→交叉表。得到如下表:

由表1与表2可以看出有效案例中的n=300,自由度为

1,卡方值为:7.317,p值为:p=0.0073.8415,拒绝假设是

合理的。

解:在spss中输入数据后选择选择数据→加权个案,

然后再选择分析→描述统计→交叉表。得到如下表:

篇二:非参数检验(卡方检验)实验报告

大理大学实验报告

课程名称

12

SPSS统计分析非参数检验

SPSS统计分析非参数检验

95% Confidence
Interval of the
Sig.
Mean
Difference
t
df
(2-tailed) Difference Lower
Upper
HB
-.592
39
.558
-.2122 -.9379
.5134
从表5-2可看出,t值为-0.592,自由度 为39,显著值为0.558,样本均值与检验 值的差为-0.2122,该差值95%的置信区 间是-0.9379~0.5134。
显著4度60.91 618.19 325.00 509.60
ANOVA Table F值
Sum of
Mean
Squares df Square F Sig.
现 在 每 Between (Combined)10489339.4 7 1498477 6.006 .000
月 工 资 * GWriothuipnsGroups 文化程
B、F 值计算公式:
组间方差 F 组内方差
= SSB / d . f SSW / d . f
C、F分布的形状 拒绝域
接受域 拒绝域
D、SPSS中 F 检验示例(文化程度与收入) 步骤:
1)确定双变量总体参数的假设:
H0: μ1=μ2 = μ3 = ...μk ; H1: μ1 ≠μ2 ≠μ3≠ ...μk ;

非参数检验(卡方检验),实验报告

非参数检验(卡方检验),实验报告

非参数检验(卡方检验),实验报告

评分

大理大学实验报告

课程名称

生物医学统计分析

实验名称

非参数检验( 卡方检验)

专业班级

实验日期

实验地点

20xx—20xx 学年度第

2

学期一、

实验目得对分类资料进行卡方检验。

二、实验环境

1 、硬件配置:处理器:Intel(R) Core(TM) i5-4210U CPU 1、7GHz 1、7GHz 安装内存(RAM):4、00GB

系统类型:64 位操作系统 2 、软件环境:IBM SPSS

Statistics 19、0 软件

三、实验内容(包括本实验要完成得实验问题及需要得相关知识简单概述) (1)

课本第六章得例6、1-6、5 运行一遍,注意理解结果; (2)然后将实验指导书得例1-4 运行一遍,注意理解结果。

四、实验结果与分析

(包括实验原理、数据得准备、运行过程分析、源程序(代码)、图形图象界面等) 例例6 、1 表1 灭螨A A 与灭螨B B 杀灭大蜂螨效果得交叉制表

效果合计杀灭未杀灭组别灭螨A 32 12 44 灭螨B 14 22 36 合计46 34 80 分析: 表1就是灭螨A与灭螨B杀灭大蜂螨效果得样本分类得频数分析表,即交叉列联表。

表2 卡方检验

X2 值df 渐进Sig、(双侧) 精确Sig、(双侧) 精确Sig、(单侧) Pearson 卡方9、277a

1 、002

连续校正b

7、944 1 、005

似然比9、419 1 、002

Fisher 得精确检验

、003 、002 有效案例中得N 80

a、0 单元格(、0%) 得期望计数少于5。最小期望计数为

spss-非参数检验-K多个独立样本检验(-K

spss-非参数检验-K多个独立样本检验(-K

spss-非参数检验-K多个独立样本检验( Kruskal-Wallis检验)案例解析

最近经常失眠,好痛苦啊!大家有什么好的解决失眠的方法吗?希望知道的能够告诉我,谢谢啦,今天和大家一起探讨和分下一下SPSS-非参数检验--K个独立样本检验( Kruskal-Wallis检验)。

还是以SPSS教程为例:

假设:HO: 不同地区的儿童,身高分布是相同的

H1:不同地区的儿童,身高分布是不同的

不同地区儿童身高样本数据如下所示:

提示:此样本数为4个(北京,上海,成都,广州)每个样本的样本量(观察数)都为5个

即:K=4>3 n=5, 此时如果样本逐渐增大,呈现出自由度为K-1的平方的

分布,(即指:卡方检验)

点击“分析”——非参数检验——旧对话框——K个独立样本检验,进入如下界面:

将“周岁儿童身高”变量拖入右侧“检验变量列表”内,将“城市(CS)变量” 拖入“分组变量”内,点击“定义范围” 输入“最小值”和“最大值”(这里的变量类型必须为“数字型”)如果不是数字型,必须要先定义或者重新编码。

在“检验类型”下面选择“秩和检验”( Kruskal-Wallis检验)点击确定

运行结果如下所示:

对结果进行分析如下:

1:从“检验统计量a,b”表中可以看出:秩和统计量为:13.900

自由度为:3=k-1=4-1

下面来看看“秩和统计量”的计算过程,如下所示:

假设“秩和统计量”为 kw 那么:

其中:n+1/2 为全体样本的“秩平均” Ri./ni 为第i个样本的秩平均 Ri.代表第i个样本的秩和, ni代表第i个样本的观察数)

SPSS数据分析—卡方检验

SPSS数据分析—卡方检验

SPSS数据分析—卡方检验

卡方统计量是基于卡方分布的一种检验方法,根据频数值来构造统计量,是一种非参数检验方法。SPSS中在交叉表和非参数检验中,都可调用卡方检验。卡方检验的主要有两类应用

一、拟合度检验

1.检验单个无序分类变量各分类的实际观察次数和理论次数是否一致

此类问题为单变量检验,首先要明确理论次数,这个理论次数是根据专业或经验已知的,原假设为观察次数与理论次数一致

例】:随机抽取60名高一学生,问他们文理要不要分科,回答赞成的39人,反对的21人,问对分科的意见是否有显著的差异。

分析:如果意见没有差异,那么赞成反对的人数应该各半,即30次,因此理论次数为30

例】:一周内各日患忧郁症的人数漫衍如下表所示,请检验一周内各日人们忧郁数是否满足1:1:2:2:1:1:1

例】:一个骰子投掷120次,记录掷得每个点数的次数,问该骰子是否存在问题如果骰子是正常的,那么每个点数掷得

的概率应该相等,操作方法和前面一样,也使用非参数检验过程,选择默认的所有类别相等

卡方检验主要用于分类变量,但是也可以用于对连续变量的拟合度检验上,此类问题的基本思想是:将总体X的取值范围分成k个互不重叠的小区间

A1.A2.Ak,把落入第i个小区间的样本值个数作为实际频数,所有实际频数之和等于样本容量,根据理论分布,可以算出总体X的值落入每个小区间Ai的概率Pi,于是nPi就是落入Ai的样本值的理论频数。有了实际频数和理论频数,就可以计算卡方统计量并进行卡方检验了。

二、独立性检验

独立性检验分析两变量之间是否相互独立或有无分歧,也可以在控制某种因素之后,分析两变量之间是否相互独立或有无分歧。原假设为两变量相互独立或两变量间的相互作用没有分歧。

spss学习系列24.卡方检验

spss学习系列24.卡方检验

卡方检验,是针对无序分类变量的一种非参数检验,其理论依据是:实际观察频数f 0与理论频数f e (又称期望频数)之差的平方再除以理论频数所得的统计量,近似服从2χ分布,即

(n f f f e

e 2

202

~)(χχ∑-= 卡方检验的一般是用来检验无序分类变量的实际观察频数和理论频数分布之间是否存在显著差异,二者差异越小,2χ值越小。

卡方检验要求:

(1)分类相互排斥,互不包容; (2)观察值相互独立;

(3) 样本容量不宜太小,理论频数≥5,否则需要进行校正(合并单元格、增加样本数、去除样本法、使用校正公式校正卡方值)。

卡方校正公式为:

--=e

e f f f 2

02)5.0(χ

卡方检验的原假设H 0: 2χ= 0; 备择假设H 1: 2χ≠0; 卡方检验的用途:

(1)检验某连续变量的数据是否服从某种分布(拟合优度检验); (2)检验某分类变量各类的出现概率是否等于指定概率; (3)检验两个分类变量是否相互独立(关联性检验); (4)检验控制某几个分类因素之后,其余两个分类变量是否相互独立;

(5)检验两种方法的结果是否一致,例如两种方法对同一批人进行诊断,其结果是否一致。

(一)检验单样本某水平概率是否等于某指定概率

一、单样本案例

例如,检验彩票中奖号码的分布是否服从均匀分布(概率=某常值);检验某产品市场份额是否比以前更大;检验某疾病的发病率是否比以前降低。

有数据文件:

检验“性别”的男女比例是否相同(各占1/2)。

1. 【分析】——【非参数检验】——【单样本】,打开“单样本非参数检验”窗口,【目标】界面勾选“自动比较观察数据和假设数据”

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

SPSS 中非参数检验之一:总体分布的卡方(Chi-square )检验

在得到一批样本数据后,人们往往希望从中得到样本所来自的总体的分布形态是否和某种特定分布相拟合。这可以通过绘制样本数据直方图的方法来进行粗略的判断。如果需要进行比较准确的判断,则需要使用非参数检验的方法。其中总体分布的卡方检验(也记为χ2检验)就是一种比较好的方法。

一、定义

总体分布的卡方检验适用于配合度检验,是根据样本数据的实际频数推断总

体分布与期望分布或理论分布是否有显著差异。它的零假设H0:样本来自的总体分布形态和期望分布或某一理论分布没有显著差异。 总体分布的卡方检验的原理是:如果从一个随机变量尤中随机抽取若干个观察样本,这些观察样本落在X 的k 个互不相交的子集中的观察频数服从一个多项分布,这个多项分布当k 趋于无穷时,就近似服从X 的总体分布。 因此,假设样本来自的总体服从某个期望分布或理论分布集的实际观察频数同时获得样本数据各子集的实际观察频数,并依据下面的公式计算统计量Q

()2

1

k

i i i i O E Q E =-=∑

其中,Oi 表示观察频数;Ei 表示期望频数或理论频数。可见Q 值越大,表示

观察频数和理论频数越不接近;Q 值越小,说明观察频数和理论频数越接近。SPSS 将自动计算Q 统计量,由于Q 统计量服从K-1个自由度的X 平方分布,因此SPSS 将根据X 平方分布表给出Q 统计量所对应的相伴概率值。

如果相伴概率小于或等于用户的显著性水平,则应拒绝零假设H0,认为样本来自的总体分布形态与期望分布或理论分布存在显著差异;如果相伴概率值大于显著性水平,则不能拒绝零假设HO ,认为样本来自的总体分布形态与期望分布或理论分布不存在显著差异。 因此,总体分布的卡方检验是一种吻合性检验,比较适用于一个因素的多项分类数据分析。总体分布的卡方检验的数据是实际收集到的样本数据,而非频数数据。

二、实例

某地一周内各日患忧郁症的人数分布如下表所示,请检验一周内各日人们忧

实施步骤:

1、打开SPSS 20.0,导入数据。

2、数据--加权个案,如下图所示。

3、分析--非参数检验--旧对话框--卡方检验

将要检验的一周内各日人们忧郁数比例1:1:2:2:1:1:1输入到SPSS中。

由结果可知P=0.331>0.05,不能拒绝原假设,因此可以得出结论:一周内各日人们忧郁数比例为1:1:2:2:1:1:1。

相关文档
最新文档