第七章 spss非参数估计
第7章SPSS的非参数检验 ppt课件

ppt课件
19
SPSS多独立样本非参数检验
(一)目的:
– 与样本在相同点的累计频率进行比较.如果相差 较小,则认为样本所代表的总体符合指定的总体 分布.
ppt课件
9
SPSS的单样本K-S检验
K-S检验
(4)基本步骤:
菜单选项:analyze->nonparametric tests->1-sample k-s 选择待检验的变量入test variable list 框 指定检验的分布名称(test distribution)
ppt课件
17
SPSS两独立样本非参数检验
4. 极端反应检验(Moses Extreme Reaction)
首先,将两样本混合并按升序排序。
然后,求出控制样本的最小秩和最大秩,并计算
出跨度=最大—最小+1。
为了消除样本数据中极端值对分析结果的影响,
在计算跨度之前可按比例去除控制样本中部分靠近两端
的样本值,然后再求跨度,得到截头跨度。
样本数据和分组标志 ppt课件
14
SPSS两独立样本非参数检验
(四)基本方法
1.曼-惠特尼U检验(Mann-Whitney U):平均秩检验
将两样本数据混合并按升序排序 求出其秩 对两样本的秩分别求平均 如果两样本的平均秩大致相同,则认为两总体分布无显著 差异
ppt课件
15
SPSS两独立样本非参数检验
如果跨度或截头跨度较大,则说明是由于两类样
本数据充分混合的结果,p即pt课:件认为两总体分布无显著差异18 .
SPSS两独立样本非参数检验
(五)基本操作步骤
菜单选项:analyze->nonparametric tests->2 independent sample 选择待检验的变量入test variable list框 选择一种或几种检验方法
第7章-SPSS非参数检验课件

第7章-SPSS非参数检验
决策情况: 如果上述两种情况下的概率 P值小
于显著性水平 ,则应拒绝原假设,
即认为样本来自的总体分布与指定的 二项分布存在显著差异;反之,则不 存在显著差异。
第7章-SPSS非参数检验
二项分布检验的基本操作与应用 (以产品合格率.sav为例) 分析
非参数检验
二项式
第7章-SPSS非参数检验
基本思想:利用游程大小进行判断。
游程是指变量值序列中连续出现相同的值的 次数
检验统计量: Z r u r
其中,
ur
2 n1n2 n1 n2
r r2 第7章2(-nnSP11SnS非2参(n2数2n)检21验n(n21nn12n12))
变量值随机性检验的SPSS操作 以耐电压值.sav为例
2.试着检验抛硬币实验中,正面出现的概率是 否为1/2.数据在硬币结果.sav中。
3.试着检验10个电子元件的使用寿命分布是否 服从指数分布?数据在电子元件使用寿命.sav 中。
输入检 验概率
值
第7章-SPSS非参数检验
第7章-SPSS非参数检验
由于概率P大于0.05, 所以不能拒绝原假设, 即认为一级品率不低
于0.9 第7章-SPSS非参数检验
单样本K-S检验
概念 • K-S检验(Kolmogorow-Smirnov),该方
法能够利用样本数据推断样本来自总体是 否与某一个理论分布有显著差异,是一种 拟合优度的检验方法,适用于探索连续型 随机变量的分布。
Dm ax(S(xi1)F(xi))
第7章-SPSS非参数检验
• 决策情况: 如果D统计量的概率 P值小于显著
性水平 ,则应拒绝原假设,即认
第7章spss非参数检验

Statistics按钮: 计算卡方值,用于行列
变量的独立性检验
计算pearson和spearman 相关系数
定类资料的行列变 量相关性检验
定序资料的行列变 量相关性检验
定序与定距资料的行 列变量相关性检验
评判内部一致性 相关风险比例 两相关二项分类变量的非参检验
二项分类变量的因、自变量独立性检验
p(1 p) / n
17
【界面设置】
检验的落入第一组的 概率常数值
分组值,小于该值为1 组,其余为1组
注意大小样本的选择
18
【结果形式】
19
7.3 Runs 游程检验 主要用于对二分变量(数值型)或利用断点分 为两组的变量,检验取值的分布随机性或两总体分 布是否一致,即一个case的取值是否影响下一个。 统计原假设H0:样本二分值分布是随机的或两总体分 布相同。
5、 2 Independent Samples 两独立(成组)样本检验
6、 K Independent Samples K个独立样本检验 5、 2 Related Samples 两关联(配对)样本检验 6、 K Related Samples K个关联样本检验
2
7.1 Chi-Square
1、卡方拟合优度检验 (Nonparametric Tests - Chi-Square) 主要用于分析实际频数与理论频数(已知)拟合情况;χ2 值反映了实际频数和理论频数的吻合程度。χ2值越小, 说明实际频数与理论频数越吻合。 适用于一个变量的多项分类数据的检验分析。 统计原假设:实际频数与理论频数相等或实际构成比等于 已知构成比。 k ( f 0 f e )2 卡方统计量为 2
25
【界面设置】
SPSS的非参数检验

02
SPSS非参数检验概述
定义与特点
定义
非参数检验是在统计分析中,相对于参数检验的一种统计方法。 它不需要对总体分布做严格假定,只关注数据本身的特点,因此 具有更广泛的适用范围。
特点
非参数检验对总体分布的假设较少,强调从数据本身获取信息, 具有灵活性、稳健性和适用范围广等优点。
局限性
计算量大
对于大规模数据集,非参数检验的计算量可 能较大,需要较长的计算时间。
对数据要求高
非参数检验要求数据具有可比性,对于不可 比的数据集可能无法得出正确的结论。
解释性较差
非参数检验的结果通常较为简单,对于深入 的统计分析可能不够满足。
对异常值敏感
非参数检验对异常值较为敏感,可能导致结 果的偏差。
THANK YOU
感谢聆听
常用非参数检验方法
独立样本非参数检验
用于比较两个独立样本的差异 ,如Mann-Whitney U 检验 、Kruskal-Wallis H 检验等。
相关样本非参数检验
用于比较相关样本或配对样本 的关联性,如Wilcoxon signed-rank 检验、Kendall's tau-b 检验等。
等级排序非参数检验
案例二:两个相关样本的非参数检验
总结词
适用于两个相关样本的比较,如同一班级内不同时间点的成绩比较。
描述
使用SPSS中的两个相关样本的非参数检验,如Wilcoxon匹配对检验,可以比较两个相关样本的总体分布是否相 同。
案例二:两个相关样本的非参数检验
01
步骤
02
1. 打开SPSS软件,输入数据。
第七章SPSS非参数检验

二、SPSS两独立样本非参数检验
(一)目的 由独立样本数据推断两总体的分布是否存在显著差异
(或两样本是否来自同一总体)。 (二)基本假设 H0:两总体分布无显著差异(两样本来自同一总体) (三)数据要求 样本数据和分组标志
•第七章SPSS非参数检验
二、SPSS两独立样本非参数检验
– 与样本在相同点的累计频率进行比较。如果相差较小,则认为样
本所代表的总体符合指定的总体分布。
•第七章SPSS非参数检验
一、SPSS单样本非参数检验
(三)K-S检验 (4)基本步骤
菜单选项:analyze->nonparametric tests->1-sample k-s 选择待检验的变量入test variable list 框 指定检验的分布名称(test distribution)
将两样本混合并按升序排序 分别计算两个样本在相同点上的累计频数和累计频率 两个累计频率相减。 如果差距较小,则认为两总体分布无显著差异
应保证有较大的样本数
案例:7-5 p194使用寿命
•第七章SPSS非参数检验
二、SPSS两独立样本非参数检验
3.游程?检验(Wald-Wolfowitz runs)
一、SPSS单样本非参数检验
(二)总体分布的二项分布检验 (1)目的
通过样本数据检验样本来自的总体是否服从指定的 概率p的二项分布根据 (2)原假设 样本来自的总体与指定的二项分布无显著差异。 (3)案例7-2 p187 产品合格率
•第七章SPSS非参数检验
一、SPSS单样本非参数检验
(三)K-S检验 (1)目的
•第七章SPSS非参数检验
五、SPSS多配对样本非参数检验
SPSS第讲非参数检验(共72张PPT)

SPSS应用
Kendall协同系数检验中会计算Friedman检验方 法,得到friedman统计量和相伴概率。如果相伴概
率小于显著性水平,可以认为这10个节目之间没有 显著差异,那么可以认为这5个评委判定标准不一 致,也就是判定结果不一致。
SPSS应用
3.多配对样本的Cochran Q检验
多配对样本的Cochran Q检验也是对多个互 相匹配样本总体分布是否存在显著性差异的统计 检验。不同的是多配对样本的Cochran Q检验所能 处理的数据是二值的(0和1)。其零假设是:样 本来自的多配对总体分布无显著差异。
SPSS应用
单样本K-S检验可以将一个变量的实际频数分
布与正态分布(Normal)、均匀分布(Uniform)、
泊松分布(Poisson)、指数(Exponential)分 布进行比较。其零假设H0为样本来自的总体与指定
的理论分布无显著差异。
SPSS应用
6.2 两配对样本非参数检验
6.2.1 统计学上的定义和计算公式
SPSS应用
两配对样本非参数检验的前提要求两个样本 应是配对的。在应用领域中,主要的配对资料包 括:具有年龄、性别、体重、病况等非处理因素 相同或相似者。首先两个样本的观察数目相同, 其次两样本的观察值顺序不能随意改变。
SPSS应用
SPSS中有以下3种两配对样本非参数检验方 法。
SPSS应用
1验.两配对样本的McNemar变化显著性检
SPSS应用
2.两配对样本的符号(Sign)检验
当两配对样本的观察值不是二值数据时,无法 利用前面一种检验方法,这时可以采用两配对样本
的符号(Sign)检验方法。其零假设为:样本来
自的两配对样本总体的分布无显著差异。
第7章 SPSS非参数检验

两独立样本的游程检验中,游程数依赖于 变量的秩。将两组样本混合后按升序排列, 然后按对应的组标记值序列计算游程数。 7.2.4极端反应检验(Moses 极限反应) 原假设:两独立样本来自的两个总体的分 布无显著差异。 将一组样本作为控制样本,另一组样本作 为实验样本,以控制样本作为对照,检验 实验样本相对于控制样本是否出现了极端 反应。
7.1.2二项分布检验 二项分布检验是通过样本数据检验样本来自的总 体是否服从指定概率为p的二项分布。 原假设:样本来自的总体与指定的二项分布无显 著差异。 一、二项分布检验的基本思想 变量只有两个取值0和1,如果进行n次相同的实 验,则出现两类(0和1)的次数可以分别用离散 型随机变量X来描述,如果随机变量值X为1的概 率设为p,则随机变量X值为0的概率便等于1-p, 形成二项分布。
典型的卡方统计量:Pearson卡方:
0 e 2 ( f f 2 i i ) 0 f i 1 i k
式中,k为子集的个数; f i 为观察频数; f i e为期望频数;= npi
0
如果卡方值较大,则说明观测频数分布与期望频数分布 差距较大;反之,则说明观测频数与期望频数分布较接 近。如果卡方的概率值小于显著性水平,则拒绝原假设, 认为样本来自的总体分布与期望分布存在显著性差异; 反之,则接受原假设,认为样本来自的总体分布与期望 分布无显著性差异。
2.选择待检验变量到[检验变量列表]框中 3.在[割点]框中确定计算游程的分界值。其中,中位数表 示以样本中位数为分界值;众数表示以样本众数为分界值; 均值表示以样本均值为分界值;设定表示以用户输入的值 为分界值,小于该值的为一组,大于等于该值的为另一组。
7.2 两独立样本的非参数检验
SPSS软件应用-第七章非参数检验

病例号 照射前 照射后
1
1.0 0.0
2
1.0 18.0
3
0.0 6.7
4
1.2 0.0
5
1.0 29.0
6
1.0 17.0
7
1.0 5.0
8
1.0 6.0
9
1.0 10.0
10
4.0
7.0
Questions &
Answers
饲料
肝脏内铁含量(μg)
A 2.23 1.14 2.63 1.00 1.35
B 5.59 0.96 6.96 1.23 1.61
C 4.50 3.92 10.33 8.23 2.07
练习2
10例食管癌病人在某种药物保护下,做 6000γ的放射照射,观察血中淋巴细胞 畸变百分数,结果如下表。问照射前后 血中淋巴细胞畸变百分数有无差别。
7.1 拟合优度检验(1-Sample K-S Test)
以例7-1数据(数据文件名“diameter_sub.sav”)为例,试检验变量 “trueap_mean”(矢状面管径)是否服从正态分布。
7.1 拟合优度检验(1-Sample K-S Test)
7.1 拟合优度检验(1-Sample K-S Test)
第二步:Analyze Nonparametric Test Legacy Dialogs 2 Related Samples Test
7.5 两个相关样本的非参数检验
7.5 两个相关样本的非参数检验
7.5 两个相关样本的非参数检验
7.6 多个相关样本的非参数检验
牙齿 普通 RPI Y型 编号 卡环 卡环 卡环
7.2 样本率与总体率比较的二项分布检验(Binomial)
7、spss第七章 非参数检验

左表是频数分布情况表,第 二列为实际观察值出现次数, 第三列为理论上每天应出现 的次数,第四列为残差 左表是计算的卡方统计量 及对应的相伴概率值,由 于Sig.=0.014<0.05。说明 应拒绝每个工作日出现的 次品率相等的原假设。即 次品数出现是不均匀的。 10
工作日 Chi-Square df Asymp. Sig. 12.556a 4 .014
双尾检验的相伴概率为0.151,大于0.05,说明两种汽油无 显著性差异。
16
西南财经大学出版社
SPSS16.0与统计数据分析
主要内容
7.0 非参数检验概述 7.1单样本的非参数检验 7.2 两独立样本的非参数检验 7.3 多独立样本的非参数检验 7.4 两相关样本的非参数检验 7.5 多相关样本的非参数检验
17
西南财经大学出版社
SPSS16.0与统计数据分析
7.2 两独立样本的非参数检验
9
西南财经大学出版社
SPSS16.0与统计数据分析
7.1 单样本的非参数检验
7.1.1卡方检验 第5步 主要结果及分析
1 2 3 4 5 Total Observed N 25 15 8 16 26 90 Expected N 18.0 18.0 18.0 18.0 18.0 Residual 7.0 -3.0 -10.0 -2.0 8.0
a. 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 18.0.
西南财经大学出版社
SPSS16.0与统计数据分析
7.1 单样本的非参数检验
7.1.2 二项分布检验
第七章 SPSS的非参数检验

7.2 两独立样本的非参数检验
定义:两独立样本的非参数检验是在对总 体分布不很了解的情况下,通过分析样本数据, 推断样本来自的两个独立总体分布是否存在显 著差异。一般用来对两个独立样本的均数、中 位数、离散趋势、偏度等进行差异比较检验。
两个样本是否独立,主要看在一个总体 中抽取样本对另外一个总体中抽取样本有无影 响。如果没有影响,则可以认为两个总体是独 立的。 SPSS提供了4种两独立样本的非参数检验 方法。
问题
• 为检验某耐压设备在某段时间内工作是否 持续正常,测试并记录下该时间段内各个 时间点上的设备耐压的数据。如果耐压数 据的变动是随机的,可认为该设备工作一 直正常,否则认为该设备有不能正常工作 的现象。
7.1.3 SPSS单样本变量值随机性检验 7.1.3.1 变量值随机性检验的基本思想
定义:单样本变量值的随机性检验是对某 变量的取值出现是否随机进行检验,也称为游 程检验(Run过程)。
问28次投掷硬币出现正反两面的变量值序列为 1011011010011000101010000111,游程数为多少?
• 利用游程数构造检验统计量: n 设 n1 为出现1的个数, 2 为出现0的个数,当 n1 , n2 2n n 较大时,游程的抽样分布的均值为 n n ,方差为
1 2 1 2
定义:单样本K-S检验是以两位前苏联数 学家Kolmogorov和Smirnov命名的,也是一种 拟合优度的非参数检验方法。单样本K-S检验 是利用样本数据推断样本来自的总体是否与某 一理论分布有显著差异,适用于探索连续型随 机变量的分布。
单样本K-S检验可以将一个变量的实际频 数分布与正态分布(Normal)、均匀分布 (Uniform)、指数(Exponential)分布、 泊松分布(Poisson)进行比较。其零假设H0为 样本来自的总体与指定的理论分布无显著差异。
SPSS第七章SPSS的非参数检验

是否合格
a. Altern ativ e hy po thesis states that the prop ortion of cases in the first group < .9.
结果说明
上表表明,一级品的样本率为0.8,检验 一级品概率是0.9,由于是小样本,自动 计算精确概率,发现23个样本中一级品率 小于0.9的概率为0.193; 如果确定显著性水平为0.05,则检验不显 著,所以认为一级品率与0.9没有显著差 异;
Change1
Extract... Options...
Upper
Remove
7.1.1.2 卡方检验的基本操作(续)
将待检验的变量选入Test Variable 框中; 在 Expected Range 框中确定参与分析的样本 范围,其中 Get from data 表示所有样本都参 与分析,Use Specified Range 表示只有在取 值范围内的样本才参与分析; 在Expected 框中给出期望的各个p值,其中 All Categories equal 表示所有子集的p值相同, 也可在Value框中输入p值,可以添加、删除和 修改;
Nonparametric Tests
1-Sample K-S
Analyze菜单
7.1.3.2 基本操作(续)
Test Variable list:
OK
Extract...
>
Paste
CheckBox1
Reset Cancle Help
Test Distribution
Normal CheckBox1
Extract... Options...
7.1.1.2 二项分布检验的基本操作(续)
《SPSS数据分析教程》――非参数检验PPT课件

卡方检验的原理(1)
卡方检验的原假设是:
H0样本来自的总体的分布与假设的分布(又称期望分 布或者理论分布)无显著差异。
适用于探索连续型随机变量的分布。 K-S检验的基本思想:根据样本数据和用户的指定构
造理论分布,查看分布表得到相应的理论累计概率分 布函数;利用样本数据计算各样本点的累计概率,得 到经验累计概率分布函数;计算这两个函数在相同变 量点上的差值,得到差值序列。K-S检验主要对差值 序列进行研究。 SPSS的K-S检验可以检验四种理论分布:正态分布、 均匀分布、泊松分布和指数分布。
研究定类变量和定序变量之间的关系。
SPSS非参数检验
新的用户界面统一了方法的选择,根据样本的 个数来组织方法。
非参数统计过程仍然保留了SPSS18以前的非参 数检验的界面,称为“旧对话框”,它的输出 仍然为传统的表格方式展现检验结果。同时可 以选择输出描述性统计量和四分位数,而新用 户界面下没有。
6.3独立样本非参数检验
独立样本非参数检验使用一个或多个非参数检 验方法来识别两个或更多个组间的差别。对于 两个分布未知的总体,或者两个总体的分布不 服从正态时,我们无法应用T检验来比较两个 总体。可以转而应用非参数的方法来比较两个 总体的中心位置的差异。独立样本是指样本来 自的总体相互独立。
独立样本包括两个独立样本或者两个以上的独立样本。 SPSS提供的独立样本非参数检验的方法有:
《SPSS数据分析教程》 ——非参数检验
整体概况
SPSS的非参数检验

– 理论依据
如果从一个随机变量X中随机抽取若干个观察样本, 这些观察样本落在X的k个互不相交的子集中的观察 频数服从一个多项分布,这个多项分布当k趋于无穷 时近似服从卡方分布。
卡方统计量
Pearson卡方:
( fi 0 − fi e )2 χ2 = ∑ ∼χ 2 (k − 1), fi 0 i =1
m − 1 n − 1 2 k − 1 k − 1 P ( R = 2k ) = , N n m − 1 n − 1 m − 1 n − 1 2 + 2 k − 1 k k k − 1 P( R = 2k + 1) = N n
7.3.1 曼-惠特尼 惠特尼U(Mann-Whitney U) 检验 惠特尼 • 用于对两总体分布的比较判断。 用于对两总体分布的比较判断。 • H0:两组独立样本来自的两总体分布无显著差异 • 基本步骤: 基本步骤:
– 将两组样本数据 1, X2,…, Xm)和(Y1, Y2,…, Yn) 混合并按升 将两组样本数据(X 和 幂排序,得到每个数据各自的秩R 幂排序,得到每个数据各自的秩 i。 – 记第一个样本观测值的秩的和为 X而第二个样本秩的和为 记第一个样本观测值的秩的和为W WY。对秩分别求平均,对两个平均秩的差距比较。如果相 对秩分别求平均,对两个平均秩的差距比较。 差甚远,则此时零假设可能是不成立的。 差甚远,则此时零假设可能是不成立的。 – 计算 1, X2,…, Xm)每个秩优先于 1, Y2,…, Yn) 每个秩的个 计算(X 每个秩优先于(Y 每个秩优先于 以及(Y 每个秩优先于(X 数U1,以及 1, Y2,…, Yn)每个秩优先于 1, X2,…, Xm)每个 每个秩优先于 每个 秩的个数U 比较U 如果相差较大, 秩的个数 2,比较 1和U2 。如果相差较大,则应怀疑零假 设的真实性。 设的真实性。 – 依据计算 依据计算Wilcoxon W统计量和曼 惠特尼 统计量。 统计量和曼-惠特尼 统计量。 统计量和曼 惠特尼U统计量
第七章-SPSS非参数检验

• WilcoxonW统计量:
若 mn,W 则ilcoW nxW oY n 若 mn,W 则ilcoW nxW oXn 若 mn,W 则ilcoW n为 xo第 n 一个变本 量值 值 W值 的 所在样
• 曼-U惠特W尼1统k(k计1量) U为: 2 WWilcoxoWn,kW对应样本组的样本个数
(2)通过两组样本平均秩的研究实现推断
秩-变量值排序的名次,变量值有几个,对应的 秩便有几个。
(3)检验步骤
Ri
①将两组样本混合并升序排列,得每W 个X m 数据W Y n的
秩
U1
和②分别U 1对样UU2本③2 X计和算Y样的本秩X求优平于均样,本得Y平秩均的秩个数
和样本Y优于样本X秩的个数
④依据 和 计算WilcoxonW统计量和
②卡方统计量的p值>显著性水平,不拒绝原假设,多个独立 样本来自的总体的中位数不存在显著差异。
7.3.2多独立样本的Kruskal-Wallis检验
• 1.基本思想
(1)原假设:多个独立样本来自的多个总体的分布无显著差异。 (2)是两独立样本曼-惠特尼U检验的推广 (3)检验步骤
第七章
SPSS非参数检验
本章内容
• 7.1 单样本的非参数检验 • 7.2 两独立样本的非参数检验 • 7.3 多独立样本的非参数检验 • 7.4 两配对样本的非参数检验 • 7.5 多配对样本的非参数检验
非参数检验
• 非参数检验:
(1)在总体分布未知或知道甚少的情况下,利用 样本数据对总体分布形态等进行推断的方法。 (2)推断过程中不涉及有关总体分布的参数。
小样本下,H服从Hollander分布,大样本下,H近似服从正态分布
(4)决策: ①H统计量的p值<显著性水平,拒绝原假设,两独立样本来自的 总体分布存在显著差异 ②H统计量的p值>显著性水平,不拒绝原假设,两独立样本来自 的总体分布不存在显著差异
第七章--spss非参数估计

第七章非参数检验1、为分析不同年龄段人群对某商品满意程度的异同,进行随机调查收集到以下数据:请选择恰当的非参数检验方法,以恰当形式组织上述数据,分析不同年龄段人群对该商品满意程度的分布状况是否一致。
原假设:不同年龄段人群对该商品满意程度的分布无显著差异。
步骤:建立SPSS数据数据→加权个案→对频次进行加权→分析→非参数检验→旧对话框→两个独立样本→把年龄段导入分组变量、满意程度导入检验变量列表→确定表7-1检验统计量a满意程度最极端差别绝对值.121正.121负.000Kolmogorov-Smirnov Z 2.217渐近显著性(双侧).000a. 分组变量: 年龄段分析:从上表中可以看出,在显著水平为0.05下得到的sig值均为0.00<0.05,故拒绝原假设,即认为不同年龄段人群对该商品满意程度的分布存在显著差异。
2、利用习题二第6题数据,选择恰当的非参数检验方法,分析本次存款金额的总体分布与正态分布是否存在显著差异。
原假设:本次存款金额的总体分布与正态分布无显著差异步骤:分析→非参数检验→旧对话框→单个独立样本K-S检验→本次存款金额导入检验变量列表→正太分布检验→确定表7-2单样本 Kolmogorov-Smirnov 检验本次存款金额N282正态参数a,b均值4738.09标准差10945.569最极端差别绝对值.333正.292负-.333Kolmogorov-Smirnov Z 5.585渐近显著性(双侧).000a. 检验分布为正态分布。
b. 根据数据计算得到。
分析:如上表,在显著水平为0.05下得到的sig值均为0.00<0.05,故拒绝原假设,认为本次存款金额的分布与正太分布有显著差异。
3、利用习题二第6题数据,选择恰当的非参数检验方法,分析不同常住地人群本次存款金额的总体分布是否存在显著差异。
原假设:不同常住地人群本次存款金额的总体分布无显著差异。
步骤:分析→非参数检验→旧对话框→2个独立样本→常住地导入分组变量、本次存款金额导入检验变量列表→确定表7-3检验统计量a本次存款种类最极端差别绝对值.280正.000负-.280Kolmogorov-Smirnov Z 2.138渐近显著性(双侧).000a. 分组变量: 常住地分析:从图中可以看出,在显著水平为0.05下得到的sig值均为0.00<0.05,故拒绝原假设,认为不同常住地人群本次存款金额的总体分布存在显著差异。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章非参数检验
1、为分析不同年龄段人群对某商品满意程度的异同,进行随机调查收集到以下数据:请选择恰当的非参数检验方法,以恰当形式组织上述数据,分析不同年龄段人群对该商品满意程度的分布状况是否一致。
原假设:不同年龄段人群对该商品满意程度的分布无显著差异。
步骤:建立SPSS数据数据→加权个案→对频次进行加权→分析→非参数检验→旧对话框→两个独立样本→把年龄段导入分组变量、满意程度导入检验变量列表→确定
表7-1
检验统计量a
满意程度
最极端差别绝对值.121
正.121
负.000
Kolmogorov-Smirnov Z 2.217
渐近显著性(双侧) .000
a. 分组变量: 年龄段
分析:从上表中可以看出,在显著水平为0.05下得到的sig值均为0.00<0.05,故拒绝原假设,即认为不同年龄段人群对该商品满意程度的分布存在显著差异。
2、利用习题二第6题数据,选择恰当的非参数检验方法,分析本次存款金额的总体分布与正态分布是否存在显著差异。
原假设:本次存款金额的总体分布与正态分布无显著差异
步骤:分析→非参数检验→旧对话框→单个独立样本K-S检验→本次存款金额导入检验变量列表→正太分布检验→确定
表7-2
单样本 Kolmogorov-Smirnov 检验
本次存款金额
N 282
正态参数a,b均值4738.09
标准差10945.569
最极端差别绝对值.333
正.292
负-.333
Kolmogorov-Smirnov Z 5.585
渐近显著性(双侧) .000
a. 检验分布为正态分布。
b. 根据数据计算得到。
分析:如上表,在显著水平为0.05下得到的sig值均为0.00<0.05,故拒绝原假设,认为本次存款金额的分布与正太分布有显著差异。
3、利用习题二第6题数据,选择恰当的非参数检验方法,分析不同常住地人群本次存款金
额的总体分布是否存在显著差异。
原假设:不同常住地人群本次存款金额的总体分布无显著差异。
步骤:分析→非参数检验→旧对话框→2个独立样本→常住地导入分组变量、本次存款金额导入检验变量列表→确定
表7-3
检验统计量a
本次存款种类
最极端差别绝对值.280
正.000
负-.280
Kolmogorov-Smirnov Z 2.138
渐近显著性(双侧) .000
a. 分组变量: 常住地
分析:从图中可以看出,在显著水平为0.05下得到的sig值均为0.00<0.05,故拒绝原假设,认为不同常住地人群本次存款金额的总体分布存在显著差异。
4、利用习题二第6题数据,选择恰当的非参数检验方法,分析不同收入人群本次存款金额的总体分布是否存在显著差异。
原假设:不同收入人群本次存款金额的总体分布无显著差异。
步骤:分析→非参数检验→旧对话框→2个独立样本→不同收入人群导入分组变量、本次存款金额导入检验变量列表→确定
表7-4
检验统计量a
本次存款金额
最极端差别绝对值.361
正.006
负-.361
Kolmogorov-Smirnov Z 2.238
渐近显著性(双侧) .000
a. 分组变量: 月收入水平
分析:在图中可以看出,在显著水平为0.05下得到的sig值均为0.00<0.05,所以拒绝原假设,即认为不同收入人群本次存款金额的总体分布存在显著差异。
5、选择恰当的非参数检验方法,对“裁判打分.sav”数据随机选取10%的样本,并以恰当形式重新组织数据后,分析不同国家裁判对运动员的打分标准是否一致。
原假设:不同国家裁判对运动员的打分标准无显著差异
步骤:数据→选择个案→随机个案样本→样本→大约10%所有个案→继续→确定
表7-5
中国38 8.0421 .67649 7.10 9.50
美国38 8.8658 1.00143 7.00 10.00
俄罗斯38 8.0737 .92113 7.00 9.80
步骤:挑选初选中的数据→国家和评分组建新的SPSS数据→分析→非参数检验→多个独立样本检验→把评分导入检验量→把国家导入分组→确定
表7-6
秩
国家N 秩均值
评分意大利38 134.26
韩国38 166.03
罗马尼亚38 97.22
法国38 171.45
中国38 96.54
美国37 164.86
俄罗斯37 97.05
总数264
表7-7
检验统计量a
N 38
卡方155.226
df 6
渐近显著性.000
a. Friedman 检验
表7-8
Jonckheere-Terpstra 检验a
评分
国家中的水平数7
N 264
J-T 观察统计量13691.500
J-T 统计量均值14934.500
J-T 统计量的标准差708.825
标准J-T 统计量-1.754
渐近显著性(双侧) .079
a. 分组变量: 国家
表7-9
频率
国家
意大利韩国罗马尼亚法国中国美国俄罗斯评分> 中值20 25 11 28 7 25 12 <= 中值18 13 27 10 31 12 25 表7-10
检验统计量b
评分
N 264
中值8.5000
卡方43.248a
df 6
渐近显著性.000
a. 0 个单元 (.0%) 具有小于 5 的期望频率。
单元最小期望频率为 17.9。
b. 分组变量: 国家
分析:根据上表,在秩检验和中值检验中,在显著水平为0.05下得到的sig值均为0.00,小于0.05,拒绝原假设,认为不同国家对其评分有显著影响。
但是在JTerpstra 检验中在显著水平为0.05下得到的sig值均为0.079,大于0.05,接受原假设,不同国家对其评分不具有显著影响。
6、为分析大众对牛奶品牌是否具有偏好性,随机挑选超市了收集其周一至周六各天三种品牌牛奶的日销售额数据,如下表:请选择恰当的非参数检验方法,以恰当形式组织上述数据进行分析,并说明分析结论。
原假设:日期与品牌的分布无显著差异
步骤:建立spss数据→加权个案→销售额进行加权→分析→非参数检验→两个独立样本检验→确定
表7-11::
秩
星期N 秩均值
品牌 1 21 62.76
2 2
3 83.80
3 31 72.63
4 32 77.83
5 2
6 81.27
6 16 67.16
总数149
表7-12
检验统计量a,b
品牌
卡方 4.469
df 5
渐近显著性.484
a. Kruskal Wallis 检验
检验统计量a,b
品牌
卡方 4.469
df 5
渐近显著性.484
a. Kruskal Wallis 检验
b. 分组变量: 星期
表7-13
频率
星期
1 2 3 4 5 6 7
品牌> 中值 4 8 10 10 9 3 0 <= 中值17 15 21 22 17 13 0
表7-14
检验统计量b
品牌
N 149
中值 2.00
卡方 2.787a
df 5
渐近显著性.733
表7-15
Jonckheere-Terpstra 检验a
品牌
星期中的水平数 6
N 149
J-T 观察统计量4706.000
J-T 统计量均值4578.500
J-T 统计量的标准差281.561
标准J-T 统计量.453
渐近显著性(双侧) .651
a. 分组变量: 星期
分析:根据上表7-11到7-15,在显著水平为0.05下得到的sig值均大于0.05,故接受原假设,认为日期与品牌的分布无显著差异。