SPSS第七章 非参数检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Normal CheckBox1
Uniform
Poisson
Exponential
Options...
7.1.1.2 K-S检验的基本操作(续)

将待检验的变量选入Test Variable 框中; 在 Test Distribution 框中选择理论分布, Normal是正态分布,Uniform是均匀分布, Poisson是泊松分布,Exponential是指数分布
.25
0.00 0.00 .25 .50
.75
Observed Cum Prob
Observed Cum Prob
Normal Q-Q Plot of 存(取)款金额
30000
Detrended Normal Q-Q Plot of 存(取)款金额
60000 50000
20000 40000
10000
N a,b Normal Parameters Most Extreme Differences Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed)
Mean Std. Deviation Absolute Positive Negative
a. Test distribution is Normal. b. Calculated from data.
7.1.1.2 卡方检验的基本操作
1.
Analyze菜单 Nonparametric Tests
Chi-Square
如下窗口
7.1.1.2 基本操作(续)
Dependent lists:
OK
>
Paste Reset
Expected Ranges
Expected Values
Cancle Help

7.1.1 总体分布的卡方检验


可以解决的问题:心脏病猝死的人数在一周 内的分布比例是否吻合2.8:1:1:1:1:1:1; 基本思想:根据数据,推断总体分布与期望 分布是否存在显著差异,依据是如果总体分 布与期望分布没有显著差异,那么实际频数 该与期望频数没有显著的差异,如果卡方值 较大,说明实际频数与期望频数差异较大, 从而否定两者不存在显著差异;
第7章 SPSS的非参数检验
制作人:夏怡凡
主要内容:




概述主要介绍非参数方法的思想和用途; 单样本非参数检验介绍许多最基本的非参数检验 方法; 两独立样本的非参数检验介绍独立非参数检验方 法; 多独立样本的非参数检验介绍对应多独立非参数 检验的方法; 两配对样本和多配对样本的非参数检验介绍相应 的方法
7.1.2.2 单样本K-S检验的基本操作
1.
Analyze菜单 Nonparametric Tests
1-Sample K-S
如下窗口
7.1.3.2 基本操作(续)
Test Variable list:
OK
Extract...
>
Paste
CheckBox1
Reset Cancle Help
Test Distribution
7.1.1.2 二项分布检验的基本操作(续)


将待检验的变量选入Test Variable 框中; 在 Define Dichotomy 框中指定如何分类,如 果检验变量是二值变量选择 Get from data , Cut Point框中输入数可以将非二值变量分成两 组; 在Test框中给出待检验的p值;
单样本非参数检验; 两独立样本非参数检验; 两配对样本非参数检验; 多独立来自百度文库本非参数检验; 多配对样本非参数检验;


注意对比参数检验章节的概念进行学习;
7.1 单样本非参数检验
拿到一批数据,总是希望得到数据总体的 分布情况,这时可以通过绘制直方图,PP图,Q-Q图的方式来了解总体的大概分 布,当然也可以用非参数的方法来实现; SPSS单样本非参数检验就是对单个总体 的分布形态进行推断的方法,包括卡方检 验、二项分布检验、K-S检验以及变量值 随机性检验;
未 来收 入 情 况
Group 1 Group 2 Total
a. Alternative hypothesis states that the proportion of cases in the first group < .6. b. Based on Z Approximation.
结果说明
30000
Deviation from Normal
20000
0
10000
-10000
0 -10000 80000 100000 -20000 0 20000 40000 60000 80000 100000
-20000 -20000 0 20000 40000
60000

7.1.2 二项分布检验


可以解决的问题:取值是二值的,通常用0 和1代表这两个值,多次实验形成二项分布; 基本思想:根据数据,推断总体分布是否服 从指定的概率值为p的二项分布,推断两者 是否显著差异,可以分为大样本和小样本事 件,大样本用估计的方法,而小样本可以精 确计算;
7.1.2.2 二项分布检验的基本操作
7.1.1.3 总体卡方检验应用举例

为研究心脏病人猝死人数与日期的关系, 收集到168个观察数据;周一到周日死亡 人数分别是55 23 18 11 26 20 15,现用 这些样本,推断猝死人数在一周的分布是 否是2.8:1:1:1:1:1:1,采用总体分布卡方 检验,结果如下图:
死亡 人数 11.00 15.00 18.00 20.00 23.00 26.00 55.00 Total Observed N 11 15 18 20 23 26 55 168 Expected N 19.1 19.1 19.1 19.1 19.1 19.1 53.5 Residual -8.1 -4.1 -1.1 .9 3.9 6.9 1.5
Test Statistics Chi-Squarea df Asymp. Sig. 死 亡 人数 7.757 6 .256
a. 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 19.1.
7.1.2.3 二项分布检验应用举例

周岁儿童身高总体的分布检验,利用搜集 到的21个儿童的数据样本检验儿童的身高 是否服从正态分布,结果如下图:
One-Sam ple Kolmogorov -Smirnov Test 周 岁儿 童 的 身高 21 71.8571 3.97851 .204 .204 -.119 .936 .344
7.1.2.3 二项分布检验应用举例

产品合格率检验,为检验产品合格率是否 大于90%,抽出25个样品检验并得到检测 数据,其中1表示一级品,0表示非一级品, 这里采用二项分布检验法,具体结果如下 图:
Binomial Test Category 合格 不合格 N 19 4 23 Observed Prop. .8 .2 1.0 Test Prop. .9 Exact Sig. (1-tailed) .193a
Mean Std. Deviation Absolute Positive Negative
a. Test distribution is Normal. b. Calculated from data.
结果说明
上表表明,储户一次存款金额的总体分布 与正态分布是有显著差异的,p值接近0; 可以对应看PP图和QQ图,可以更加直观 看到
Add
Lower
Change1
Extract... Options...
Upper
Remove
7.1.1.2 卡方检验的基本操作(续)


将待检验的变量选入Test Variable 框中; 在 Expected Range 框中确定参与分析的样本 范围,其中 Get from data 表示所有样本都参 与分析,Use Specified Range 表示只有在取 值范围内的样本才参与分析; 在Expected 框中给出期望的各个p值,其中 All Categories equal 表示所有子集的p值相同, 也可在Value框中输入p值,可以添加、删除和 修改;
1.
Analyze菜单 Nonparametric Tests
Binomial
如下窗口
7.1.2.2 基本操作(续)
Test Variable list:
OK
>
Paste Reset
Define Dichotomy
Cancle Help
Test Proportions
Extract... Options...

Normal P-P Plot of 存(取)款金额
1.00 .4 .3 .75 .2 .1 .50 0.0
Detrended Normal P-P Plot of 存(取)款金额
Deviation from Normal
-.1 -.2 -.3 -.4 1.00 -.2 0.0 .2 .4 .6 .8 1.0 1.2

7.1.2.3 二项分布检验应用举例

储户对未来收入看法检验,为检验储户是 对未来的收入是持乐观态度还是悲观态度, 我们将检验用户持乐观态度的概率是否为 0.6,这里采用二项分布检验法,具体结 果如下图:
Binomial Test Category <= 1 >1 N 77 236 313 Observed Prop. .2 .8 1.0 Test Prop. .6 Asymp. Sig. (1-tailed) .000a,b
7.0 非参数方法概述
非参数检验是统计检验的重要组成部分, 与参数检验共同组成统计推断的基本内容 非参数检验针对总体分布未知情况下,利 用样本对总体分布形态进行推断,从而得 出尽可能多的信息; 因为不涉及总体分布的参数,因而被命名 为“非参数检验”;

7.0 非参数检验概述

非参数检验主要涉及以下几个方面
结果说明
周一到周日期望死亡频数为 53.5 19.1 19.1 19.1 19.1 19.1 19.1,实际观测频 数与期望频数差异为1.5 3.9 -1.1 -8.1 6.9 0.9 -1.1; 经计算卡方值为7.757,对应的p值为 0.256,不显著,所以认为总体分布与期 望分布没有显著差异;
上表表明,持乐观态度的储户77人,比例 为0.2,持保守和悲观态度的储户为236, 比例是0.9,由于是大样本,采用近似计 算法,得到Z值的检验p值为0.000; 如果确定显著性水平为0.05,则检验显著, 所以乐观储户比例显著小于0.6;

7.1.3 单样本的K-S检验


可以解决的问题:推断样本来自的总体是否 服从一个理论分布,是一种拟合优度检验; 基本思想:根据数据,推断总体分布是否服 从正态分布,推断两者是否显著差异,
是 否 合格
Group 1 Group 2 Total
a. Alternative hypothesis states that the proportion of cases in the first group < .9.
结果说明
上表表明,一级品的样本率为0.8,检验 一级品概率是0.9,由于是小样本,自动 计算精确概率,发现23个样本中一级品率 小于0.9的概率为0.193; 如果确定显著性水平为0.05,则检验不显 著,所以认为一级品率与0.9没有显著差 异;
结果说明
上表表明,数据的均值为71.854,概率p 值为0.344; 如果确定显著性水平为0.05,则检验不显 著,所以认为儿童身高的分布和正态分布 没有显著差异;

7.1.2.3 K-S检验应用举例

储户存储金额总体的分布检验,我们将检 验储蓄金额的分布是否与正态分布显著差 异,这里采用K-S检验法,具体结果如下 图:
One-Sample Kolmogorov-Smirnov Test 存 (取 )款 金额 313 2473.78 6760.868 .357 .320 -.357 6.321 .000
N a,b Normal Parameters Most Extreme Differences Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed)
相关文档
最新文档