SPSS第七章SPSS的非参数检验
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
7.1.2.3 二项分布检验应用举例
储户对未来收入看法检验,为检验储户是 对未来的收入是持乐观态度还是悲观态度, 我们将检验用户持乐观态度的概率是否为 0.6,这里采用二项分布检验法,具体结 果如下图:
Binomial T est Category Group 1 <= 1 Group 2 > 1 Total N 77 236 313 O bserved Prop. .2 .8 1.0 Test P rop. .6 Asymp. Sig. (1-tailed) .000a,b
7.1.3 单样本的K-S检验
可以解决的问题:推断样本来自的总体是否 服从一个理论分布,是一种拟合优度检验; 基本思想:根据数据,推断总体分布是否服 从某一理想分布,推断两者是否显著差异
正态分布、均匀分布、指数分布、泊松分布等
适用于探索连续型随机变量的分布
7.1.3.2 单样本K-S检验的基本操作
7.1.2.3 二项分布检验应用举例
产品合格率检验,为检验产品合格率是否 大于90%,抽出25个样品检验并得到检测 数据,其中1表示一级品,0表示非一级品, 这里采用二项分布检验法,具体结果如下 图:
Binomial T est Category Group 1 合格 Group 2 不合格 Total N 19 4 23 O bserv ed Prop. .8 .2 1.0 Test P rop. .9 Exact Sig . (1-tailed) .193a
7.1.1.3 总体卡方检验应用举例
为研究心脏病人猝死人数与日期的关系, 收集到168个观察数据;周一到周日死亡 人数分别是55 23 18 11 26 20 15,现用 这些样本,推断猝死人数在一周的分布是 否是2.8:1:1:1:1:1:1,采用总体分布卡方 检验,结果如下图:
死亡人数 11.00 15.00 18.00 20.00 23.00 26.00 55.00 Total O bser v ed N 11 15 18 20 23 26 55 168 Expected N 19.1 19.1 19.1 19.1 19.1 19.1 53.5 Residual -8.1 -4.1 -1.1 .9 3.9 6.9 1.5
7.1.1 总体分布的卡方检验
可以解决的问题:心脏病猝死的人数在一周内的 分布比例是否吻合2.8:1:1:1:1:1:1; 基本思想:根据数据,推断总体分布与期望分布 是否存在显著差异,依据是如果总体分布与期望 分布没有显著差异,那么实际频数该与期望频数 没有显著的差异,如果卡方值较大,说明实际频 数与期望频数差异较大,从而否定两者不存在显 著差异; 适用于对有多项分类值的总体分布(定类、定序 变量)的分析
储户存储金额总体的分布检验,我们将检 验储蓄金额的分布是否与正态分布显著差 异,这里采用K-S检验法,具体结果如下 图:
One-Sample Kolmogorov -Smir nov Test 存(取)款 金额 313 2473.78 6760.868 .357 .320 -.357 6.321 .000
N a,b No rmal P ar ameters Most Extr eme Differ ences Kolmogor ov -Smirno v Z Asy mp. Sig. (2- tailed)
Mean Std. Dev iation Ab solute Positiv e Negativ e
结果说明
周一到周日期望死亡频数为 53.5 19.1 19.1 19.1 19.1 19.1 19.1,实际观测频 数与期望频数差异为1.5 3.9 -1.1 -8.1 6.9 0.9 -1.1; 经计算卡方值为7.757,对应的p值为 0.256,不显著,所以认为总体分布与期 望分布没有显著差异;
7.0 非参数方法概述
统计:描述统计,推断统计 推断统计两大方法:参数估计,假设检验 假设检验:参数检验,非参数检验(假设检验) 非参数检验针对总体分布未知情况下,利用样 本对总体分布形态进行推断,从而得出尽可能 多的信息 因为不涉及总体分布的参数,因而被命名为 “非参数检验”
7.0 非参数检验概述
Extract... Options...
7.1.1.2 二项分布检验的基本操作(续)
将待检验的变量选入Test Variable 框中; 在 Define Dichotomy 框中指定如何分类,如 果检验变量是二值变量选择 Get from data , Cut Point框中输入数可以将非二值变量分成两 组; 在Test框中给出待检验的p值;
7.1.2 二项分布检验
可以解决的问题:取值是二值的,通常用0和1代 表这两个值,多次实验形成二项分布; 基本思想:根据数据,推断总体分布是否服从指 定的概率值为p的二项分布,推断两者是否显著差 异,可以分为大样本和小样本事件,大样本用估 计的方法,而小样本可以精确计算; 适用于二值变量的分析
7.1.2.3 二项分布检验应用举例
周岁儿童身高总体的分布检验,利用搜集 到的21个儿童的数据样本检验儿童的身高 是否服从正态分布,结果如下图:
பைடு நூலகம்
One-Sample Kolmogorov -Smir nov Test 周岁儿童 的身高 21 71.8571 3.97851 .204 .204 -.119 .936 .344
非参数检验主要涉及以下几个方面
单样本非参数检验 两独立样本非参数检验 两配对样本非参数检验 多独立样本非参数检验 多配对样本非参数检验
注意对比参数检验章节的概念进行学习
7.1 单样本非参数检验
拿到一批数据,总是希望得到数据总体的 分布情况,这时可以通过绘制直方图,PP图,Q-Q图的方式来了解总体的大概分 布,当然也可以用非参数的方法来实现; SPSS单样本非参数检验就是对单个总体 的分布形态进行推断的方法,包括卡方检 验、二项分布检验、K-S检验以及变量值 随机性检验;
7.1.1.2 卡方检验的基本操作
1.
Analyze菜单 Nonparametric Tests
Chi-Square
7.1.1.2 基本操作(续)
Dependent lists:
OK
>
Paste Reset
Expected Ranges
Expected Values
Cancle Help
Add
Lower
Change1
Extract... Options...
Upper
Remove
7.1.1.2 卡方检验的基本操作(续)
将待检验的变量选入Test Variable 框中; 在 Expected Range 框中确定参与分析的样本 范围,其中 Get from data 表示所有样本都参 与分析,Use Specified Range 表示只有在取 值范围内的样本才参与分析; 在Expected 框中给出期望的各个p值,其中 All Categories equal 表示所有子集的p值相同, 也可在Value框中输入p值,可以添加、删除和 修改;
a. Test d istribution is N ormal. b. Calculated fr om data.
结果说明
上表表明,储户一次存款金额的总体分布 与正态分布是有显著差异的,p值接近0; 可以对应看PP图和QQ图,可以更加直观 看到
Normal P-P Plot of 存(取)款金额
N a,b No rmal P ar ameters Most Extr eme Differ ences Kolmogor ov -Smirno v Z Asy mp. Sig. (2- tailed)
Mean Std. Dev iation Ab solute Positiv e Negativ e
Nonparametric Tests
1-Sample K-S
Analyze菜单
7.1.3.2 基本操作(续)
Test Variable list:
OK
Extract...
>
Paste
CheckBox1
Reset Cancle Help
Test Distribution
Normal CheckBox1
a. Test d istribution is N ormal. b. Calculated fr om data.
结果说明
上表表明,数据的均值为71.854,概率p 值为0.344; 如果确定显著性水平为0.05,则检验不显 著,所以认为儿童身高的分布和正态分布 没有显著差异;
7.1.2.3 K-S检验应用举例
Uniform
Poisson
Exponential
Options...
7.1.1.2 K-S检验的基本操作(续)
将待检验的变量选入Test Variable 框中; 在 Test Distribution 框中选择理论分布, Normal是正态分布,Uniform是均匀分布, Poisson是泊松分布,Exponential是指数分布
Te st Statistics
a Ch i-Square df Asy mp. Sig.
死亡人数 7.757 6 .256
a. 0 cells (.0% ) h av e expected fr equencies less than 5. The min imum expected cell fr equ ency is 19.1.
是否合格
a. Altern ativ e hy po thesis states that the prop ortion of cases in the first group < .9.
结果说明
上表表明,一级品的样本率为0.8,检验 一级品概率是0.9,由于是小样本,自动 计算精确概率,发现23个样本中一级品率 小于0.9的概率为0.193; 如果确定显著性水平为0.05,则检验不显 著,所以认为一级品率与0.9没有显著差 异;
7.1.2.2 二项分布检验的基本操作
1.
Analyze菜单 Nonparametric Tests
Binomial
7.1.2.2 基本操作(续)
Test Variable list:
OK
>
Paste Reset
Define Dichotomy
Cancle Help
Test Proportions
根据数据推断总体分布与期望分布是否存在显著差异依据是如果总体分布与期望分布没有显著差异那么实际频数该与期望频数没有显著的差异如果卡方值较大说明实际频数与期望频数差异较大从而否定两者不存在显著差异
SPSS的非参数检验
主要内容:
概述主要介绍非参数方法的思想和用途 单样本非参数检验介绍最基本的非参数检验方法 两独立样本的非参数检验介绍独立非参数检验方 法 多独立样本的非参数检验介绍对应多独立非参数 检验的方法【略讲】 两配对样本和多配对样本的非参数检验介绍相应 的方法
.75
Observed Cum Prob
Observed Cum Prob
Normal Q-Q Plot of 存(取)款金额
30000
Detrended Normal Q-Q Plot of 存(取)款金额
60000 50000
20000 40000
10000
30000
Deviation from Normal
1.00 .4 .3 .75 .2 .1 .50 0.0
Detrended Normal P-P Plot of 存(取)款金额
Deviation from Normal
-.1 -.2 -.3 -.4 1.00 -.2 0.0 .2 .4 .6 .8 1.0 1.2
.25
0.00 0.00 .25 .50
未来收入情况
a. Altern ative hypo thesis states that the propo rtion of cases in the first group < .6. b. Based on Z Approximation.
结果说明
上表表明,持乐观态度的储户77人,比例 为0.2,持保守和悲观态度的储户为236, 比例是0.8,由于是大样本,采用近似计 算法,得到Z值的检验p值为0.000; 如果确定显著性水平为0.05,则检验显著, 所以乐观储户比例显著小于0.6;