第6章 SPSS非参数检验讲解
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Step03:选择期望值 在【期望值】选项组中点选【Values】单选钮,以指定期望概率 值。接着在Values的文本框中分别输入0.8、0.05和0.15这三个 数值,并且单击【Add】按钮加以确定。
Step04:单击【确定】按钮,操作完成。
(1)频数表
SPSS的结果报告中列出了期望频数和实际频数。显然残差值 越小,说明实际频数与期望频数越接近。
Step04:指定检验概率值
在【检验比例】文本框中输入指定概率值“0.05”。
Step05:描述性统计量输出
单击【选项】按钮,弹出【选项】对话框。在【统计量】选 项组中勾选【描述性】和【四分位数】复选框,表示输出基本统 计量。再单击【继续】按钮,返回【二项式检验】对话框。
Step06:完成操作
应用
参数检验
非参数检验
配对样本数据
两个独立样本 多个独立样本 相关 随机性
t检验或者z检验
t检验或者z检验 方差分析(F检验) 线性相关 无可用的参数检验
符号检验 Wilcoxon检验 Wilcoxon检验 K-W检验 秩相关检验 游程检验
对正态总体的非 参数检验的效 率评价
0.63 0.95 0.95 0.95 0.91 没有可比较的基
Percentiles
Mea Std. Deviat Minimu Maximu
50th (Med
N
n
ion
m
m 25th
ian) 75th
灯泡
989.
寿 30
1
命
3
40.968
947
1084
962. 7 5
969.50
995.7 5
(2)二项分布检验表
首先根据断点“960”将原始数据划分为两部分:“Group 1” 和“Group 2”,它们各自的样本容量等于6和24,所占总体的比 例为20%和80%。由于这里要检验合格率是否等于95%,也就是 要检验“Group 1”组所占比例是否等于0.05。但根据单尾概率P 值(0.003)小于显著性水平 (0.05),可以判断这批样本的合 格率不等于95%,即这批产品没有合格。
3.软件使用方法
SPSS会自动计算出χ2统计量及对应的相伴概率P值。
Step01:打开主菜单
选择菜单栏中的【分析】 →【非参数检验】→【旧对话框】→ 【卡方】命令,弹出【卡方检验】对话框。
Step02:选择检验变量
在【卡方检验】对话框左侧的候选变量列表框中选择一个 或几个变量,将其添加至【检验变量列表】列表框中,表示需 要进行进行卡方检验的变量。 Step03:确定检验范围
(3)n次试验在相同条件下进行,且各个观察单位的观察结果相 互独立,即每个观察单位的观察结果不会影响到其他观察单位的 结果。
Step01:打开主菜单
选择菜单栏中的【分析】 →【非参数检验】→【旧对话框】→ 【二项式】命令 ,弹出【二项式检验】对话框。
Step02:选择检验变量 在【二项式检验】对话框左侧的候选变量列表框中选择一个
Category N Observed Prop. Test Prop. Asymp. Sig. (1-tailed)
灯 Group 1
泡
<= 960
6
0.20
0.05
寿 命
Group
2
> 960
24
.80
0.003
Total
30
1.00
6.4.1 游程检验的基本原理
1.方法概述
游程检验是一种利用游程数所作的单样本随机性的检验方 法,它可以用来判断观察值的顺序是否为随机。许多统计模型的 假设中都要求观察值都是独立的,也就是说,收集到的数据样本 的顺序是不相关的。如果样本顺序影响到统计结果,那么样本就 可能不是随机的,这将使研究者不能得出关于抽样总体的准确结 论。因此,研究者可以使用游程检验来检验数据的随机性。
Step05:选择计算精确概率
【Exact】按钮用于选择计算概率P值的方法。
Step06:其他选项选择
【选项】按钮用于指定输出内容和关于缺失值的处理方法。
Step07:单击【确定】按钮,结束操作,SPSS软件自动输出结果。
1. 实例内容
某灯泡厂生产的一种特制灯泡按照工艺技术标准的要求, 其合格灯泡的寿命必须大于960小时。通常在生产稳定的时候, 该厂的这种产品合格品率为95%,为检验产品质量,今从新生 产的一大批产品中随机抽查了30只灯泡,测得它们的寿命的数 据资料,试根据这些样品数据检验该批产品的合格率是否等于 95%。
最后,单击【确定】按钮,操作完成。
(1)基本统计量
SPSS首先输出了样本的描述性统计量表。这里共选择了30 个灯泡寿命样本作二项分布检验,灯泡的平均寿命等于989.13 小时,标准差等于40.968小时,灯泡寿命最小值等于947小时, 寿命最大值等于1084小时。同时其25%、50%和75%分位点等 于 962.75、969.50和996.75小时。
Chi-Square df Asymp. Sig.
Employment Category 3.492a 2 .174
6.3.1 二项分布检验的基本原理
1.方法概述
事件要服从二项分布,则应该具备下列基本的条件。
(1)各观察单位只能具有相互对立的一种结果。
(2)已知发生某一结果(阳性)的概率为π,其对立结果的概 率为1-π。
在【期望全距】选项组中可以确定检验值的范围,对应有 两个单选项。 Step04:选择期望值
在【期望值】选项组中可以指定期望值 ,对应有两个单选 项。
Step05:选择计算精确概率
单击【精确】按钮,弹出【精确检验】对话框,该对话框用于选 择计算概率P值的方法 。
Step06:其他选项选择 单击【选项】按钮,弹出【选项】对话框,该对话框用于指定输 出内容和关于缺失值的处理方法
Clerical Custodial Manager Total
Observed N 363 27
Expected N 379.2 23.7
Residual -16.2 3.3
84
71.1
12.9
474
(2)卡方检验表
具体包括统计量、自由度(df)和近似概率P值。可见,统 计量等于3.492,自由度等于2,对应的概率P值0.174大于显著性 水平0.05。因此接受零假设,认为目前三个职业的总体构成比仍 然是15%、5%和c 280%,人数的调动只是随机误差造成的,公司 人员结构没有显著性改变。
SPSS 中进行非参数检验由【分析】菜单中的【非参数检验】
菜单项导出。其中包括以下命令。 ● Chi-square test: 卡方检验。 ● Binomial test: 二项分布检验。 ● Runs test: 游程检验。 ● 1-Simple K-S test: 单样本K-S检验。 ● 2 Independent Sample test: 两个独立样本非参数检验。 ● K Independent Samples test: 多个独立样本非参数检验。 ● 2 Related Sample test: 两个相关样本非参数检验。 ● K Related Sample test: 多个相关样本非参数检验。
6.1.1 非参数检验的提出
非参数检验是不依赖总体分布的统计推断方法。它是指在 总体不服从正态分布且分布情况不明时,用来检验数据资料是 否来自同一个总体假设的一类检验方法。由于这些方法一般不 涉及总体参数而得名。这类方法的假定前提比参数假设检验方 法少得多,也容易满足,适用于计量信息较弱的资料且计算方 法也简便易行,所以在实际中有广泛的应用。
础
1.使用目的
卡方检验也称为卡方拟合优度检验,是K.Pearson给出的一种 最常用的非参数检验方法。它用于检验观测数据是否与某种概率 分布的理论数值相符合,进而推断观测数据是否是来自于该分布 的样本的问题。
2.基本原理 进行卡方检验时,首先提出零假H 0 设 :样本X来自的总体分布
服理从论期的望期分望布频或数某之一间理的论差分异布来。构接造着检c 2 ,验利统用计实 量际,观它测描值述的了频观数察与值 和理论值之间的偏离程度。
2.基本原理
游程检验可用来检验任何序列的随机性,而不管这个序列是 怎样产生的;此外还可用来判断两个总体的分布是否相同,从而 检验出它们的位置中心有无显著差异。
3.软件使用方法
SPSS中利用游程数构造Z统计量,利用Z统计量的分布来检验 序列是否具有随机性。软件将自动计算出Z统计量的取值及对应 的概率P值。如果概率P值小于或等于用户设定的显著性水平,则 拒绝零假设,认为变量不具有随机性;相反的,如果概率P值大 于显著性水平,则认为变量出现是随机的。
三种职务的期望构成比为15%、5%和80%。而目前样本中 观察到的三种职务的人数比为84:27:363,构成比分别是17.7 %、5.7%和76.6%,和理论值有差异。那么这种差异是由随机 误差造成的,还是真的构成比和以前有所变化?该问题就可以用 χ2检验来实现。相应的假设检验如下。
H0:目前三个职业的总体构成比仍然是15%、5%和80%。 H1:目前三个职业的总体构成比不再是15%、5%和80%
Step01:打开对话框
选择菜单栏中的【分析】→【非参数检验】→【旧对话框】→ 【游程】命令,弹出【游程检验】对话框。
Step02:选择检验变量
在【游程检验】对话框左侧的候选变量列表框中选 择
一个或几个变量,将其添加至【检验变量列表】 中,表示需要进行游程检验的变量。
列表框
ቤተ መጻሕፍቲ ባይዱtep03:确定断点
数检验】→【旧对话框】→【二项式】命令,弹出【二项式检 验)】对话框。
Step02:选择检验变量
在左侧的候选变量列表框中选择“time”变量作为检验变量, 将其添加至【检验变量列表】列表框中。
Step03:定义二元变量
在【定义二分法】选项组中点选【割点】,以指定断点。接 着在其文本框中输入“960”,表示以它作为分界点将原始样本 分为两组。
或几个变量,将其添加至【检验变量列表】列表框中,表示需要 进行进行二项分布检验的变量。 Step03:定义二元变量
在【定义二分法】选项组中可以定义二元变量。 Step04:指定检验概率值
在【检验比例】选项组中可以指定二项分布的检验概率值。 系统默认的检验概率值是0.5,这意味着要检验的二项是服从均 匀分布的。如果所要检验的二项分布不是同概率分布,参数框中 要键入第一组变量所对应的检验概率值。
6.1.2 非参数检验的特点
与参数方法相比,非参数检验方法的优势如下: (1)稳健性。因为对总体分布的约束条件大大放宽,不至于因 为对统计中的假设过分理想化而无法切合实际情况,从而对个别 偏离较大的数据不至于太敏感。 (2)对数据的测量尺度无约束,对数据的要求也不严格,什么 数据类型都可以做。 (3)适用于小样本、无分布样本、数据污染样本、混杂样本等。
1070 1073 958 958 975 969 1079 964 962 970 1054 987 967 969 967 1001 1084 1012 985 9 94 964 952 951 987
968 947 994 993 963 957
Step01:打开对话框 打开数据文件6-2.sav,选择菜单栏中的【分析】 →【非参
2. 实例操作
Step01:打开对话框 打开数据文件6-1.sav,选择菜单栏中的【分析】 →【非参
数检验】→【旧对话框】→【卡方】命令,弹出【卡方检验】对 话框。其中,“jobcat”变量表示职业类型, “1”表示办事员, “2”表示监察员,“3”表示经理。
Step02:选择检验变量 在左侧的候选变量列表框中选择“jobcat”变量作为检验变量, 将其添加至【检验变量列表】列表框中。
在【割点】选项组中指定计算游程数的分界值。小于分界值 的观察值归为一组,其余的归为另一组,然后计算游程数。
Step04:选择计算精确概率
单击【精确】按钮用于选择计算概率P值的方法,它的功能和卡 方检验中的相应按钮相同的。
Step0
Step07: Step07单击【确定】按钮,操作完成
1. 实例内容
某公司经理层、监察员、办事员三种职务类别人员比例大约 在15:5:80为宜,这样运行效率最高。目前公司进行人事调整, 公司人员结构发生变动,有员工担心是否人事调整已经导致职务 类型比例的失调。请利用数据文件6-1.sav来解决该问题。
Step04:单击【确定】按钮,操作完成。
(1)频数表
SPSS的结果报告中列出了期望频数和实际频数。显然残差值 越小,说明实际频数与期望频数越接近。
Step04:指定检验概率值
在【检验比例】文本框中输入指定概率值“0.05”。
Step05:描述性统计量输出
单击【选项】按钮,弹出【选项】对话框。在【统计量】选 项组中勾选【描述性】和【四分位数】复选框,表示输出基本统 计量。再单击【继续】按钮,返回【二项式检验】对话框。
Step06:完成操作
应用
参数检验
非参数检验
配对样本数据
两个独立样本 多个独立样本 相关 随机性
t检验或者z检验
t检验或者z检验 方差分析(F检验) 线性相关 无可用的参数检验
符号检验 Wilcoxon检验 Wilcoxon检验 K-W检验 秩相关检验 游程检验
对正态总体的非 参数检验的效 率评价
0.63 0.95 0.95 0.95 0.91 没有可比较的基
Percentiles
Mea Std. Deviat Minimu Maximu
50th (Med
N
n
ion
m
m 25th
ian) 75th
灯泡
989.
寿 30
1
命
3
40.968
947
1084
962. 7 5
969.50
995.7 5
(2)二项分布检验表
首先根据断点“960”将原始数据划分为两部分:“Group 1” 和“Group 2”,它们各自的样本容量等于6和24,所占总体的比 例为20%和80%。由于这里要检验合格率是否等于95%,也就是 要检验“Group 1”组所占比例是否等于0.05。但根据单尾概率P 值(0.003)小于显著性水平 (0.05),可以判断这批样本的合 格率不等于95%,即这批产品没有合格。
3.软件使用方法
SPSS会自动计算出χ2统计量及对应的相伴概率P值。
Step01:打开主菜单
选择菜单栏中的【分析】 →【非参数检验】→【旧对话框】→ 【卡方】命令,弹出【卡方检验】对话框。
Step02:选择检验变量
在【卡方检验】对话框左侧的候选变量列表框中选择一个 或几个变量,将其添加至【检验变量列表】列表框中,表示需 要进行进行卡方检验的变量。 Step03:确定检验范围
(3)n次试验在相同条件下进行,且各个观察单位的观察结果相 互独立,即每个观察单位的观察结果不会影响到其他观察单位的 结果。
Step01:打开主菜单
选择菜单栏中的【分析】 →【非参数检验】→【旧对话框】→ 【二项式】命令 ,弹出【二项式检验】对话框。
Step02:选择检验变量 在【二项式检验】对话框左侧的候选变量列表框中选择一个
Category N Observed Prop. Test Prop. Asymp. Sig. (1-tailed)
灯 Group 1
泡
<= 960
6
0.20
0.05
寿 命
Group
2
> 960
24
.80
0.003
Total
30
1.00
6.4.1 游程检验的基本原理
1.方法概述
游程检验是一种利用游程数所作的单样本随机性的检验方 法,它可以用来判断观察值的顺序是否为随机。许多统计模型的 假设中都要求观察值都是独立的,也就是说,收集到的数据样本 的顺序是不相关的。如果样本顺序影响到统计结果,那么样本就 可能不是随机的,这将使研究者不能得出关于抽样总体的准确结 论。因此,研究者可以使用游程检验来检验数据的随机性。
Step05:选择计算精确概率
【Exact】按钮用于选择计算概率P值的方法。
Step06:其他选项选择
【选项】按钮用于指定输出内容和关于缺失值的处理方法。
Step07:单击【确定】按钮,结束操作,SPSS软件自动输出结果。
1. 实例内容
某灯泡厂生产的一种特制灯泡按照工艺技术标准的要求, 其合格灯泡的寿命必须大于960小时。通常在生产稳定的时候, 该厂的这种产品合格品率为95%,为检验产品质量,今从新生 产的一大批产品中随机抽查了30只灯泡,测得它们的寿命的数 据资料,试根据这些样品数据检验该批产品的合格率是否等于 95%。
最后,单击【确定】按钮,操作完成。
(1)基本统计量
SPSS首先输出了样本的描述性统计量表。这里共选择了30 个灯泡寿命样本作二项分布检验,灯泡的平均寿命等于989.13 小时,标准差等于40.968小时,灯泡寿命最小值等于947小时, 寿命最大值等于1084小时。同时其25%、50%和75%分位点等 于 962.75、969.50和996.75小时。
Chi-Square df Asymp. Sig.
Employment Category 3.492a 2 .174
6.3.1 二项分布检验的基本原理
1.方法概述
事件要服从二项分布,则应该具备下列基本的条件。
(1)各观察单位只能具有相互对立的一种结果。
(2)已知发生某一结果(阳性)的概率为π,其对立结果的概 率为1-π。
在【期望全距】选项组中可以确定检验值的范围,对应有 两个单选项。 Step04:选择期望值
在【期望值】选项组中可以指定期望值 ,对应有两个单选 项。
Step05:选择计算精确概率
单击【精确】按钮,弹出【精确检验】对话框,该对话框用于选 择计算概率P值的方法 。
Step06:其他选项选择 单击【选项】按钮,弹出【选项】对话框,该对话框用于指定输 出内容和关于缺失值的处理方法
Clerical Custodial Manager Total
Observed N 363 27
Expected N 379.2 23.7
Residual -16.2 3.3
84
71.1
12.9
474
(2)卡方检验表
具体包括统计量、自由度(df)和近似概率P值。可见,统 计量等于3.492,自由度等于2,对应的概率P值0.174大于显著性 水平0.05。因此接受零假设,认为目前三个职业的总体构成比仍 然是15%、5%和c 280%,人数的调动只是随机误差造成的,公司 人员结构没有显著性改变。
SPSS 中进行非参数检验由【分析】菜单中的【非参数检验】
菜单项导出。其中包括以下命令。 ● Chi-square test: 卡方检验。 ● Binomial test: 二项分布检验。 ● Runs test: 游程检验。 ● 1-Simple K-S test: 单样本K-S检验。 ● 2 Independent Sample test: 两个独立样本非参数检验。 ● K Independent Samples test: 多个独立样本非参数检验。 ● 2 Related Sample test: 两个相关样本非参数检验。 ● K Related Sample test: 多个相关样本非参数检验。
6.1.1 非参数检验的提出
非参数检验是不依赖总体分布的统计推断方法。它是指在 总体不服从正态分布且分布情况不明时,用来检验数据资料是 否来自同一个总体假设的一类检验方法。由于这些方法一般不 涉及总体参数而得名。这类方法的假定前提比参数假设检验方 法少得多,也容易满足,适用于计量信息较弱的资料且计算方 法也简便易行,所以在实际中有广泛的应用。
础
1.使用目的
卡方检验也称为卡方拟合优度检验,是K.Pearson给出的一种 最常用的非参数检验方法。它用于检验观测数据是否与某种概率 分布的理论数值相符合,进而推断观测数据是否是来自于该分布 的样本的问题。
2.基本原理 进行卡方检验时,首先提出零假H 0 设 :样本X来自的总体分布
服理从论期的望期分望布频或数某之一间理的论差分异布来。构接造着检c 2 ,验利统用计实 量际,观它测描值述的了频观数察与值 和理论值之间的偏离程度。
2.基本原理
游程检验可用来检验任何序列的随机性,而不管这个序列是 怎样产生的;此外还可用来判断两个总体的分布是否相同,从而 检验出它们的位置中心有无显著差异。
3.软件使用方法
SPSS中利用游程数构造Z统计量,利用Z统计量的分布来检验 序列是否具有随机性。软件将自动计算出Z统计量的取值及对应 的概率P值。如果概率P值小于或等于用户设定的显著性水平,则 拒绝零假设,认为变量不具有随机性;相反的,如果概率P值大 于显著性水平,则认为变量出现是随机的。
三种职务的期望构成比为15%、5%和80%。而目前样本中 观察到的三种职务的人数比为84:27:363,构成比分别是17.7 %、5.7%和76.6%,和理论值有差异。那么这种差异是由随机 误差造成的,还是真的构成比和以前有所变化?该问题就可以用 χ2检验来实现。相应的假设检验如下。
H0:目前三个职业的总体构成比仍然是15%、5%和80%。 H1:目前三个职业的总体构成比不再是15%、5%和80%
Step01:打开对话框
选择菜单栏中的【分析】→【非参数检验】→【旧对话框】→ 【游程】命令,弹出【游程检验】对话框。
Step02:选择检验变量
在【游程检验】对话框左侧的候选变量列表框中选 择
一个或几个变量,将其添加至【检验变量列表】 中,表示需要进行游程检验的变量。
列表框
ቤተ መጻሕፍቲ ባይዱtep03:确定断点
数检验】→【旧对话框】→【二项式】命令,弹出【二项式检 验)】对话框。
Step02:选择检验变量
在左侧的候选变量列表框中选择“time”变量作为检验变量, 将其添加至【检验变量列表】列表框中。
Step03:定义二元变量
在【定义二分法】选项组中点选【割点】,以指定断点。接 着在其文本框中输入“960”,表示以它作为分界点将原始样本 分为两组。
或几个变量,将其添加至【检验变量列表】列表框中,表示需要 进行进行二项分布检验的变量。 Step03:定义二元变量
在【定义二分法】选项组中可以定义二元变量。 Step04:指定检验概率值
在【检验比例】选项组中可以指定二项分布的检验概率值。 系统默认的检验概率值是0.5,这意味着要检验的二项是服从均 匀分布的。如果所要检验的二项分布不是同概率分布,参数框中 要键入第一组变量所对应的检验概率值。
6.1.2 非参数检验的特点
与参数方法相比,非参数检验方法的优势如下: (1)稳健性。因为对总体分布的约束条件大大放宽,不至于因 为对统计中的假设过分理想化而无法切合实际情况,从而对个别 偏离较大的数据不至于太敏感。 (2)对数据的测量尺度无约束,对数据的要求也不严格,什么 数据类型都可以做。 (3)适用于小样本、无分布样本、数据污染样本、混杂样本等。
1070 1073 958 958 975 969 1079 964 962 970 1054 987 967 969 967 1001 1084 1012 985 9 94 964 952 951 987
968 947 994 993 963 957
Step01:打开对话框 打开数据文件6-2.sav,选择菜单栏中的【分析】 →【非参
2. 实例操作
Step01:打开对话框 打开数据文件6-1.sav,选择菜单栏中的【分析】 →【非参
数检验】→【旧对话框】→【卡方】命令,弹出【卡方检验】对 话框。其中,“jobcat”变量表示职业类型, “1”表示办事员, “2”表示监察员,“3”表示经理。
Step02:选择检验变量 在左侧的候选变量列表框中选择“jobcat”变量作为检验变量, 将其添加至【检验变量列表】列表框中。
在【割点】选项组中指定计算游程数的分界值。小于分界值 的观察值归为一组,其余的归为另一组,然后计算游程数。
Step04:选择计算精确概率
单击【精确】按钮用于选择计算概率P值的方法,它的功能和卡 方检验中的相应按钮相同的。
Step0
Step07: Step07单击【确定】按钮,操作完成
1. 实例内容
某公司经理层、监察员、办事员三种职务类别人员比例大约 在15:5:80为宜,这样运行效率最高。目前公司进行人事调整, 公司人员结构发生变动,有员工担心是否人事调整已经导致职务 类型比例的失调。请利用数据文件6-1.sav来解决该问题。