SPSS统计分析非参数检验
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
假设 m=800
接受区95% 拒绝区5%
m±1.96 Se
一、定类—定类尺度:χ2检验
卡方检验是用来检验样本中两个定类变量的关系强度测量 结果(卡方值)是否能推断总体。
A、χ2检验的假设: H0: χ2=0; H1: χ2≠0; B、卡方计算公式:
2
(Oij Eij )2
ji
Eij
C、卡方分布形状
100.0%
研究 生以
上 8
1.3% 50.0%
8 1.3% 50.0%
16
Total 630
100% 50.4%
621 100% 49.6% 1251
1.3% 100%
100% 100%
显著性检
验结果
Pearson Chi-Square
Value
df
27.892a
7
Likelihood Ratio
二、完全窗口分析
按Analyze—Compare Means—OneSample T Test顺序,打开One-Sample T Test主对话框(如图5--1)
Test
Variables 框:用于 选取需要 分析的变 量
图5-1
Test Value:输
入已知的 总体均值, 默认值为 0
One-Sample T Test主对话框
Confidence Interval:输 入置信区间, 一般取90、 95、99等。
图5-2 Options对话框
Missing Values: 在检验变量中含 有缺失值的观测将 不被计算。
在任何一个变量 中含有缺失值的观 测都将不被计算
三、例题分析
(一) [05-1] 某校在对一项教学改革措施的评价 中,随机抽取了60位学生进行态度调查,他们的 10项态度7级量表的态度反应资料见下表:
t检验概率值 年龄
现在每 月工
年龄
资
Pearson Correlation 1.000
-.079*
样本量
Sig. (2-tailed)
.
N
1254
现 在 每 月 工 资Pearson Correlation -.079*
.020 861 1.000
Sig. (2-tailed)
.020
.
N
861
861
教学改革态度反应得分(x) 10-20 20-30 30-40 40-50 50-60 60-70 合计
人数(f) 2 6 10 12 20 10 60
试构造学生态度得分平均值的98%的置信区间。
(二)以[04-7]的资料来说明。已知另一地区 16-18岁的少年血红蛋白平均值为11.657 (g%),检验这一地区16-18岁少年血红蛋 白平均值是否与另一地区的平均值相等。
第九章 非参数检验
非参数检验
非参数检验是指在总体不服从正态分布 且分布情况不明时,用来检验数据资料 是否来自同一个总体的一类假设检验方 法,因这些方法一般不涉及总体参数而 得名。
主要类型:
– Chi-square test 卡方检验 – Binomial test二项式检验 – Runs test 游程检验等等
95% Confidence
Interval of the
Sig.
Mean
Difference
t
dfΒιβλιοθήκη (2-tailed) Difference Lower
Upper
HB
-.592
39
.558
-.2122 -.9379
.5134
从表5-2可看出,t值为-0.592,自由度 为39,显著值为0.558,样本均值与检验 值的差为-0.2122,该差值95%的置信区 间是-0.9379~0.5134。
One-Sample Statistics
Std. Std. Error
N
Mean Deviation
Mean
HB
40 11.4448
2.2690
.3588
表5-1 是血红蛋白值的观测量个数、均值、 标准差和均值的标准误等统计量。
表5-2 单个样本检验
One-Sample Test
Test Value = 11.657
能否用样本均值估计总体均值?两个变量均值接近的样本是 否来自均值相同的总体?换句话说,两组样本某变量均值不 同,其差异是否具有统计意义?能否说明总体具有显著性差 异?这是各种研究工作中经常提出的问题。这就要进行均值 比较。
第一节 单一样本T检验
一、 简介
主要用于检验单个变量的均值与假 设检验值(给定的常数)之间是否存在差 异,也可进行单样本的参数区间估计。
1、操作步骤 1)(打开数据文件“04-7血红蛋白.sav”。) 按Analyze—Compare Means—One Sample T Test顺序,打开主对话框。 2)将变量hb选入 Test Variable框。 3)在Test Value中输入 11.657,后单击OK。
2、结果分析
表5-1 单个样本统计量
*. Correlation is significant at the 0.05 level (2-tailed).
四、回归系数B的显著性检验:t 检验
样本中的回归公式中计算出的自变量回归系数B 在总体中是否有效,需要用t分布来检验。检验步 骤同于前述的假设检验。
A、原假设:
H0: B=0 ;
H1: B ≠0 ;
年龄
-3.487
Std. Error 63.540
1.497
Beta -.079
a. Dependent Variable: 现在 每月 工资
t 12.958 -2.329
Sig. .000 .020
t 值的显著度
第五章 参数估计与假设检验
主要内容
第一节 单一样本T检验 (OneSample T Test)
212065634 850 249489.0
度
Total
222554974 857
三、 定距—定距尺度相关系数r的显著性检验: t检验
t检验也可用来检验样本中一对定距变量的相关系数r在总
体上是否有效。其检验的方式与前面的假设检验大同小异。 在此我们只略述检验的原假设以及检验结果。
A、相关系数检验的原假设:
B、检验结果:检验结果的概率值若小于给定的 显著度,如0.05,则推翻原假设,样本中的回归 公式可用于说明总体。
C、 t分布形状:
拒绝域
拒绝域
回归系数
t值
Coefficientsa
Unstandardized Standardized
Coeffic ients
Coeffic ients
B
1 (Constant) 823.33
(2-sided) .000 .000
.002
二、 定类—定距尺度: F 检验
F检验是用来检验样本中一个定类变量和一个定距变量的关 系强度测量结果(分组平均数)是否能推断总体。如不同职 业的人在收入上是否有差异(即职业分组的平均收入是否不 同)。
A、F 检验的假设: H0: μ1=μ2 = μ3 = ...μk ; H1: μ1 ≠μ2 ≠μ3≠ ...μk ;
5)观察样本的统计量的概率值是否落在接受域内,从而 判断是接受/拒绝原假设。从下表看出,样本统计量X2 =27.89,概率值(Significance)=0.000<0.05,落在拒 绝域,因此,否定H0;接受总体中X2=27.89的判断。 此判断犯错误的概率)=0.000<0.05。
性 别 * 文 化 程 度 Crosstabulation 文化程度
设。从下表看出,样本统计量F =6.006。 概率值(Significance)=0.000<0.05,
落在拒绝域,因此,否定H0;拒绝总体中H0: μ1=μ2 = μ3 = ...μk 的判断。
即由样本可以推断总体,不同的文化程度,收入有差别;文化程度与收入有 关。
现 在每 月 工 资
文 化程 度 不 识字 或 识 字很 少 初小 高小 初中 高 中中 专 或 中技 大专 大 学本 科 研 究生 以 上 Total
r H0: =0 ;
r H1: ≠0 ;
B、检验结果:检验结果的概率值若小于给定的显著度,
如0.05,则推翻原假设,说明两变量总体上有相关。即样
本中的相关系数在总体中也有效。
C、SPSS中相关系数 r 的t检验示例:
Correlate Bivariate
显著性检验结果
相关系数
Correl ations
30.324
7
Linear-by-Linear Association
9.706
1
N of Valid Cases
1251
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 7.94.
Asymp. Sig.
变量关系的显著性检验类型
定类 定序 定距
定类
定序
定距
卡方类测量 (卡方检验)
卡方类测量 (卡方检验)
Spearman 相 关系数 (Z 检验)
方差分析 (F 检验)
Spearman 相关 系数
(Z 检验) Pearson 相关
(t 检验) 回归系数 (t 检验)
样本2:X2= 790;S=10
样本1:X1= 795;S=10
男 女 Total
不识字 或识字
很少 7
1.1% 14.9%
40 6.4% 85.1%
47 3.8% 100%
卡方值
初小 34
5.4% 49.3%
35 5.6% 50.7%
69 5.5% 100%
高小 30
4.8% 46.2%
35 5.6% 53.8%
65 5.2% 100%
初中 163
25.9% 53.1%
2)确定检验此假设的概率标准:显著度为0.05。
3)抽取一个样本容量为1254的随机样本,计算出样本中文化程度与收入的
F =6.006。
4)选择用来检验H0 的分布: F 分布,并根据显著度0.05设立接受域(P>0.05) 或拒绝域(P<0.05); 5)观察样本的统计量的概率值是否落在接受域内,从而判断是接受/拒绝原假
接受域 拒绝域
D、SPSS中卡方检验示例(性别与文化程度)
步骤:
1)确定双变量总体参数的假设:
H0: X2=0 ;
H1: X2 ≠0;
2)确定检验此假设的概率标准:显著度为0.05。
3)抽取一个样本容量为1254的随机样本,计算出样本中 性别与文化程度的X2=27.89。
4)选择用来检验H0 的分布: X2分布,并根据显著度 0.05设立接受域(P>0.05)或拒绝域(P<0.05);
Report
Mean 302.86 460.28 773.50 546.95 676.57 793.66 828.86 666.00 681.22
N 7
18 22 213 312 146 125 15 858
Std. Deviation
137.93 176.64 1386.82 326.58 470.18
显著4度60.91 618.19 325.00 509.60
ANOVA Table F值
Sum of
Mean
Squares df Square F Sig.
现 在 每 Between (Combined)10489339.4 7 1498477 6.006 .000
月 工 资 * GWriothuipnsGroups 文化程
144 23.2% 46.9%
307 24.5% 100%
高中中 专或中
技 202
32.1% 51.4%
191 30.8% 48.6%
393 31.4% 100.0%
Chi-Square Tests
大专 89
14.1% 48.9%
93 15.0% 51.1%
182 14.5% 100%
大学本 科 97 15.4% 56.4% 75 12.1% 43.6% 172 13.7%
第二节 独立样本T检验 (Independent-Sample T Test)
第三节 配对样本T检验 (Paired-Sample T Test)
均值比较与均值比较的检验过程
均值比较的概念
统计分析常常采取抽样研究的方法,即从总体中随机抽取一 定数量的样本进行研究来推断总体的特性。由于总体中的每 个个体间均存在差异,即使严格遵守随机抽样原则也会由于 多抽到一些数值较大或较小的个体致使样本统计量与总体参 数之间有所不同;又由于实验者测量技术的差别或测量仪器 精确程度的差别等等也会造成一定的偏差,使样本统计量与 总体参数之间存在差异。由此可以得到这样的认识:均值不 相等的两组样本不一定来自均值不同的总体。
B、F 值计算公式:
组间方差 F 组内方差
= SSB / d . f SSW / d . f
C、F分布的形状 拒绝域
接受域 拒绝域
D、SPSS中 F 检验示例(文化程度与收入) 步骤:
1)确定双变量总体参数的假设:
H0: μ1=μ2 = μ3 = ...μk ; H1: μ1 ≠μ2 ≠μ3≠ ...μk ;
接受区95% 拒绝区5%
m±1.96 Se
一、定类—定类尺度:χ2检验
卡方检验是用来检验样本中两个定类变量的关系强度测量 结果(卡方值)是否能推断总体。
A、χ2检验的假设: H0: χ2=0; H1: χ2≠0; B、卡方计算公式:
2
(Oij Eij )2
ji
Eij
C、卡方分布形状
100.0%
研究 生以
上 8
1.3% 50.0%
8 1.3% 50.0%
16
Total 630
100% 50.4%
621 100% 49.6% 1251
1.3% 100%
100% 100%
显著性检
验结果
Pearson Chi-Square
Value
df
27.892a
7
Likelihood Ratio
二、完全窗口分析
按Analyze—Compare Means—OneSample T Test顺序,打开One-Sample T Test主对话框(如图5--1)
Test
Variables 框:用于 选取需要 分析的变 量
图5-1
Test Value:输
入已知的 总体均值, 默认值为 0
One-Sample T Test主对话框
Confidence Interval:输 入置信区间, 一般取90、 95、99等。
图5-2 Options对话框
Missing Values: 在检验变量中含 有缺失值的观测将 不被计算。
在任何一个变量 中含有缺失值的观 测都将不被计算
三、例题分析
(一) [05-1] 某校在对一项教学改革措施的评价 中,随机抽取了60位学生进行态度调查,他们的 10项态度7级量表的态度反应资料见下表:
t检验概率值 年龄
现在每 月工
年龄
资
Pearson Correlation 1.000
-.079*
样本量
Sig. (2-tailed)
.
N
1254
现 在 每 月 工 资Pearson Correlation -.079*
.020 861 1.000
Sig. (2-tailed)
.020
.
N
861
861
教学改革态度反应得分(x) 10-20 20-30 30-40 40-50 50-60 60-70 合计
人数(f) 2 6 10 12 20 10 60
试构造学生态度得分平均值的98%的置信区间。
(二)以[04-7]的资料来说明。已知另一地区 16-18岁的少年血红蛋白平均值为11.657 (g%),检验这一地区16-18岁少年血红蛋 白平均值是否与另一地区的平均值相等。
第九章 非参数检验
非参数检验
非参数检验是指在总体不服从正态分布 且分布情况不明时,用来检验数据资料 是否来自同一个总体的一类假设检验方 法,因这些方法一般不涉及总体参数而 得名。
主要类型:
– Chi-square test 卡方检验 – Binomial test二项式检验 – Runs test 游程检验等等
95% Confidence
Interval of the
Sig.
Mean
Difference
t
dfΒιβλιοθήκη (2-tailed) Difference Lower
Upper
HB
-.592
39
.558
-.2122 -.9379
.5134
从表5-2可看出,t值为-0.592,自由度 为39,显著值为0.558,样本均值与检验 值的差为-0.2122,该差值95%的置信区 间是-0.9379~0.5134。
One-Sample Statistics
Std. Std. Error
N
Mean Deviation
Mean
HB
40 11.4448
2.2690
.3588
表5-1 是血红蛋白值的观测量个数、均值、 标准差和均值的标准误等统计量。
表5-2 单个样本检验
One-Sample Test
Test Value = 11.657
能否用样本均值估计总体均值?两个变量均值接近的样本是 否来自均值相同的总体?换句话说,两组样本某变量均值不 同,其差异是否具有统计意义?能否说明总体具有显著性差 异?这是各种研究工作中经常提出的问题。这就要进行均值 比较。
第一节 单一样本T检验
一、 简介
主要用于检验单个变量的均值与假 设检验值(给定的常数)之间是否存在差 异,也可进行单样本的参数区间估计。
1、操作步骤 1)(打开数据文件“04-7血红蛋白.sav”。) 按Analyze—Compare Means—One Sample T Test顺序,打开主对话框。 2)将变量hb选入 Test Variable框。 3)在Test Value中输入 11.657,后单击OK。
2、结果分析
表5-1 单个样本统计量
*. Correlation is significant at the 0.05 level (2-tailed).
四、回归系数B的显著性检验:t 检验
样本中的回归公式中计算出的自变量回归系数B 在总体中是否有效,需要用t分布来检验。检验步 骤同于前述的假设检验。
A、原假设:
H0: B=0 ;
H1: B ≠0 ;
年龄
-3.487
Std. Error 63.540
1.497
Beta -.079
a. Dependent Variable: 现在 每月 工资
t 12.958 -2.329
Sig. .000 .020
t 值的显著度
第五章 参数估计与假设检验
主要内容
第一节 单一样本T检验 (OneSample T Test)
212065634 850 249489.0
度
Total
222554974 857
三、 定距—定距尺度相关系数r的显著性检验: t检验
t检验也可用来检验样本中一对定距变量的相关系数r在总
体上是否有效。其检验的方式与前面的假设检验大同小异。 在此我们只略述检验的原假设以及检验结果。
A、相关系数检验的原假设:
B、检验结果:检验结果的概率值若小于给定的 显著度,如0.05,则推翻原假设,样本中的回归 公式可用于说明总体。
C、 t分布形状:
拒绝域
拒绝域
回归系数
t值
Coefficientsa
Unstandardized Standardized
Coeffic ients
Coeffic ients
B
1 (Constant) 823.33
(2-sided) .000 .000
.002
二、 定类—定距尺度: F 检验
F检验是用来检验样本中一个定类变量和一个定距变量的关 系强度测量结果(分组平均数)是否能推断总体。如不同职 业的人在收入上是否有差异(即职业分组的平均收入是否不 同)。
A、F 检验的假设: H0: μ1=μ2 = μ3 = ...μk ; H1: μ1 ≠μ2 ≠μ3≠ ...μk ;
5)观察样本的统计量的概率值是否落在接受域内,从而 判断是接受/拒绝原假设。从下表看出,样本统计量X2 =27.89,概率值(Significance)=0.000<0.05,落在拒 绝域,因此,否定H0;接受总体中X2=27.89的判断。 此判断犯错误的概率)=0.000<0.05。
性 别 * 文 化 程 度 Crosstabulation 文化程度
设。从下表看出,样本统计量F =6.006。 概率值(Significance)=0.000<0.05,
落在拒绝域,因此,否定H0;拒绝总体中H0: μ1=μ2 = μ3 = ...μk 的判断。
即由样本可以推断总体,不同的文化程度,收入有差别;文化程度与收入有 关。
现 在每 月 工 资
文 化程 度 不 识字 或 识 字很 少 初小 高小 初中 高 中中 专 或 中技 大专 大 学本 科 研 究生 以 上 Total
r H0: =0 ;
r H1: ≠0 ;
B、检验结果:检验结果的概率值若小于给定的显著度,
如0.05,则推翻原假设,说明两变量总体上有相关。即样
本中的相关系数在总体中也有效。
C、SPSS中相关系数 r 的t检验示例:
Correlate Bivariate
显著性检验结果
相关系数
Correl ations
30.324
7
Linear-by-Linear Association
9.706
1
N of Valid Cases
1251
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 7.94.
Asymp. Sig.
变量关系的显著性检验类型
定类 定序 定距
定类
定序
定距
卡方类测量 (卡方检验)
卡方类测量 (卡方检验)
Spearman 相 关系数 (Z 检验)
方差分析 (F 检验)
Spearman 相关 系数
(Z 检验) Pearson 相关
(t 检验) 回归系数 (t 检验)
样本2:X2= 790;S=10
样本1:X1= 795;S=10
男 女 Total
不识字 或识字
很少 7
1.1% 14.9%
40 6.4% 85.1%
47 3.8% 100%
卡方值
初小 34
5.4% 49.3%
35 5.6% 50.7%
69 5.5% 100%
高小 30
4.8% 46.2%
35 5.6% 53.8%
65 5.2% 100%
初中 163
25.9% 53.1%
2)确定检验此假设的概率标准:显著度为0.05。
3)抽取一个样本容量为1254的随机样本,计算出样本中文化程度与收入的
F =6.006。
4)选择用来检验H0 的分布: F 分布,并根据显著度0.05设立接受域(P>0.05) 或拒绝域(P<0.05); 5)观察样本的统计量的概率值是否落在接受域内,从而判断是接受/拒绝原假
接受域 拒绝域
D、SPSS中卡方检验示例(性别与文化程度)
步骤:
1)确定双变量总体参数的假设:
H0: X2=0 ;
H1: X2 ≠0;
2)确定检验此假设的概率标准:显著度为0.05。
3)抽取一个样本容量为1254的随机样本,计算出样本中 性别与文化程度的X2=27.89。
4)选择用来检验H0 的分布: X2分布,并根据显著度 0.05设立接受域(P>0.05)或拒绝域(P<0.05);
Report
Mean 302.86 460.28 773.50 546.95 676.57 793.66 828.86 666.00 681.22
N 7
18 22 213 312 146 125 15 858
Std. Deviation
137.93 176.64 1386.82 326.58 470.18
显著4度60.91 618.19 325.00 509.60
ANOVA Table F值
Sum of
Mean
Squares df Square F Sig.
现 在 每 Between (Combined)10489339.4 7 1498477 6.006 .000
月 工 资 * GWriothuipnsGroups 文化程
144 23.2% 46.9%
307 24.5% 100%
高中中 专或中
技 202
32.1% 51.4%
191 30.8% 48.6%
393 31.4% 100.0%
Chi-Square Tests
大专 89
14.1% 48.9%
93 15.0% 51.1%
182 14.5% 100%
大学本 科 97 15.4% 56.4% 75 12.1% 43.6% 172 13.7%
第二节 独立样本T检验 (Independent-Sample T Test)
第三节 配对样本T检验 (Paired-Sample T Test)
均值比较与均值比较的检验过程
均值比较的概念
统计分析常常采取抽样研究的方法,即从总体中随机抽取一 定数量的样本进行研究来推断总体的特性。由于总体中的每 个个体间均存在差异,即使严格遵守随机抽样原则也会由于 多抽到一些数值较大或较小的个体致使样本统计量与总体参 数之间有所不同;又由于实验者测量技术的差别或测量仪器 精确程度的差别等等也会造成一定的偏差,使样本统计量与 总体参数之间存在差异。由此可以得到这样的认识:均值不 相等的两组样本不一定来自均值不同的总体。
B、F 值计算公式:
组间方差 F 组内方差
= SSB / d . f SSW / d . f
C、F分布的形状 拒绝域
接受域 拒绝域
D、SPSS中 F 检验示例(文化程度与收入) 步骤:
1)确定双变量总体参数的假设:
H0: μ1=μ2 = μ3 = ...μk ; H1: μ1 ≠μ2 ≠μ3≠ ...μk ;