spss软件分析方法概述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SPSS 回顾:
1描述性统计分析
1.1基本描述性统计量的概念
(1)操作步骤:Analyze→Descriptive Statistics→Descriptives
(2)概念
集中趋势的统计量:平均值、中位数、众数、求和
离散趋势的统计量:方差、标准差、极差、最小值、最大值、均值标准误差
分布形态的统计量:偏度、峰度
1.2频数分析
(1)操作步骤:Analyze →Descriptive Statistics→Frequencies
(2)概念
频数(Frenquency):变量值落在某个区间或者某个取值点的个数。
百分比(Percent):各频数占总样本数的百分比。
有效百分比(Valid Percent):各频数占有效样本数的百分比。
累计百分比(Cumulative Percent):各百分比逐级累加起来的结果,最终取值是100。
1.3探索性分析
(1)操作步骤:Analyze →Descriptive Statistics→Explore
(2)看得懂以下图形:箱图、茎叶图、QQ图
特别注意:以下内容都与假设检验有关。
不同的检验有不同的零假设,但基本上对检验结果的判断都遵循以下判别规则,不再赘述。
(1)如果相伴概率值(P值或Sig.值)小于或等于显著性水平α,则拒绝H0。
(2)相伴概率值(P值或Sig.值)大于显著性水平α,则接受H0。
(3)相伴概率值在spss运行结果中查找。显著性水平可由用户自行设定,如没有特别要求可取默认值0.05。
2两总体均值比较
2.1单样本T检验
(1)基本原理:检验样本均值与已知总体均值之间是否存在差异。
(2)操作步骤:Analyze→Compare Means→One Sample T Test
(3)原假设H0:样本均值和总体均值之间不存在显著差异。
(4)关键结果标题和统计量:One Sample Test表和其中的t统计量和sig值。
2.2独立样本T检验
(1)基本原理:检验两个独立正态样本的总体均值之间是否存在显著差异
(2)应用的条件:两个样本相互独立且满足正态分布,样本数量可以不同
(3)操作步骤:Analyze →Compare Means→Independent Samples T Test
(4)原假设H0:两个独立样本的总体均值不存在显著差异。
(5)关键结果标题和统计量:
Independent Samples Test表
(a)首先,利用F检验判断两样本的方差是否相同(方差齐性)。
方差齐性原假设H0:认为两总体方差之间不存在显著性差异,方差齐性。
Levene’s Test for…部分的F统计量和sig值。
(b)根据第一步结果,决定T统计量和自由度计算公式,进而对T检验的结论作出判断。
T Test部分的t统计量和sig值。取Levene’s Test for…部分有F统计量和sig值的行所对应的t统计量和sig值。
2.3 配对样本T检验
(1)基本原理:检验两个配对正态样本的总体均值之间是否存在显著差异
(2)应用的条件:两个样本配对且满足正态分布,样本数量一般相同。配对的理解,两组同质受试样本配成对子或同一受试样本分别接受两种不同的处理。
(3)操作步骤:Analyze →Compare Means→Paired Samples T Test
(4)原假设H0:两个配对样本的总体均值不存在显著差异。
(5)关键结果标题和统计量:
Paired Samples Test表和其中的t统计量和sig值。
3方差分析
(1)基本原理:检验两个以上正态样本的总体均值之间是否存在显著差异。找到影响因变量变化的主要因素,确定各因素对因变量变化的影响程度。
(2)基本概念:因素(自变量)、水平、因变量、控制因素和随机因素。
(3)应用的条件:总体正态分布、方差齐性,样本随机且独立。
3.1单因素方差分析
(4)操作步骤:Analyze →Compare Means→One-Way ANOVA
Option和Post Hoc…按钮的设置
(5)原假设H0:因素的不同水平下,因变量的总体均值没有显著性差异。或者m个样本的总体均值都相同,即μ1=μ2=μ3=…=μm=μ。
(6)关键结果标题和统计量:
Test of Homogeneity of Variances表和其中的Levene统计量和sig值,做方差齐性检验。
ANOVA表中的F统计量和sig值,判断多个样本的均值是否相等,从而判断可控因素是否是因变量的主要影响因素。
ANOVA表中的Between Group值,判断组间影响的大小,即可控因素影响的大小。
ANOVA表中的Within Group值,判断组内影响的大小,即随机因素影响的大小。
Multiple Comparisons表,根据Mean Difference值上的正负号和*号,判断哪个水平最显著。
3.2 多因素方差分析
(4)操作步骤:Analyze→General Linear Model→Univariate
Option和Post Hoc…按钮的设置
(5)原假设H0:不同因素的不同水平下,因变量的总体均值没有显著性差异。或者m个样本的总体均值都相同,即μ1=μ2=μ3=…=μm=μ。
Levene’sTest of …表和其中的F统计量和sig值,做方差齐性检验。
Test of Between-Subjects Effects表中的F统计量和sig值,判断多个样本的均值是否相等。从而判断不同可控因素是否是因变量的主要影响因素,并且根据F值的大小可判断哪个可控因素影响更大。
Multiple Comparisons表,根据Mean Difference值上的正负号和*号,判断哪个水平最显著。
4非参数检验
4.1卡方检验
(1)基本原理:检验样本观察值的频数与期望频数之间是否存在显著性差异。
(2)基本概念:观测频数和期望频数
(3)操作步骤:以下两步缺一不可
Date →Weight Cases
Analyze →Nonparametric Tests →Chi-Square
有很多操作上的注意请参看ppt
(4)原假设H0:样本来自的总体分布形态与期望分布(或理论分布)不存在显著差异。
(5)关键结果标题和统计量:
Test Statistic表和其中的chi square和sig值,做卡方检验。
4.2二项分布检验
(1)基本原理:检验观测数据是否来自二项分布总体的一种检验方法。
(2)基本概念:二分变量
(3)操作步骤:以下两步缺一不可
Analyze →Nonparametric Tests →Binomial
Test Proportion的设置与样本数据的第1个各案所处的分布区间有关系。
(4)原假设H0:样本来自的总体分布与指定的二项分布不存在显著差异。