第四章 SPSS基本统计分析概论
第4章-SPSS基本统计分析
2016/12/25
21
基本描述统计量
描述离散程度的统计量
离散程度:指一组数据远离“中心值”的程度。 即考查所有数据相对于“中心值”分布的疏密程度。 如果数据都紧密地集中在“中心值”的周围,数 据的离散程度较小,则说明“中心值”对数据的 代表性就好; 如果数据比较松散地分布在“中心值”的周围, 数据的离散程度较大,则 “中心值”说明数据特 征是不具有代表性的。
案例
利用“大学生职业生涯规划数据”进行 以下分析:
1. 计算专业和职业认知得分的基本描述统计
量,并比较男女生的得分差异; 2. 分析是否存在专业和职业认知得分的异常 值。
应用举例
基本描述统计
以“居民储蓄调查数据”为例,对一次存(取)款金 额。有两个分析目标: 目标一:计算存(取)款金额的基本描述统计量,并对 城镇储户和农村储户进行比较 (数据拆分)
SK 0
左(负)偏态
x
M M
152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 e 169o170 171 172 173 174 175
基本描述统计量
描述陡峭程度的统计量
– 峰度(kurtosis): 描述某变量取值分布形态陡缓程
龄
合 计
频数分析表
频数分析的任务: 编制频数分布表
用宽度相同的条形的高度或长短来表示频数分布变化的图 如果有缺省值,那 – 各组的名称 形。使用于定序和定类变量的分析 么有效百分比能更 – 频数(Frequency) 加准确地反映取值 用圆形及圆内扇形的面积来表示频数百分比变化的图形。 – 百分比(Percent) 分布状况
第四章 SPSS基本统计分析共60页文档
操作步骤:
打开数据文件“婴儿体重.sav”。打开 Descriptives主对话框,选定变量t进入 Variable栏中。
选中Save standardized values as variables复选框,要求计算变量的z值,并 保存结果到当前数据集中。
单击Options按钮,选中Mean、 Std.Deviation、Minimum、Maximum 、 Variance 项。
统计量
选择一个或多个 变量右移入 Variable(s)框。
统计图 频数输出的顺序
输出统计量对话框
Chart 对话框
按变量值的升序输出 按频数的升序输出
统计表中变量的各 项分析结果在一张 表并列显示
按各个变量组织输 出,输出结果将按 照每个变量一张表 的形式显示
控制频数表输出范围 类型的最大数目为
• 统计结果表明:本市户口家庭的人均住房面 积的均值是21.7平方米,低于外地户口家庭 26.7。无论是本市户口还是外地户口,人均住 房面积的分布均呈一定的右偏分布(两个偏 度统计量分别为2.18和1.43),且本市户口的 偏度更大些;同时,本市户口和外地户口家 庭人均住房面积均呈尖峰分布(两个峰度统 计量分别为8.3和2.1)。由此可见,本市户口 和外地户口中的大部分家庭的人均住房面积 都低于各自的平均水平,此时,仅用均值刻 画住房状况是不准确的。
(二)基本描述统计量
• 常见的基本描述统计量可以分为三大类: 1、集中趋势的描述统计量(均值、中位 值、众值); 2、离散程度的描述统计量(标准差、方 差、极差); 3、分布形态的描述统计量(偏度系数、 峰度系数)。
(三)应用举例
• 利用住房状况调查问卷数据, 对人均住房面积计算基本描 述统计量,并分别对本市户 口和外地户口家庭进行比较。 (首先进行数据拆分)
第四章SPSS基本统计分析
菜单分析
描述统计
频率
SPSS
SPSS
SPSS
SPSS
SPSS
SPSS频数分析的扩展功能
• 计算分位数 • 计算其他描述统计量 • 频数分析表格式的定义
计算集中趋势
SPSS
计算 分位 数
计算离 散程度
SPSS
频数分布格式定义
频数分析应用举例 SPSS (以居民储蓄调查数据.sav为例)
根据样本数据,产生二维或多维交叉列联表
在交叉列联表的基础上,对两两变量间是否 存在一定的相关性进行分析
目的
分析多变量不同取值下的分布,掌握多变量的联合 分布特征,进而分析变量之间的相互影响和关系
交叉列联表的主要内容
SPSS
行 变 量
列变 量
二维 交叉 列联 表 行 边 缘 分 布
列边 缘分 布
SPSS
SPSS
SPSS
SPSS
对存款金额按照户口进行拆分
SPSS
按户 口拆 分好 的数 据
SPSS
对拆分好的数据进行频数分析
SPSS
SPSS
SPSS
练习
• 现有SY-3(公司职员统计表).sav,要求对 其中的变量年龄和受教育年限进行频数分 析,结果输出中要求有四分位数、均值、 标准差、方差、最大值、最小值、数据分 布的偏度和峰度情况,输出条形图,图表 值按照频率输出,格式则按照系统默认的 方式进行,要显示频率表格。
分析
多重 响应
定义变 量集
SPSS
SPSS
分析 SPSS
多重响应
频率
SPSS
SPSS
储户的存款目的 SPSS
第4章 SPSS基本统计分析(课后练习参考)
第4章 SPSS基本统计分析(课后练习参考)1、利用习题二第6题数据,采用SPSS数据筛选功能将数据分成两份文件。
其中,第一份数据文件存储常住地是“沿海或中心繁华城市”且本次存款金额在1000至5000之间的调查数据;第二份数据文件是按照简单随机抽样所选取的70%的样本数据。
第一份文件:选取数据数据——选择个案——如果条件满足——存款>=1000&存款<5000&常住地=沿海或中心繁华城市。
第二份文件:选取数据数据——选择个案——随机个案样本——输入70。
2、利用习题二第6题数据,将其按常住地(升序)、收入水平(升序)、存款金额(降序)进行多重排序。
排序数据——排序个案——把常住地、收入水平、存款金额作为排序依据分别设置排列顺序。
3、利用习题二第4题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的降序排序。
计算转换——对个案内的值计数输入目标变量及目标标签,把所有课程选取到数字变量,定义值——设分数的区间,之后再排序。
4、利用习题二第4题的完整数据,计算每个学生课程的平均分以及标准差。
同时,计算男生和女生各科成绩的平均分。
方法一:利用描述性统计,数据——转置学号放在名称变量,全部课程放在变量框中,确定后,完成转置。
分析——描述统计——描述,将所有学生变量全选到变量框中,点击选项——勾选均值、标准差。
先拆分数据——拆分文件按性别拆分,分析——描述统计——描述,全部课程放在变量框中,选项——均值。
方法二:利用变量计算,转换——计算变量分别输入目标变量名称及标签——均值用函数mean完成平均分的计算,标准差用函数SD完成标准差的计算。
数据——分类汇总——性别作为分组变量、全部课程作为变量摘要、(创建只包含汇总变量的新数据集并命名)——确定5、利用习题二第6题数据,大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进行组距分组。
根据存款金额排序,观察其最大值与最小值,算出组数和组距。
第4章 SPSS基本统计分析
▪ 4.1 频数分析 4.1.1 频数分析的目的和基本任务 4.1.2 频数分析的基本操作 4.1.3 SPSS频数分析的扩展功能 4.1.4 频数分析的应用举例
▪ 4.1.1 频数分析的目的和基本任务 ▪ 目的 ▪ 粗略把握变量值的分布状况。 ▪ 例:研究被调查者的特征(如:性别、年龄、收入) ▪ 研究被调查者对某个问题的总体看法(如:教学方式、
12
10
2
4
0.4
B
14
10
4
16
1.6
C
9
10
-1
1
0.1
D
5
10
-5Βιβλιοθήκη 252.5E10
10
0
0
0.0
∑ χ2 (fofe)2 4.6
fe
▪ 自由度:df=k-1 ▪ 在0.05的显著性水平下,查表自由度为4时的
卡方临界值为:9.488
▪ 在spss中的操作
卡方检验原理 例二
▪ 我们假设有一位社会研究者有兴趣调查高级中学学 生对于大学学历的重要性的态度。她询问了一个60 名高级中学学生的样本,接受大学教育是否变得更 加重要、更不重要或者没有变化。
户 城镇户口 口
农村户口
买东西 113
59
存钱 合计
87
200
23
82
合计
172
110
282
2
n
Cramer's V
▪ Cramer's V是基于卡 方统计量的关联性测 量。
2
V nmin(R1)(C1)
选择行、列数最小一个
收 300元以下 入 300~800 水 平 800~1500
第四章_SPSS基本统计分析
S .E.of .Mean
(x X )
M
2
[ x E ( x )]2 M
n
其中: 为总体标准差,n为样本单位数
2.刻画离散程度的描述统计量
离散程度是指一组数据远离其“中心值”的程度
。 (1)如果数据都紧密地集中在“中心值”的周围,数据 的离散程度较小,说明这个“中心值”对数据的代表 性好。 (2)如果数据仅是比较松散地分布在“中心值”的周围 ,数据的离散程度较大,则此“中心值”说明数据特 征是不具有代表性的。
• 4.2.2 计算基本描述统计量的操作
(1)选择菜单Analyze-Descriptive Statistics-Descriptives,出现如下窗口:
(2)将需计算的数值型变量选择到Variable(s)框中。 (3)单击Option按钮指定计算哪些基本描述统计量,出现 如下窗口:
基本统计量 分布
基本描述统计量的应用举例
(1)利用住房状况调查数据,对人均住房面积计算 基本统计量,并分别对本市户口和外地户口进行家 庭比较。 (2)利用住房状况调查数据,分析人均住房面积是 否存在不均衡现象。
基本描述统计量的应用举例
分析: (1)不均衡现象可以通过分析是否存在大量异常值—根据 3 准则,处于3倍标准差之外的值一般为异常值。 (2)可通过对数据的标准化处理来判断。标准化的数学定义 为:
2.计算其他基本描述统计量
SPSS频数分析还能够计算其他基本统计量,其中包括: (1)描述集中趋势(Central Tendency)的基本统计量 (2)描述离散程度(Dispersion)的基本统计量 (3)描述分布形态(Distribution)的基本统计量
第四章 SPSS基本统计分析
例如:在问卷数据分析中,通常应首先对本次调 查的被调查者的状况,如被访者的总人数、年龄特点、 职业特点、性别特征等进行分析和总结。通过这些分 析,能够在一定程度上反映样本是否具有总体代表性, 抽样是否存在系统偏差等,并以此证明以后相关问题 分析的代表性和可信性。这些可以通过频数分析来实 现。
11
3、频数分布表格式(Format)的定义
(1)调整频数分布表中数据的输出顺序 (Order by)
频数分布表中的内容的输出顺序可 以按变量值的升序输出(Ascending values),按变量值的降序输出 (Descending values),按频数的升序输 出( Ascending counts),按频数的降 序输出( Descending counts)。
三根据五种饮料购买频可口可乐新骑士可口可乐雪碧雪碧可口可乐新骑士可口可乐雪碧雪碧杏杏仁仁露新骑士可口可乐可口可乐雪碧可口可乐新骑士可口可乐可口可乐雪碧可口可乐醒目雪碧雪碧可口可乐可口可乐雪碧雪碧雪碧可口可乐可口可乐雪碧新新骑骑士雪碧雪碧杏仁露可口可乐可口可乐雪碧雪碧杏仁露可口可乐可口可乐杏杏仁仁露可口可乐新骑士雪碧可口可乐杏仁露可口可乐新骑士雪碧可口可乐杏仁露可口可乐三根据五种饮料购买频数数据集绘制条形图和饼图
x)3
/
s3
2019年8月11日星期日
25
当分布为对称分布时,正负总偏差
相等,偏度值等于0;当分布为不对称分 布时,正负总偏差不相等,偏度值大于0 或小于0。偏度值大于0表示正偏差值大, 为正偏或称右偏;偏度值小于0表示负偏 差值大,为负偏或称左偏。偏度绝对值
第4章 SPSS基本统计分析
练习3
• 完成上例
提纲
1
频数分析
2
计算基本描述统计量
复合分组下的频数分析 多选项分析
3
4
5
比率分析
多选项分析
实现思路 1)按多选项二分法或多选项分类法将多选项问题 分解成若干的问题,并设置若干个SPSS变量 2)采用多选项频数分析或多选项交叉分组下的频
• 选择若干个频数分析的变量
• 选择绘制统计图形
4、频数分析的扩展功能
计算分位数 • 分位数:是变量在不同百分位点上的取值。分位 点在0~100之间。 • 分位数差是一种描述数据离散程度的方式。分位 数差越大,表示数据在相应分位上的离散程度越 大
4、频数分析的扩展功能
频数分布表格式的定义 • 调整频数分布表中数据的输出顺序
– 按变量值的升序或降序输出 – 按频数值的升序或降序输出
• 压缩频数分布表
– SPSS默认如果变量取值的个数或取值区间的个数大于10,则 不输出相应的频数分布表
5、频数分析应用举例
分析月住房开销的分布,并对不同居住类型进行比较 • 1)“月住房开销”为定距型变量→先分组,再编 制频数分布表
• 2)计算月住房开销的四分位数→按照“居住类型” 将数据拆分,并重新计算四分位数→进行比较
• 累计百分比:即各百分比逐级累加起来的结果,
最终取值为100%。
2、频数分析中常用统计图
• 条形图:适用于定序和定类变量的分析。条形图
的纵坐标可以是频数,也可以是百分比。
• 饼图:饼图中圆内的扇形面积可以表示频数,也可
以表示百分比。
• 直方图:适用于定距型变量的分析。
3、频数分析的基本操作
第四章 SPSS基本统计
多选项问题
多选项问题不能直接处理 思路
• 将一个问题定义成几个变量,用 这几个变量来描述该问题的几个 可能被选择的答案。 • 分别做频数分析或交叉分组下的 频数分析
Free photoshow template from 24
四、多选项问题分析的两大步骤
总练习
用练习数据.sav做以下分析: • a33,a37,a41是反向题请将他们重新赋值。 • 因子1包括a56,a80,a87,a88,a89这些 题目,请计算因子1(这些题目的和的平均)。 • 因子2包括a33,a37,a41,a62,a75,请 计算题因子2。 • 请分析被试的性别、教龄和职称的基本情 况。
32
Hale Waihona Puke 18二、计算基本描述统计量
基本描述统计量
• 刻画集中趋势的描述统计量
(均数、中位数、众数、均值标准误)
• 刻画离散程度的描述统计量
标准差:是表示变量取值距离均值的平均离散 程度的统计量。 方差:样本标准差2 全距:数据的最大值与最小值之间的绝对差
• 刻画分布形态的描述统计量 (偏度—对称性、峰度—陡缓程度)
• Crosstabs过程用于对计数资料 和有序分类资料进行统计描述 和简单的统计推断。在分析时 可以产生二维至n维列联表,并 计算相应的百分数指标。
Free photoshow template from
10
列联表分析的两大基本任务
• 根据收集到的样本数据,产生二 维或者多维的交叉列联表。 • 在交叉列联表的基础之上,对两 两变量间是否存在一定的相关 性进行分析。
Free photoshow template from 19
标准分数
• 标准分数又称Z分数,是以标准差为单 位来表示一个数据在团体中所处相对位 置的量数。 • 如果一个数小于平均数,其Z分数为负 数,如果一个数大于平均数,其Z分数 为正数,若Z分数的绝对值越大,它离 平均数也就越远,所以Z分数表示了一 个数在它所在的数组中的位置。
SPSS第四章-基本统计分析
Continue Cancel
Help
Suppress tables with more than 18 categories
.
格式的参数说明即操作
调整频数分布表中数据输出顺序(order by)
按值的升序或者降序输出; 按频数的升序或者降序输出;
压缩频数分布表
如果变量取值太多或者区间太多,就需要压缩 分布表;
.
Charts…
Format…
4.1.2 频数分析的基本操作(续)
Chart Type None
Bar Chart Pie Chart Histograms
With normal curve
Continue Cancel
Help
Chart Values Frequencies
Percentages
第4章 SPSS基本统计分析
制作人:夏怡凡
.
主要内容:
引言介绍基本统计分析的重要性和主要内容; 频数分析介绍如何对数据的频数分布进行把握; 计算基本描述统计量进一步描述更为精确的数据
分布特征; 列联表分析描述多个变量之间是否存在相关关系; 多选项分析对应处理问卷种多选的问题; 比率分析描述两变量间比率的变化(新增功能)。
表现集中趋势的统计
量主要有
1n
均值:数学定义 中位数:
x n i1 xi
众数:
.
4.2 .1.2 刻画离散程度的描述统计量
条形图(Bar Chart):用条形的高度和长短表示频 数分布的图形,适用定序和定类变量的分析;
饼图(Pie Chart):用圆形和圆内扇形面积表示频 数百分比,圆内扇形既可以表示频数也可以表示百 分比;
直方图(Histograms):用矩形面积表示频数分布 变化,试用与定距变量的分析,可以附加正态曲线
第4章:SPSS的统计分析
把“地区标 志”作为分 组变量,对 不同的组进 行比较
ADD 平均绝 对离差
COD离散 系数 Mean centered COV 均值的变异系数
COV变异系数
Median centered COV中位数变异系 数
分析analyze描述统计descriptivestatistics频数frequencies点击图表chart选择统计图点击格式format调整频数分布表中数据的输出顺序点击格式format调整分布表中数据的输出顺序统计结果输出结果输出窗口413频数分析的扩展功能spss编制频数分布表和绘制统计图是频数分析的基本任务除此之外在频率窗口中通点击统计量statistics按钮还可以计算其他的统量
数据拆分
表明该数据是进行拆分了的
计算描述统计
分析结果(结果输出窗口) 分析结果(结果输出窗口)
4.3 交叉分组下的频数分析
4.3.1 交叉分组下的频数分析的目的和基本任务 通过频数分析能够掌握单个变量的数据分布情况。在实际 分析中,不仅要了解单变量的特征,还要分析多个变量不同取 值下的分布,掌握多变量的联合分布特征,进而分析变量间的 相互影响和关系。对多变量的联合分布特征的分析,常采用交 叉分组下的频数分析来完成。 交叉分组下的频数分析又称列联表分析,它包括两大基本 任务:第一,根据收集到的样本数据编制交叉列联表;第二, 在交叉列联表的基础上,对两两变量间是否存在一定的相关性 进行分析。
1.多选项二分法 1.多选项二分法 多选项二分法就是将多选项问题中的每个答案设为一个 SPSS变量,每个变量只有0或1两个取值,分别表示选择该答案 和不选择该答案。例如:多选项二分法. 2. 多选项分类法 多选项分类法中,首先估计多选项问题最多可能出现的 答案个数;然后,为每个答案设置一个SPSS变量,变脸取值为 多选项问题中的可选答案。例如:多选项分类法. 在选择多选项问题分解时,对于所选答案具有一定顺序的多 选项问题可采用多选项分类法分解,而没有顺序的问题可采用 二分法分解。
spss基本统计分析
依次连接各点, 依次连接各点, 即可得分布折线图。 即可得分布折线图。
0.70
? 0.60
0.50
0.40
0.30
0.40
0.60
0.80
1.00
1.20
1.40
1.60
n
f P-P图和 图和Q-Q图 图和 图
直方图和茎叶图是评估数据分布的常用图形, 直方图和茎叶图是评估数据分布的常用图形 P-P 图和Q-Q图是直观表示数据分布是否正态。 图是直观表示数据分布是否正态。 图和 图是直观表示数据分布是否正态 P-P图是根据变量的累积概率对应于所指定的理论 图是根据变量的累积概率对应于所指定的理论 分布累积概率绘制的散点图;Q-Q图是根据变量数据 图是根据变量数据 分布累积概率绘制的散点图 分布的分位数与所指定分布分位数之间的曲线来进行 检验。 检验。
b 园图(饼图) 园图(饼图)
用于表示计数资料、 用于表示计数资料、质量性状资料或半定量 等级)资料的构成比。 (等级)资料的构成比。 所谓构成比,就是各类别、 所谓构成比,就是各类别、等级的观测值个数 (次数 与观测值总个数 样本含量 的百分比。 次数)与观测值总个数 样本含量)的百分比 次数 与观测值总个数(样本含量 的百分比。 把园图的全面积看成100%,按各类别、等级的 ,按各类别、 把园图的全面积看成 构成比将园面积分成若干分, 构成比将园面积分成若干分, 以扇形面积的大小表 分别表示各类别、等级的比例。 分别表示各类别、等级的比例。
第四章 基本统计分析
SPSS统计分析功能概述 一、SPSS统计分析功能概述
1、SPSS数值 、 数值 分析过程 2、SPSS图形 、 图形 分析过程
1、SPSS数值分析过程 SPSS数值分析过程
第4章 spss统计技术概论
入 3.80 学 后 一 周 3.60 词 汇 量 3.40
3.20
3.00
4.00
4.50
第一学年末词汇量
5.00
矩阵散点图 在矩阵变量框内要选择两个或两个以上的变量
入 学 后 一 周 词 汇 量
第 一 学 年 末 词 汇 量
第 一 学 年 末 词 汇 量
第 三 学 年 末 词 汇 量
数学
清华 99 88 79 59 54 89 79 56 89
北大 99 23 89 70 50 67 78 89 56
实例3、
研究一个班同学在参加了暑期数学培训班后,学习 成绩是否有显著变化,数据如下。
学号
1 2 3 4 5 6 7 8 9 10
数学1
99 88 79 59 54 89 79 56 89 99
相关分析
像年龄变量、收入变量、成绩变量都是典型的连续 变量。这就是我们前面介绍的Pearson相关。
例
从某系随机选取了40名大学生进行追踪研究,分别 在入学后一周、第一学年末、第二学年末和第三学 年末共4次英语词汇测验推算得到的被试的英语词 汇量(单位:千)。表中的变量如下:性别(0表 示女生,1表示男生),test1(入学后一周词汇 量),test2(第一学年末词汇量),test3(第二 学年末词汇量),test4(第三学年末词汇量)。
.886**
1
Sig. (2-tailed)
.000
.
N
40
40
**. Correlation is significant at the 0.01 level (2-tailed).
结论:r = 0.886,P =0.000<0.01,拒绝H0。 可以认为test1和test2之间有正的直线相关关系。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(3)单击Chart按钮选择绘制统计图形,在 Chart Values框中选择条形图中纵坐标(或饼 图中扇形面积)的含义,其中Frequencies表示 频数;Percentages表示百分比。
百分位数 四分位数
均值 中位数
众数 合计
标准差 方差 全距
(3)压缩频数分布表(Suppress tables with more than n categories)
(2)频数分析的第二个任务是绘制统计图
条形图(Bar Chart):用宽度相同的条形的高度 或长短来表示频数分布变化的图形,适用于定序和 定类变量的分析。
饼图(Pie Chart):用圆形及圆内扇形的面积来 表示频数百分比变化的图形,以利于研究事物内在 结构组成等问题。
直方图(Histograms):用矩形的面积来表示频 数分布变化的图形,适用于定距型变量的分析。
1、目的:基本统计分析往往从频数分析开始。通过频数分 析能够了解变量取值的状况,对把握数据的分布特征是非 常有用的。
2、基本任务 (1)频数分析的第一个基本任务是编制频数分布表。
频数(Frequency):即变量值落在某个区间(或某 个类别)中的次数 百分比(Percent):即各频数占总样本数的百分比 有效百分比(Valid Percent):即各频数占有效样本 数的百分比,这里有效样本数=总样本-缺失样本数 累计百分比(Cumulative Percent):即各百分比 逐级累加起来的结果。最终取值为100。
第四章
SPSS基本统计分析 ——描述性统计分析
SPSS的主要分析工具——Analyze菜单
• 报告--Reports • 描述性统计分析--Descriptive Statistics菜单 • 表格--Tables • 均数间的比较--Compare Means菜单 • 一般线性模型――General Linear Model菜单 • 相关分析――Correlate菜单 • 多元线性回归与曲线拟合―― Regression菜单 • 对数线性模型——Loglinear菜单 • 聚类分析与判别分析——Classify菜单 • 因子分析与对应分析——Data Reduction菜单 • 信度分析与多维尺度分析——Scale菜单 • 非参数检验――Nonparametric Tests菜单 • 时间序列分析--Time series
描述性统计分析是统计分析的第一步,做好这第一步是 下面进行正确统计推断的先决条件。SPSS的许多模块均可 完成描述性分析,但专门为该目的而设计的几个模块则集中 在Descriptive Statistics菜单中,包括:
✓ Frequencies:频数分析过程,特色是产生频数表(主 要针对分类变量)
(2)multiple variables单选框组:
如果选择了两个以上变量作频数表,则 compare variables可以将所有变量的结 果在同一个频数表过程输出结果中显示,便于 互相比较;organize output by variables则将结果在不同的频数表过程输出 结果中显示,每一个变量一张表。
1、计算分位数(Percentile Values)
分位数是变量在不同分位点上的取值。分位点在0- 100之间。一般使用较多的是四分位点(Quartiles) ,即将所有数据按升序排序后平均等分成四份,各分位点 依次是25%,50%,75%。于是四分位数便分别是25 %,50%,75%点所对应的变量值。此外,还有八分位 数、十六分位数等。
SPSS提供了计算任意分位数的功能,用户可以指定 将数据等分为n份(Cut points for n equal groups )。还可以直接指定分位点(Percentile)。
2、计算其他基本描述统计量
SPSS频数分析还能够计算其他基本统计 量,其中包括描述集中趋势(Central Tendency)的基本统计量、描述离散程度 (Dispersion)的基本统计量、描述分布形 态(Distribution)的基本统计量等。
(1)调整频数分布表中数据的输出顺序( Order by):频数分布表中的内容的输出顺序 可以按变量值的升序输出(Ascending values),按变量值的降序输出( Descending values),按频数的升序输出 ( Ascending counts),按频数的降序输 出( Descending counts)。
设置频数表输出的格式选择频数 Nhomakorabea中排 列顺序
按变量升序排 列,此为默认
按变量降序排 列
按变量各种取 值发生的频数的 升序排列
按变量各种取 值发生的频数的 降序排列
多变量框中可设定多 变量表格输出的格式
控制频数表输出的分 类数量。默认为10 Format 对话框
3、频数分布表格式(Format)的定义
注:变量的计量尺度:
a 定类 (Category Scale):只能计次 b 定序 (Ordinal Scale):计次、排序 c 定距(Interval Scale):计次、排序 、加减
d 定比 (Ratio Scale):计次、排序、 加减、乘除
• 4.1.2 频数分析的基本操作
(1)选择菜单Analyze—Descriptive Statistics—Frequencies。
✓ Descriptives:数据描述过程,进行一般性的统计描述 (主要针对数值型变量)
✓ Explore:数据探察过程,用于对数据概况不清时的探索 性分析
✓ Crosstabs:多维频数分布交叉表分析(列联表分析)
✓ Ratio statistics:比率分析
4.1 频数分析
• 4.1.1 频数分析的目的和基本任务
最小值 最大值
均值标准误
偏度 峰度
输出百分位数:
输出四分位数,显示
25%、50%、75%的百分
位数; 将数据平均分为所设定
的相等等份,可输入2—
集 中 趋
100 的整数,如键入4则输
势
出第25、50、75百分位数
栏
自定义百分位数,可输
入0—100 的整数。
离散趋势 分布形态栏
输出统计量对话框
• 4.1.3 SPSS频数分析的扩展功能