第四章 SPSS基本统计分析共60页文档

合集下载

SPSS基本统计分析资料

SPSS基本统计分析资料
❖ 计算分位数:变量在不同区段内的取值情况、数 目(Percenticle Values)
❖ 注意:分位数的分位范围为0~100, ❖ 作用:描述数据离散程度,差越大,说明在相应
位段上的离散程度越大 ❖* 拆分会对以后的分析操作一直起作用,即,都
会是在每个拆分的组上分别进行分析!
5
频数分析过程( Frequencies)
100.0
Cu mu l ati ve Percent 23.9 37.9 40.0 47.1 95.8 96.1 100.0
8
9
10
11
12
Statistics
平均数
家庭 收入 N
中位数 众数
M ea n M ed i an M od e
标准差 Std. Deviation
方差 偏度系数
房 屋产 权
Va li d
无产 权 部分 产权 二手 房 经济 适用房 多层 商品房 高层 商品房 其它 T o ta l
Frequency 715 420 61 214
1456 9
118 2993
Percent 23.9 14.0 2.0 7.2 48.6 .3 3.9
100.0
Valid Percent 23.9 14.0 2.0 7.2 48.6 .3 3.9
▪ 频数,只针对单个变量进行!
3
(二)基本分析步骤
❖ 1.选择菜单 AnalyzeDescriptive StatisticsFrequencies ❖ 2.选择分析对象变量 ❖ 在Variable(s)框中,放置要进行频数分析的变量;可放置多个,但分
析是分别进行的 ❖ 3.调正输出分布表中数据的输出顺序 ❖ Format…按钮,可按变量值的升降,频数Counts的升降进行排序 ❖ 4.选择输出图形 ❖ Chart…按钮,可选择显示的内容:频数Frequencies,百分比

第4章-SPSS基本统计分析

第4章-SPSS基本统计分析

2016/12/25
21
基本描述统计量
描述离散程度的统计量
离散程度:指一组数据远离“中心值”的程度。 即考查所有数据相对于“中心值”分布的疏密程度。 如果数据都紧密地集中在“中心值”的周围,数 据的离散程度较小,则说明“中心值”对数据的 代表性就好; 如果数据比较松散地分布在“中心值”的周围, 数据的离散程度较大,则 “中心值”说明数据特 征是不具有代表性的。
案例

利用“大学生职业生涯规划数据”进行 以下分析:
1. 计算专业和职业认知得分的基本描述统计
量,并比较男女生的得分差异; 2. 分析是否存在专业和职业认知得分的异常 值。

应用举例
基本描述统计
以“居民储蓄调查数据”为例,对一次存(取)款金 额。有两个分析目标: 目标一:计算存(取)款金额的基本描述统计量,并对 城镇储户和农村储户进行比较 (数据拆分)
SK 0
左(负)偏态
x
M M
152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 e 169o170 171 172 173 174 175
基本描述统计量

描述陡峭程度的统计量
– 峰度(kurtosis): 描述某变量取值分布形态陡缓程

合 计
频数分析表

频数分析的任务: 编制频数分布表
用宽度相同的条形的高度或长短来表示频数分布变化的图 如果有缺省值,那 – 各组的名称 形。使用于定序和定类变量的分析 么有效百分比能更 – 频数(Frequency) 加准确地反映取值 用圆形及圆内扇形的面积来表示频数百分比变化的图形。 – 百分比(Percent) 分布状况

第四章SPSS基本统计分析

第四章SPSS基本统计分析
SPSS (以5种饮料购买频数.sav为例)
菜单分析
描述统计
频率
SPSS
SPSS
SPSS
SPSS
SPSS
SPSS频数分析的扩展功能
• 计算分位数 • 计算其他描述统计量 • 频数分析表格式的定义
计算集中趋势
SPSS
计算 分位 数
计算离 散程度
SPSS
频数分布格式定义
频数分析应用举例 SPSS (以居民储蓄调查数据.sav为例)
根据样本数据,产生二维或多维交叉列联表
在交叉列联表的基础上,对两两变量间是否 存在一定的相关性进行分析
目的
分析多变量不同取值下的分布,掌握多变量的联合 分布特征,进而分析变量之间的相互影响和关系
交叉列联表的主要内容
SPSS
行 变 量
列变 量
二维 交叉 列联 表 行 边 缘 分 布
列边 缘分 布
SPSS
SPSS
SPSS
SPSS
对存款金额按照户口进行拆分
SPSS
按户 口拆 分好 的数 据
SPSS
对拆分好的数据进行频数分析
SPSS
SPSS
SPSS
练习
• 现有SY-3(公司职员统计表).sav,要求对 其中的变量年龄和受教育年限进行频数分 析,结果输出中要求有四分位数、均值、 标准差、方差、最大值、最小值、数据分 布的偏度和峰度情况,输出条形图,图表 值按照频率输出,格式则按照系统默认的 方式进行,要显示频率表格。
分析
多重 响应
定义变 量集
SPSS
SPSS
分析 SPSS
多重响应
频率
SPSS
SPSS
储户的存款目的 SPSS

第4章 SPSS基本统计分析

第4章 SPSS基本统计分析
第4章 SPSS基本统计分析
▪ 4.1 频数分析 4.1.1 频数分析的目的和基本任务 4.1.2 频数分析的基本操作 4.1.3 SPSS频数分析的扩展功能 4.1.4 频数分析的应用举例
▪ 4.1.1 频数分析的目的和基本任务 ▪ 目的 ▪ 粗略把握变量值的分布状况。 ▪ 例:研究被调查者的特征(如:性别、年龄、收入) ▪ 研究被调查者对某个问题的总体看法(如:教学方式、
12
10
2
4
0.4
B
14
10
4
16
1.6
C
9
10
-1
1
0.1
D
5
10
-5Βιβλιοθήκη 252.5E10
10
0
0
0.0
∑ χ2 (fofe)2 4.6
fe
▪ 自由度:df=k-1 ▪ 在0.05的显著性水平下,查表自由度为4时的
卡方临界值为:9.488
▪ 在spss中的操作
卡方检验原理 例二
▪ 我们假设有一位社会研究者有兴趣调查高级中学学 生对于大学学历的重要性的态度。她询问了一个60 名高级中学学生的样本,接受大学教育是否变得更 加重要、更不重要或者没有变化。
户 城镇户口 口
农村户口
买东西 113
59
存钱 合计
87
200
23
82
合计
172
110
282
2
n
Cramer's V
▪ Cramer's V是基于卡 方统计量的关联性测 量。
2
V nmin(R1)(C1)
选择行、列数最小一个
收 300元以下 入 300~800 水 平 800~1500

第四章_SPSS基本统计分析

第四章_SPSS基本统计分析

S .E.of .Mean

(x X )
M
2

[ x E ( x )]2 M

n
其中: 为总体标准差,n为样本单位数
2.刻画离散程度的描述统计量
离散程度是指一组数据远离其“中心值”的程度
。 (1)如果数据都紧密地集中在“中心值”的周围,数据 的离散程度较小,说明这个“中心值”对数据的代表 性好。 (2)如果数据仅是比较松散地分布在“中心值”的周围 ,数据的离散程度较大,则此“中心值”说明数据特 征是不具有代表性的。
• 4.2.2 计算基本描述统计量的操作
(1)选择菜单Analyze-Descriptive Statistics-Descriptives,出现如下窗口:
(2)将需计算的数值型变量选择到Variable(s)框中。 (3)单击Option按钮指定计算哪些基本描述统计量,出现 如下窗口:
基本统计量 分布
基本描述统计量的应用举例
(1)利用住房状况调查数据,对人均住房面积计算 基本统计量,并分别对本市户口和外地户口进行家 庭比较。 (2)利用住房状况调查数据,分析人均住房面积是 否存在不均衡现象。
基本描述统计量的应用举例
分析: (1)不均衡现象可以通过分析是否存在大量异常值—根据 3 准则,处于3倍标准差之外的值一般为异常值。 (2)可通过对数据的标准化处理来判断。标准化的数学定义 为:
2.计算其他基本描述统计量
SPSS频数分析还能够计算其他基本统计量,其中包括: (1)描述集中趋势(Central Tendency)的基本统计量 (2)描述离散程度(Dispersion)的基本统计量 (3)描述分布形态(Distribution)的基本统计量

第四章 SPSS基本统计

第四章 SPSS基本统计

多选项问题
多选项问题不能直接处理 思路
• 将一个问题定义成几个变量,用 这几个变量来描述该问题的几个 可能被选择的答案。 • 分别做频数分析或交叉分组下的 频数分析
Free photoshow template from 24
四、多选项问题分析的两大步骤
总练习
用练习数据.sav做以下分析: • a33,a37,a41是反向题请将他们重新赋值。 • 因子1包括a56,a80,a87,a88,a89这些 题目,请计算因子1(这些题目的和的平均)。 • 因子2包括a33,a37,a41,a62,a75,请 计算题因子2。 • 请分析被试的性别、教龄和职称的基本情 况。
32
Hale Waihona Puke 18二、计算基本描述统计量
基本描述统计量
• 刻画集中趋势的描述统计量
(均数、中位数、众数、均值标准误)
• 刻画离散程度的描述统计量
标准差:是表示变量取值距离均值的平均离散 程度的统计量。 方差:样本标准差2 全距:数据的最大值与最小值之间的绝对差
• 刻画分布形态的描述统计量 (偏度—对称性、峰度—陡缓程度)
• Crosstabs过程用于对计数资料 和有序分类资料进行统计描述 和简单的统计推断。在分析时 可以产生二维至n维列联表,并 计算相应的百分数指标。
Free photoshow template from
10
列联表分析的两大基本任务
• 根据收集到的样本数据,产生二 维或者多维的交叉列联表。 • 在交叉列联表的基础之上,对两 两变量间是否存在一定的相关 性进行分析。
Free photoshow template from 19
标准分数
• 标准分数又称Z分数,是以标准差为单 位来表示一个数据在团体中所处相对位 置的量数。 • 如果一个数小于平均数,其Z分数为负 数,如果一个数大于平均数,其Z分数 为正数,若Z分数的绝对值越大,它离 平均数也就越远,所以Z分数表示了一 个数在它所在的数组中的位置。

4 SPSS基本统计分析

4 SPSS基本统计分析

8
9
10
11
12
Statistics 家 庭 收 入 N Mean Median Mode Std. Deviation Variance Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Range Minimum Maximum Sum Percentiles Valid Missing
众数 中位数均值
左偏分布
对称分布
右偏分布
21
2.刻画离散程度的描述统计量Dispersion
离散程度:一组数据远离其中心值的程度, 即所有数据相对于中心值的疏密程度;越密,离 散程度越小,中心值的代表性越强。 目的:结合中心值,给出数据更全面、完整的描 述 常用统计量:
样本标准差Standard Deviation(Std Dev):表示变量 取值距均值的平均离散程度;值越大,差异越大 样本方差Variance:意义同上;值越大,差异越大 全距Range:极差,数据最大值与最小值间的绝对差; 全距大笔全距小的数据分散
25 50 75
13
次级数据资料分析—扩展分析
1、对资料进行分组 Transform Recode Into Different Variable 2、对已分组的资料进行频数分析 (1)、对频数进行加权 Data Weight Cases (2)、求分组数据的频数分析表和描述统计量 Analyze →Descriptive Statistics → Frequencies
Percent 16.8 43.4 15.6 4.7 9.5 9.9 100.0
Valid Percent 16.8 43.4 15.6 4.7 9.5 9.9 100.0

《SPSS统计分析方法及应用》第四章--基本统计分析

《SPSS统计分析方法及应用》第四章--基本统计分析
SPSS提供了计算任意分位数的功能,用户可以指定 将数据等分为n份(Cut points for n equal groups)。还 可以直接指定分位点(Percentile)。
《SPSS统计分析方法及应用》第四章--基本统计分析
2、计算其他基本描述统计量 SPSS频数分析还能够计算其他基本统计量,其中
《SPSS统计分析方法及应用》第四章--基本统计分析
(2)频数分析的第二个任务是绘制统计图
条形图(Bar Chart):用宽度相同的条形的高度或 长短来表示频数分布变化的图形,适用于定序和定类 变量的分析。 饼图(Pie Chart):用圆形及圆内扇形的面积来表示 频数百分比变化的图形,以利于研究事物内在结构组 成等问题。 直方图(Histograms):用矩形的面积来表示频数分 布变化的图形,适用于定距型变量的分析。
分布形态栏
输出统计量对话框
《SPSS统计分析方法及应用》第四章--基本统计分析
4.1.3 SPSS频数分析的扩展功能 1、计算分位数(Percentile Values)
分位数是变量在不同分位点上的取值。分位点在0- 100之间。一般使用较多的是四分位点(Quartiles), 即将所有数据按升序排序后平均等分成四份,各分位点 依次是25%,50%,75%。于是四分位数便分别是25%, 50%,75%点所对应的变量值。此外,还有八分位数、 十六分位数等。
的频数的升序排列 按变量各种取值发生
的频数的降序排列
多变量框中可设定多 变量表格输出的格式
控制频数表输出的分 类数量。默认为10
Format 对话框
《SPSS统计分析方法及应用》第四章--基本统计分析
3、频数分布表格式(Format)的定义 (1)调整频数分布表中数据的输出顺序(Order by):频数分布表中的内容的输出顺序可以按变 量值的升序输出(Ascending values),按变量值 的降序输出(Descending values),按频数的升序 输出( Ascending counts),按频数的降序输出 ( Descending counts)。

SPSS第四章-基本统计分析

SPSS第四章-基本统计分析

Continue Cancel
Help
Suppress tables with more than 18 categories
.
格式的参数说明即操作
调整频数分布表中数据输出顺序(order by)
按值的升序或者降序输出; 按频数的升序或者降序输出;
压缩频数分布表
如果变量取值太多或者区间太多,就需要压缩 分布表;
.
Charts…
Format…
4.1.2 频数分析的基本操作(续)
Chart Type None
Bar Chart Pie Chart Histograms
With normal curve
Continue Cancel
Help
Chart Values Frequencies
Percentages
第4章 SPSS基本统计分析
制作人:夏怡凡
.
主要内容:
引言介绍基本统计分析的重要性和主要内容; 频数分析介绍如何对数据的频数分布进行把握; 计算基本描述统计量进一步描述更为精确的数据
分布特征; 列联表分析描述多个变量之间是否存在相关关系; 多选项分析对应处理问卷种多选的问题; 比率分析描述两变量间比率的变化(新增功能)。
表现集中趋势的统计
量主要有
1n
均值:数学定义 中位数:
x n i1 xi
众数:
.
4.2 .1.2 刻画离散程度的描述统计量
条形图(Bar Chart):用条形的高度和长短表示频 数分布的图形,适用定序和定类变量的分析;
饼图(Pie Chart):用圆形和圆内扇形面积表示频 数百分比,圆内扇形既可以表示频数也可以表示百 分比;
直方图(Histograms):用矩形面积表示频数分布 变化,试用与定距变量的分析,可以附加正态曲线

spss基本统计分析

spss基本统计分析

依次连接各点, 依次连接各点, 即可得分布折线图。 即可得分布折线图。
0.70
? 0.60
0.50
0.40
0.30
0.40
0.60
0.80
1.00
1.20
1.40
1.60
n
f P-P图和 图和Q-Q图 图和 图
直方图和茎叶图是评估数据分布的常用图形, 直方图和茎叶图是评估数据分布的常用图形 P-P 图和Q-Q图是直观表示数据分布是否正态。 图是直观表示数据分布是否正态。 图和 图是直观表示数据分布是否正态 P-P图是根据变量的累积概率对应于所指定的理论 图是根据变量的累积概率对应于所指定的理论 分布累积概率绘制的散点图;Q-Q图是根据变量数据 图是根据变量数据 分布累积概率绘制的散点图 分布的分位数与所指定分布分位数之间的曲线来进行 检验。 检验。
b 园图(饼图) 园图(饼图)
用于表示计数资料、 用于表示计数资料、质量性状资料或半定量 等级)资料的构成比。 (等级)资料的构成比。 所谓构成比,就是各类别、 所谓构成比,就是各类别、等级的观测值个数 (次数 与观测值总个数 样本含量 的百分比。 次数)与观测值总个数 样本含量)的百分比 次数 与观测值总个数(样本含量 的百分比。 把园图的全面积看成100%,按各类别、等级的 ,按各类别、 把园图的全面积看成 构成比将园面积分成若干分, 构成比将园面积分成若干分, 以扇形面积的大小表 分别表示各类别、等级的比例。 分别表示各类别、等级的比例。
第四章 基本统计分析
SPSS统计分析功能概述 一、SPSS统计分析功能概述
1、SPSS数值 、 数值 分析过程 2、SPSS图形 、 图形 分析过程
1、SPSS数值分析过程 SPSS数值分析过程
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

操作步骤:
打开数据文件“婴儿体重.sav”。打开 Descriptives主对话框,选定变量t进入 Variable栏中。
选中Save standardized values as variables复选框,要求计算变量的z值,并 保存结果到当前数据集中。
单击Options按钮,选中Mean、 Std.Deviation、Minimum、Maximum 、 Variance 项。
统计量
选择一个或多个 变量右移入 Variable(s)框。
统计图 频数输出的顺序
输出统计量对话框
Chart 对话框
按变量值的升序输出 按频数的升序输出
统计表中变量的各 项分析结果在一张 表并列显示
按各个变量组织输 出,输出结果将按 照每个变量一张表 的形式显示
控制频数表输出范围 类型的最大数目为
• 统计结果表明:本市户口家庭的人均住房面 积的均值是21.7平方米,低于外地户口家庭 26.7。无论是本市户口还是外地户口,人均住 房面积的分布均呈一定的右偏分布(两个偏 度统计量分别为2.18和1.43),且本市户口的 偏度更大些;同时,本市户口和外地户口家 庭人均住房面积均呈尖峰分布(两个峰度统 计量分别为8.3和2.1)。由此可见,本市户口 和外地户口中的大部分家庭的人均住房面积 都低于各自的平均水平,此时,仅用均值刻 画住房状况是不准确的。
(二)基本描述统计量
• 常见的基本描述统计量可以分为三大类: 1、集中趋势的描述统计量(均值、中位 值、众值); 2、离散程度的描述统计量(标准差、方 差、极差); 3、分布形态的描述统计量(偏度系数、 峰度系数)。
(三)应用举例
• 利用住房状况调查问卷数据, 对人均住房面积计算基本描 述统计量,并分别对本市户 口和外地户口家庭进行比较。 (首先进行数据拆分)
被调查家庭中户主的从业状况和目前所 住房屋的产权情况。
频数分析的操作步骤
结论
• 由从业状况表得到的分析结论如下:本次被 调查家庭的总数为2993户,户主的从业状况 是:人数最多的是国有企业,其次是行政事 业单位和私营企业,人数最少的是大专院校 科研单位。
• 由房屋产权表得出:近50%是多层商品房,无 产权和部分产权也占有一定比例,二手房的 比例较低,高层商品房的比例最少。
婴儿体重的描述统计量
Descriptive Statistics Std.
Format 对话框
某频次分析结果演示
统计量
统计量
兄弟姐妹的个数
N
有效
1505
缺失
12准差
3.047
偏度
1.468
偏度的标准误
.063
峰度
3.507
峰度的标准误
.126
极小值
0
极大值
26
条形图
用宽度相同的条形的高度 或长短来表示频数分布变化的 图形,适用于定类和定序变量 的分析。
频数分析 描述性统计分析 探索分析 列联表分析 比率分析
二、频数分析
• (一)频数的定义 频数就是一个变量在各个变量值上
取值的个案数,是描述性统计中最常用 的方法。
可编制频数分布表和绘制统计图, 把握数据分布的基本特征。
频数分析
• (二)频数分析的目的
通过频数分析能够了解变量取值 的状况,对把握数据的分布特征是 非常有用的。
• 表2表明:本市户口家庭2825户,人均 住房四分位数差是13;外地户口家庭 168户,人均住房面积的四分位数差是 21.6.可见外地户口家庭的人均住房面积 的离散程度高于本市户口,尤其在高数 值区。
三、计算基本描述统计量
(一)功能: 对定距型变量进行描述性统计分析,计
算均值、标准差、全距和均值标准误差等, 并可将原始数据转换成Z分数。
一、基本统计分析功能
基本统计分析功能包括: 1.报告分析(Report)(有兴趣的自学) 2.描述性统计分析(Descriptive Statistics)
描述性统计分析
(Descriptive Statistics)
• 1. Frequencies • 2. Descriptive • 3. Explore • 4. Crosstabs • 5. Ratio
频数分析的扩展功能
• 举例 应用住房状况调查问卷数据,分析
人均住房面积的分布情况,并对本地户 口和外地户口家庭进行比较。
分析思路
• 由于人均住房面积为定距型变量,直接 采用频数分析不利于其分布形态的把握, 因此考虑,依据我们上节课中学过的分 组功能对数据分组后再编制频数分布表。 频数分布表如下:
分组后人均面积
• 接下来利用频数分析计算出所有样本的 人均住房面积的四分位数,然后,按照 户口状况对数据进行拆分,并重新计算 四分位数,分别得到本市户口和外地户 口的人均住房面积的四分位数。结果如 下:
表1
表2
• 表1表明:25%家庭的人均住房面积在 13.7平方米以下;有50%家庭的人均住 房面积在19.6平米以下。
• 利用住房状况调查问卷数据,分析人均 住房面积是否存在不均衡现象。
(分析人均住房面积是否存在不均衡现象, 可以从分析住房面积是否有大量异常值 入手。)
(四)例题分析
已知20个初生婴儿的体重数据如下表, 对其进行描述统计。
2770 2915 2795 2995 2860 2970 3087 3126 3125 4654 2272 3503 4218 3418 3921 2669 3707 2310 2573 3881
条形图
饼图
• 用圆形及圆内扇形的面积来表 示频数百分比变化的图形,有 利于研究事物内在结构组成等 问题。饼图中圆内扇形的面积 可以表示频数,也可以表示百 分比。
饼图(圆饼图)
直方图
• 用矩形的面积来表示频数分布 变化的图形,适用于定距型变 量的分析。
直方图
频数分析的应用举例
• 案例: 利用住房状况问卷调查数据,分析
频数分析
• (三)频数分析的功能 1.产生详细的频数表; 2.按要求给出某个分位点; 3.绘制常用的条图、饼图、直方图。
适用范围:更适用于对分类变量以及不服 从正态分布的连续性变量进行描述。
显示频数分布表
统计图形
统计量
频数输出的顺序
Frequences主对话框
Frequences主对话框
显示频数 分布表
相关文档
最新文档