第4章 SPSS基本统计分析讲解
第4章-SPSS基本统计分析
2016/12/25
21
基本描述统计量
描述离散程度的统计量
离散程度:指一组数据远离“中心值”的程度。 即考查所有数据相对于“中心值”分布的疏密程度。 如果数据都紧密地集中在“中心值”的周围,数 据的离散程度较小,则说明“中心值”对数据的 代表性就好; 如果数据比较松散地分布在“中心值”的周围, 数据的离散程度较大,则 “中心值”说明数据特 征是不具有代表性的。
案例
利用“大学生职业生涯规划数据”进行 以下分析:
1. 计算专业和职业认知得分的基本描述统计
量,并比较男女生的得分差异; 2. 分析是否存在专业和职业认知得分的异常 值。
应用举例
基本描述统计
以“居民储蓄调查数据”为例,对一次存(取)款金 额。有两个分析目标: 目标一:计算存(取)款金额的基本描述统计量,并对 城镇储户和农村储户进行比较 (数据拆分)
SK 0
左(负)偏态
x
M M
152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 e 169o170 171 172 173 174 175
基本描述统计量
描述陡峭程度的统计量
– 峰度(kurtosis): 描述某变量取值分布形态陡缓程
龄
合 计
频数分析表
频数分析的任务: 编制频数分布表
用宽度相同的条形的高度或长短来表示频数分布变化的图 如果有缺省值,那 – 各组的名称 形。使用于定序和定类变量的分析 么有效百分比能更 – 频数(Frequency) 加准确地反映取值 用圆形及圆内扇形的面积来表示频数百分比变化的图形。 – 百分比(Percent) 分布状况
第四章 SPSS的基本统计分析知识讲解
多选项分析
多选项分析的基本思路
– 定义多选项变量集 – 多选项频数分析 – 多选项交叉分组下的频数分析
多选项分析
定义多选项变量集
目的:将已分解的变量定义为一个集合,便于进行多选 项分析
– 菜单选项:analyze->multiple response->define sets – 从原变量中选取被分解的变量(数值型)到variables in
进一步计算
– cells选项:选择在频数分析表中输出各种百分比.
row:行百分比(Row pct); column:列百分比(Col pct); total:总百分比(Tot pct);
分析列联表中变量间的关系
目的:
通过列联表分析,检验行列变量之间是否独立。
方法:
– 卡方检验:对品质数据的相关性进行度量
频数分析
基本操作步骤
(1)菜单选项:analyze->descriptive statistics->frequencies (2)选择几个待分析的变量到variables框. (3)chart选项,选择所需要的图形
计算描述统计量
目的
– 精确把握变量的总体分布状况,了解数据的集中趋 势、离散趋势、对称程度、陡峭程度。
– 菜单选项:analyze->multiple response->crosstabs
频数分析
目的
粗略把握变量值的分布状况。
例:研究被调查者的特征(如:性别、年龄、收入) 研究被调查者对某个问题的总体看法(如:教学方式、选修课程) 研究被调查者某方面的状态(如:购买家电的类型、居民月支出状况)
采用的方法
– 计算频分布表:包括计算 频数、累计频数、百分比、累 计百分比
SPSS统计分析(第6版)(高级版)教学课件SPSS 第4 章 因子与对应分析
对应分析过程
对原始数据加权对话框
对应分析的主对话框
返回
对应分析过程
模型选项对话框
统计量对话框
返回
对应分析过程
图形对话框
返回
对应分析实例
【例5】 通过对应分析研究我国部分省份的农村居民 人均消费支出结构。数据资料来源于《中国统计年鉴( 1997)》。
数据文件data4-03中共有3个变量,分别为province( 省份:1山西、2内蒙古、3辽宁、4吉林、5黑龙江、6海南 、7四川、8贵州、9甘肃、10青海)(名义变量), consumption(消费支出分类:1食品、2衣着、3居住、4家 庭设备及服务、5医疗保健、6交通通信、7文教娱乐)( 名义变量),proportion(各种消费支出比例)(尺度变量 )。
经济/总资产 样品点为:北京、上海、天津、江苏、浙江、海南。 三类:变量点为:国有经济/总资产、集体经济/总资产 样品点为:除上述省市以外的其它省份。 从我国各地经济发展的实际情况来看,这样的分类还是比较符合实
际的。在第一类中,样品点为:福建、广东,属东南沿海省份, 港澳台华侨较多,所以港澳台经济占主导。在第二类中,样品点 为:北京、上海、天津、江苏、浙江、海南,这些省市经济发达 ,开放程度高,所以,联营经济、股份制经济和外商投资经济占 主导。第三类是其它省份,由于这些省份受传统因素的影响较大 ,所以国有经济和集体经济仍占主导。
第4章 因子与对应分析
返回
因子分析与对应分析过程
返回
目录
主成分分析与因子分析 对应分析 习题及参考答案 结束
返回
主成分分析与因子分析
返回
主成分分析与因子分析概述
主成分分析就是考虑各指标间的相互关 系,利用降维的思想把多个指标转换成较 少的几个互不相关的综合指标,从而使进 一步研究变得简单的一种统计方法。
《统计分析与SPSS的应用(第五版)》课后练习答案解析(第4章)
WORD 格式整理《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第 4 章 SPSS基本统计分析1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。
分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图——图表值(频率)——继续,勾选显示频率表格,点击确定。
Statistics户口所在职业年龄地Valid282282282NMissing000户口所在地Frequency Percent Valid CumulativePercent Percent中心城市20070.970.970.9 Valid 边远郊区8229.129.1100.0Total282100.0100.0职业Frequency Percent Valid CumulativePercent Percent 国家机关248.58.58.5商业服务业5419.119.127.7文教卫生18 6.4 6.434.0公交建筑业15 5.3 5.339.4Valid 经营性公司18 6.4 6.445.7学校15 5.3 5.351.1一般农户3512.412.463.5种粮棉专业4 1.4 1.464.9户WORD 格式整理种果菜专业10 3.5 3.568.4户工商运专业3412.112.180.5户退役人员17 6.0 6.086.5金融机构3512.412.498.9现役军人3 1.1 1.1100.0Total282100.0100.0年龄Frequency Percent Valid CumulativePercent Percent20 岁以下4 1.4 1.4 1.420~35 岁14651.851.853.2 Valid 35~50 岁9132.332.385.550 岁以上4114.514.5100.0Total282100.0100.0分析:本次调查的有效样本为282 份。
spss4-2(基本统计分析)
频数分析表
Central tendency: 用于定义描述 集中趋势的一组指标: 均数(Mean)、中位数(Median)、 众数(Mode)、总和(Sum)。
频数分析表
Dispersion:定义描述 离散趋势的一组指标: Std.deviation:标准差 Variance:方差 Range :全距 Minimum:最小值 Maximum:最大值 S.E.mean:标准误
众数
(不唯一性)
无众数 原始数据: 8 10 5 9 12 6
一个众数 原始数据:
6
5
9
8
5
5
多于一个众数 原始数据: 25 28 28 36 42 42
中位数
(median)
1. 排序后处于中间位置上的值
50%
2. 不受极端值的影响
Me
50%
3. 主要用于顺序数据,也可用数值型数据,但不能 用于分类数据 4. 各变量值与中位数的离差绝对值之和最小,即
8
9
1
2
3
4
5
6
7
n 1 9 1 位置 5 2 2 中位数 1080
数值型数据的中位数
(10个数据的算例)
【例】:10个家庭的人均月收入数据
排 序: 660 750 780 850 1630 2000 位 置: 960 1080 1250 1500
9
10
n 1 10 1 位置 5.5 2 2
2 众数(Mode):出现频率最高的数 3 中位数(Median):将数据排序后位于正中间 的数值。适合于所有分布类型的数据 4 总和(Sum)
众数
(mode) 1. 出现次数最多的变量值
SPSS数据统计分析入门指南
SPSS数据统计分析入门指南第一章:SPSS简介与安装SPSS是一款专业的统计分析软件,它可以帮助研究人员快速、准确地进行数据分析。
首先,我们需要从官方网站下载并安装SPSS软件。
安装完毕后,打开软件,界面分为数据视图和变量视图。
第二章:导入数据与数据整理在SPSS中,我们可以通过 Excel、CSV、以及其他常用的数据格式导入数据。
首先,我们需要在数据视图中创建变量,并按照特定的格式将数据导入到这些变量中。
之后,我们可以对数据进行清理和整理,包括去除重复值、填充缺失值等。
第三章:描述性统计分析描述性统计分析是对数据的基本特征进行总结和描述的方法。
在SPSS中,我们可以使用各种统计指标,如均值、标准差、最大值、最小值等来描述数据的分布特征。
同时,SPSS还可以绘制柱状图、饼图、直方图等图表,更直观地展示数据。
第四章:推断性统计分析推断性统计分析是通过样本数据对总体参数进行推断的方法。
SPSS提供了多种推断性统计分析的方法,如方差分析、回归分析、t检验等。
这些方法可以帮助研究人员进行数据的比较、预测和关联性分析。
第五章:相关性分析相关性分析是用来判断两个或多个变量之间相关程度的方法。
SPSS提供了Pearson相关系数、Spearman相关系数、判定系数等方法来度量变量间的相关性。
通过相关性分析,我们可以了解变量间的相互影响关系,为进一步研究和决策提供依据。
第六章:因子分析因子分析是一种用于降维和变量提取的方法。
SPSS可以对变量进行因子分析,并提取出主要因子来解释变量间的关系。
因子分析可以帮助我们找到变量的潜在结构,进一步简化数据分析,提高模型的可解释性。
第七章:聚类分析聚类分析是将样本按照某种特征进行分类的方法。
SPSS提供了多种聚类算法,如K-means聚类、层次聚类等。
聚类分析可以帮助我们发现数据中的相似性和差异性,从而对样本进行分类和比较。
第八章:时间序列分析时间序列分析是对时间序列数据进行建模和预测的方法。
SPSS统计分析第四章均值比较与T检验
N 258 216
Mean $41441.8 $26031.9
Std. Dev iation $19,499.214 $7,558.021
Std. Error Mean $1213.97
$514.258
左第一栏为分析变量标签和分类变量标签 N观测量数目 Mean均值 Std. Deviation标准差 Std. Error Mean标准误
三、配对样本T检验
配对样本T检验(Paired Sample T test)用 于检验两个相关的样本是否来自具有相同均 值的总体。这种相关的或配对的样本常常来 自这样的实验结果,在实验中被观测对象在 实验前后均被观测。两个变量可以是before after,配对分析的测度也不是必须来自同一 个观测对象。一对可以两者组合而成。
练习题
已知某水样中含CaCO3的真值为20.7mg/L, 现用某方法重复测定该水样11次CaCO3的含 量(mg/L)为:20.99,20.41,20.10, 20.00,20.91,22.60,20.99,20.41, 20.00,23.00,22.00。问该方法测得的均值 是否偏高?
2、Independent Sample T test(独立样本T检验)
例题一
现有银行雇员工资为例,检验男女雇员现工 资是否有显著差异。一个是要比较salary变量 的均值,另一个是gender变量作为分水平变 量。 (data09--03) 。
分析变量的简单描述性统计量
Gender Current Salary Male
F emale
Group Statistics
如果你试图比较的变量明显不是正态分布的,则应该 考虑使用一种非参数检验过程(Nonparametric test)。 如果想比较的变量是分类变量,应该使用Crosstabs 功能。
第4章 SPSS基本统计分析
练习3
• 完成上例
提纲
1
频数分析
2
计算基本描述统计量
复合分组下的频数分析 多选项分析
3
4
5
比率分析
多选项分析
实现思路 1)按多选项二分法或多选项分类法将多选项问题 分解成若干的问题,并设置若干个SPSS变量 2)采用多选项频数分析或多选项交叉分组下的频
• 选择若干个频数分析的变量
• 选择绘制统计图形
4、频数分析的扩展功能
计算分位数 • 分位数:是变量在不同百分位点上的取值。分位 点在0~100之间。 • 分位数差是一种描述数据离散程度的方式。分位 数差越大,表示数据在相应分位上的离散程度越 大
4、频数分析的扩展功能
频数分布表格式的定义 • 调整频数分布表中数据的输出顺序
– 按变量值的升序或降序输出 – 按频数值的升序或降序输出
• 压缩频数分布表
– SPSS默认如果变量取值的个数或取值区间的个数大于10,则 不输出相应的频数分布表
5、频数分析应用举例
分析月住房开销的分布,并对不同居住类型进行比较 • 1)“月住房开销”为定距型变量→先分组,再编 制频数分布表
• 2)计算月住房开销的四分位数→按照“居住类型” 将数据拆分,并重新计算四分位数→进行比较
• 累计百分比:即各百分比逐级累加起来的结果,
最终取值为100%。
2、频数分析中常用统计图
• 条形图:适用于定序和定类变量的分析。条形图
的纵坐标可以是频数,也可以是百分比。
• 饼图:饼图中圆内的扇形面积可以表示频数,也可
以表示百分比。
• 直方图:适用于定距型变量的分析。
3、频数分析的基本操作
spss统计分析及应用教程-第4章 参数检验
(2)依次选择“分析—比较均值—单样本T检验”命令 ,打开t检验对话框 ,如图所示
(3)在图所示的单样本T检验对话框中,相关内容介绍如下: 检验变量列表:用于选择所需检验的变量。 检验值:用于输入检验值。
本例在图对话框左端的变量列表将要检验的变量“旅游投资” 添加到右边的检验变量列表中,检验值后面的文本框中输入 1480。
SPSS会根据单因素分析的方法计算出F值和伴随概率p值,以及根据样 本信息自动计算出t统计量的观测值和对应的伴随概率p值。
❖ 两独立样本t检验基本原理和步骤
4
检验判断显著性水平 ɑ
① 方差齐次性检验:给定显著性水平以后,SPSS会先利用F检验判断 两总体的方差是否相等,并由此决定抽样分布方差和自由度的计算方 法和计算结果。
•单一样本t检验基本原理和步骤
提出原假设
单一样本t检验的原假设:总体均值与
1
检验值之间不存在显著差异,即:=,为
总体均值,为检验值。
•单一样本t检验基本原理和步骤
选择检验统计量 2
当总体分布为正态分布
时,样本均值的抽样分布仍是正态分布,
该正态分布的均值为 , 方差为 2,其中 为总体均值, 2为总体方差,n
2
选择检验统计量
由于 度为
(原假设),所以可以略去。这里的t统计量服从自由 的t分布。
当两总体方差未知且不同的情况下,即
,分别用样本方差代
替总体方差,此时两样本均值差的抽样分布的方差为
定义t统计量的计算公式为:
❖ 两独立样本t检验基本原理和步骤
2
选择检验统计量
其中、分别为第一组和第二组样本的样本方差, 、 分别为第一组和 第二组的样本容量。此时两样本均值差的抽样分布的方差为:
第四章SPSS描述统计分析
第4步:设置绘图
点击【图】按钮,弹出“探索:图”对话框。
在“描述”栏内,同 时选择“ 茎叶图”、 “直方图”两个复选框 ,要求作茎叶描述,以 及直方图显示。
同时,选择“含检验 的正态图”。
第5步:设置选项。点击【选项】按钮,弹 出“探索:选项”对话框。
第6步:在主对话框中点击【确定】按 钮 。SPSS在输出窗口的输出结果。
□描述:输出均数、 中位数、众数、5%修正 均数、标准误、方差、 标准差、最小值、最大 值、范围、四分位全距 、峰度系数、峰度系数 的标准误、偏度系数、 偏度系数的标准误。
□M-估计量:作中心趋势的粗略最大似然确 定,输出四个不同权重的最大似然确定数;
□离群值:输出五个最大值与五个最小值; □百分位数:输出第5%、10%、25%、50%、 75%、90%、95%位数;
SPSS 23.0 统计分析
——在心理学与Leabharlann 育学中的应用第四章 描述统计分析
2020/7/9
全书目录
第一章 SPSS 23.0简介与基本操作 第二章 数据编辑与整理 第三章 数据转换 第四章 描述统计分析 第五章 交叉表分析 第六章 比较平均值 第七章 方差分析 第八章 相关分析 第九章 回归分析
所谓Z分值是指某原始数值比其均值高 多少个标准差。
4.2 描述分析
案例:【例4- 2】被试对某一次测验的测验
总分进行分析,描述该测验分数的基本描述 信息,以及将每个被试的分数转化为标准化 分数。
第1步:打开分析数据。打开“测验数据文 件.sav”文件。
第2步:启动分析过程。点击【分析】【描述
第
四 4.1 频数分析
章
描 4.2 描述分析 述 4.3 探索分析
第4章 SPSS基本统计分析 ppt课件[1]
12
▪(1)quartiles:计算四分 位数25%(QL)、50%(中位 数)、75%(QU)
▪(2)cut points for n equal groups: N等份
▪(3)percentile:自定义 百分位点
2020/10/28
13
▪ 4.1.4 频数分析的应用举例:P83 ▪ 分析人均住房面积分布情况 ▪ 以户口为标志进行比较
▪ 我们可以如此设定我们的假设:
▪ 零假设:高级中学学生在对大学教育的重要性的变化 上是分成了大小相等的组的。
▪ 研究假设:高级中学学生在对大学教育的重要性的变 化上是分成了大小不相等的组的。
2020/10/28
32
2020/10/28
33
2020/10/28
34
▪ 自由度df=k-1=3-1=2
2020/10/28
16
▪ 4.2 计算基本描述统计量
▪ 4.2.1.1 集中趋势统计量
▪ 均值(mean)、中位数(median)、众数(mode)、均值 标准误差(standard error of mean)
x
1 n
n i 1
xi
Me2(n1) 4
S.E.ofn.M xean
MeL 2020/10/282
2020/10/28
2
精品资料
▪ 4.1.1 频数分析的目的和基本任务 ▪ 目的 ▪ 粗略把握变量值的分布状况。 ▪ 例:研究被调查者的特征(如:性别、年龄、收入) ▪ 研究被调查者对某个问题的总体看法(如:教学方式、
选修课程) ▪ 研究被调查者某方面的状态(如:购买家电的类型、居
民月支出状况) ▪ 采用的方法 ▪ 计算频分布表:包括计算频数、累计频数、百分比、累
《SPSS统计分析方法及应用》第四章--基本统计分析
《SPSS统计分析方法及应用》第四章--基本统计分析
2、计算其他基本描述统计量 SPSS频数分析还能够计算其他基本统计量,其中
《SPSS统计分析方法及应用》第四章--基本统计分析
(2)频数分析的第二个任务是绘制统计图
条形图(Bar Chart):用宽度相同的条形的高度或 长短来表示频数分布变化的图形,适用于定序和定类 变量的分析。 饼图(Pie Chart):用圆形及圆内扇形的面积来表示 频数百分比变化的图形,以利于研究事物内在结构组 成等问题。 直方图(Histograms):用矩形的面积来表示频数分 布变化的图形,适用于定距型变量的分析。
分布形态栏
输出统计量对话框
《SPSS统计分析方法及应用》第四章--基本统计分析
4.1.3 SPSS频数分析的扩展功能 1、计算分位数(Percentile Values)
分位数是变量在不同分位点上的取值。分位点在0- 100之间。一般使用较多的是四分位点(Quartiles), 即将所有数据按升序排序后平均等分成四份,各分位点 依次是25%,50%,75%。于是四分位数便分别是25%, 50%,75%点所对应的变量值。此外,还有八分位数、 十六分位数等。
的频数的升序排列 按变量各种取值发生
的频数的降序排列
多变量框中可设定多 变量表格输出的格式
控制频数表输出的分 类数量。默认为10
Format 对话框
《SPSS统计分析方法及应用》第四章--基本统计分析
3、频数分布表格式(Format)的定义 (1)调整频数分布表中数据的输出顺序(Order by):频数分布表中的内容的输出顺序可以按变 量值的升序输出(Ascending values),按变量值 的降序输出(Descending values),按频数的升序 输出( Ascending counts),按频数的降序输出 ( Descending counts)。
第4章:SPSS的统计分析
把“地区标 志”作为分 组变量,对 不同的组进 行比较
ADD 平均绝 对离差
COD离散 系数 Mean centered COV 均值的变异系数
COV变异系数
Median centered COV中位数变异系 数
分析analyze描述统计descriptivestatistics频数frequencies点击图表chart选择统计图点击格式format调整频数分布表中数据的输出顺序点击格式format调整分布表中数据的输出顺序统计结果输出结果输出窗口413频数分析的扩展功能spss编制频数分布表和绘制统计图是频数分析的基本任务除此之外在频率窗口中通点击统计量statistics按钮还可以计算其他的统量
数据拆分
表明该数据是进行拆分了的
计算描述统计
分析结果(结果输出窗口) 分析结果(结果输出窗口)
4.3 交叉分组下的频数分析
4.3.1 交叉分组下的频数分析的目的和基本任务 通过频数分析能够掌握单个变量的数据分布情况。在实际 分析中,不仅要了解单变量的特征,还要分析多个变量不同取 值下的分布,掌握多变量的联合分布特征,进而分析变量间的 相互影响和关系。对多变量的联合分布特征的分析,常采用交 叉分组下的频数分析来完成。 交叉分组下的频数分析又称列联表分析,它包括两大基本 任务:第一,根据收集到的样本数据编制交叉列联表;第二, 在交叉列联表的基础上,对两两变量间是否存在一定的相关性 进行分析。
1.多选项二分法 1.多选项二分法 多选项二分法就是将多选项问题中的每个答案设为一个 SPSS变量,每个变量只有0或1两个取值,分别表示选择该答案 和不选择该答案。例如:多选项二分法. 2. 多选项分类法 多选项分类法中,首先估计多选项问题最多可能出现的 答案个数;然后,为每个答案设置一个SPSS变量,变脸取值为 多选项问题中的可选答案。例如:多选项分类法. 在选择多选项问题分解时,对于所选答案具有一定顺序的多 选项问题可采用多选项分类法分解,而没有顺序的问题可采用 二分法分解。
SPSS统计分析第4章平均数差异检验
• (3)选择变量:在左边的源变量列表框中选中要进行单一样 本t检验的变量名,单击中间的箭头按钮,使选中的变量进入 右边的“检验变量”列表框中。
• (4)输入检验值:在“检验变量”列表框下方的“检验值”文本 框中填入要进行检验的确定的均值。
• (5)设置置信度、选择缺失值处理方法:单击“选项”按钮, 打开“选项”对话框,如图所示。
• 在统计学上,只能对虚无假设H0进行直接的检验。假设检 验的任务就是先假设H0是真的,然后以此为前提,如果有 不合理的现象出现则说明假设是错误的,即H0为真这一假 设是不成立的,要被拒绝。如果H0为假,就要拒绝H0并接 受H1,则研究者的假设成立;如果H0 为真,就要接受H0并 拒绝H1,则研究者的假设不能成立。这就是统计学上的“反 证法”。H1称为备择假设就是指其是预备当H0被拒绝时以供 选择的。虚无假设和备择假设互相排斥并且只有一个正确
• (7)设置完操作,输出结果。
4.2.4 实例分析:某普通高校本科生自尊平均水平
• 在某普通高校随机抽取152名本科生,运用缺憾感量表对其 自尊水平进行测量,收集测验数据。部分数据如下所示:
1.描述不同性别学生自尊的平均水平
解:在该案例中,因变量是被试的缺憾感量表的得分,即自尊 水平;自变量是被试的性别和专业。要描述不同性别学生的 自尊平均水平,可以直接由均值比较的操作实现。
• (4)选择自变量:在源变量框中选择作为自变量的变量,即 分组变量。单击下面的箭头按钮,该变量进入“自变量列表”框 。首先选择的自变量默认为第一层控制变量,若单击“下一张” 按钮,可以再选择其他变量作为第二层控制变量。
• (5)选择描述性统计量:单击“选项”按钮,出现“选项”对话 框,如图所示。
spss基本统计分析
依次连接各点, 依次连接各点, 即可得分布折线图。 即可得分布折线图。
0.70
? 0.60
0.50
0.40
0.30
0.40
0.60
0.80
1.00
1.20
1.40
1.60
n
f P-P图和 图和Q-Q图 图和 图
直方图和茎叶图是评估数据分布的常用图形, 直方图和茎叶图是评估数据分布的常用图形 P-P 图和Q-Q图是直观表示数据分布是否正态。 图是直观表示数据分布是否正态。 图和 图是直观表示数据分布是否正态 P-P图是根据变量的累积概率对应于所指定的理论 图是根据变量的累积概率对应于所指定的理论 分布累积概率绘制的散点图;Q-Q图是根据变量数据 图是根据变量数据 分布累积概率绘制的散点图 分布的分位数与所指定分布分位数之间的曲线来进行 检验。 检验。
b 园图(饼图) 园图(饼图)
用于表示计数资料、 用于表示计数资料、质量性状资料或半定量 等级)资料的构成比。 (等级)资料的构成比。 所谓构成比,就是各类别、 所谓构成比,就是各类别、等级的观测值个数 (次数 与观测值总个数 样本含量 的百分比。 次数)与观测值总个数 样本含量)的百分比 次数 与观测值总个数(样本含量 的百分比。 把园图的全面积看成100%,按各类别、等级的 ,按各类别、 把园图的全面积看成 构成比将园面积分成若干分, 构成比将园面积分成若干分, 以扇形面积的大小表 分别表示各类别、等级的比例。 分别表示各类别、等级的比例。
第四章 基本统计分析
SPSS统计分析功能概述 一、SPSS统计分析功能概述
1、SPSS数值 、 数值 分析过程 2、SPSS图形 、 图形 分析过程
1、SPSS数值分析过程 SPSS数值分析过程
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
学习目标及内容:
掌握SPSS 频数分析的基本方法及其操作 明确基本描述统计量的含义,并掌握其操作
掌握交叉列联分析的基本方法,了解卡方检验的基本 思想,并熟练操作
掌握对多选项问题的不同拆分方法和应用场合,并能 用于数据分析
25%、50%、75%的百分 位数;
将数据平均分为所设定 的相等等份,可输入2— 100 的整数,如键入4则输 出第25、50、75百分位数
自定义百分位数,可输 入0—统计量对话框
案例:分析人均住房面积的分布情况,并对本 市户口和外地户口家庭进行比较
?展示所有样本的四分位数:在变量【variable(s)】 中选择“人均面积”,在【statistics】中选择四分位 数【quartiles】即可。
?SPSS 提供了计算任意分位数的功能,用户可以指定将 数据等分为n份(Cut points for n equal groups )。
?还可以直接指定分位点(Percentile )。
四分位差(也称内距或四分位距)
?它是上四分位数(QU,即位于75% )与下四分位数 (QL,即位于25% )。计算公式为:Qd =QU-QL
操作:运用前面介绍的分组操作按“人均面积”将住房 分成1、2、3、4组,并赋给变量值,如1为人均住房 “小于10平方米”…
?【transform 】→【recode into different variables 】
?然后选择频数分析【analyze 】→【descriptive statistics 】→ 【frequercies 】,采用“分组后的 人均面积”作为计算频数的变量。在【charts 】中使 用直方图histograms ,带正态曲线with normal curve;
?四分位差反映了中间 50% 数据的离散程度,其数值越 小,说明中间的数据越集中;其数值越大,说明中间 的数据越分散。
?四分位差不受极值的影响。此外,由于 中位数处于数 据的中间位置,因此,四分位差的大小在一定程度上 也说明了中位数对一组数据的代表程度。
栏势趋中集
输出百分位数: 输出四分位数,显示
结果一:人均住房面积频数分布表
结果二:分组后人均住房面积直方图
扩展二 计算分位数
? 分位数是变量在不同分位点上的取值。分位点在 0- 100 之间。
?一般使用较多的是四分位点(Quartiles ),即将所有 数据按升序排序后平均等分成四份,各分位点依次是 25 %,50 %,75 %。于是四分位数便分别是 25 %, 50%,75%点所对应的变量值。此外,还有八分位数 、十六分位数等。
序,这里选择频数的降序【descending counts】。累计
变
频
量
数
值
百分 比
此外,在SPSS输出窗口中用鼠标双击待编辑的图形,会 出出现【chart editor】图形编辑窗口。例如在 【elements】选择【show data lables】,可以在图 中显示频数数据。
4.1.3 SPSS频数分析的扩展功能
⑵再选择频数分析变量,即“从业状况”、“房屋产权” 到【varable(s)】框中
⑶按【charts】选统计图形,在【chart values】中选择坐 标的含义(柱形、饼图),其中【frequencies】表示频 数,【percentages】表示百分比。
⑷按【format】,可以调整频数分布表中数据的输出顺
?按“户口状况”对数据进行拆分,然后分类比较人均住 房面积的分位数。
操作:先使用【data】中【 split file】按“户口状况” 进行拆分,再选择【analyze】→【descriptive statistics】→【frequercies】,选择“人均面积”,并 仅在【statistics】中选择四分位数【quartiles】即可。
4.1频数分析
4.1.1频数分析的目的和基本任务
1、目的:基本统计分析往往从频数分析开始。通过频数分 析能够了解变量取值的状况,对把握数据的分布特征是非 常有用的。
2、基本任务
(1)频数分析的第一个基本任务是编制频数分布表。 频数(Frequency ):即变量值落在某个区间(或某 个类别)中的次数
4.2计算基本描述统计量 ——对定距数据分布的精确认识
目的:精确把握变量的总体分布状况,了解数据的集 中趋势、离散趋势、对称程度、陡峭程度。
常见的基本描述统计量有三大类:
刻画集中趋势的统计量 刻画离散程度的统计量 刻画分布形态的统计量
4.2.1 基本描述统计量
百分比(Percent ):即各频数占总样本数的百分比 有效百分比(Valid Percent ):即各频数占有效样本 数的百分比,这里有效样本数=总样本-缺失样本数
累计百分比(Cumulative Percent ):即各百分比逐 级累加起来的结果。最终取值为 1。
(2) 任务二是绘制统计图
①柱形图或条形图(bar chart) 条形图用横坐标的长短表示频数(百分比)的变化, 柱形图用纵坐标的高度表示频数(百分比),如下图 。 适合于定序和定类变量;
按【statistics】还可以计算其他重要的统计量,如计 算分位数percentile values、以及反映集中趋势和 离散程度的统计量。这些扩展分析较适合于 定距型变
扩量展。一 定距型变量的频数分析
例如:分析 “人均住房面积”的分布情况
由于“人均面积”属于定距型变量,需要进行分组后, 才能进行频数分析。
②饼图(pie chart):用圆形或扇形的面积表示频数、 百分比的变化。
③直方图(histograms):用矩形的面积表示频数分布变 化的图形,适用于定距性变量的分析。可以附加正态 分布曲线。
4.1.2频数分析的应用举例(住房状况调 查)
问题:分析户主的从业状况和房屋产权情况
操作:
⑴选择【analyze】→【descriptive statistics】→ 【frequercies】