第3章SPSS描述性统计分析
《统计分析与SPSS的应用(第五版)》课后练习答案(第3章)

《统计分析与SPSS的应用(第五版)》课后练习答案(第3章)第三章:统计分析与SPSS的应用(第五版) 课后练习答案第一节:描述性统计在本章的课后习题中,我们将通过SPSS软件进行一系列的统计分析。
本节将提供第三章的课后习题答案,通过展示实际的数据和分析结果,帮助读者更好地理解统计分析的应用和SPSS软件的操作。
1. 描述性统计分析题目:使用某城市2019年1月至12月的气温数据,计算月平均气温、最高气温和最低气温的描述性统计指标。
答案:通过SPSS导入数据,选择变量"月份"和"气温",并进行描述性统计分析。
结果显示,2019年1月至12月的气温数据的月平均气温、最高气温和最低气温的描述性统计指标如下:月平均气温:- 平均值:20°C- 标准差:2°C- 最小值:15°C- 最大值:25°C最高气温:- 平均值:28°C- 标准差:3°C- 最小值:22°C- 最大值:35°C最低气温:- 平均值:12°C- 标准差:2°C- 最小值:8°C- 最大值:18°C根据以上结果,我们可以得出结论:2019年该城市的月平均气温在20°C左右,最高气温在28°C左右,最低气温在12°C左右。
气温的变化范围相对较小,波动性较小。
这些结果可以帮助我们对该城市的气候情况进行初步了解。
2. 相关性分析题目:使用某企业2018年1月至12月的销售额和广告投入数据,计算销售额和广告投入之间的相关性。
答案:通过SPSS导入数据,选择变量"销售额"和"广告投入",并进行相关性分析。
结果显示,2018年1月至12月的销售额和广告投入之间的Pearson 相关系数为0.85,表明二者呈现强正相关关系。
第3章 SPSS描述性统计分析

Step01 打开主窗口
选择菜单栏中的【Analyze(分析)】→ 【Descriptive Statistics(描述性统计)】 →【Explore(探索)】命令,弹出【Explor e(探索)】对话框,该对话框是探索性分析的 主操作窗口。
Step02 选择分析变量
在【Explore(探索)】对话框左侧的【候选变 量】清单中,选取一个或多个待分析变量, 将它们移入右侧的【Dependent List(因 变量列表)】列表框中,表示要进行探索性 分析的变量。
3.2.2 描述统计分析的SPSS操作详解
Descriptives 过程是连续资料统计描述应用 最多的一个过程,它可对变量进行描述性统 计分析计算,并列出一系列相应的统计指标。 这和其他过程相比并无不同。但该过程还有 个特殊功能,就是可将原始数据转换成标准 化值,并以变量的形式保存。
Step01:打开主窗口
Step04 选择标签值
从候选变量列表框中选择一个变量作为标识变 量,并将其移入【Label Cases by(标注 个案)】列表框中。选择标识变量的作用在 于,若系统在数据探索时发现异常值,便可 利用标识变量加以标记,便于用户找这些异 常值。如果不选择它,系统默认以id变量作 为标识变量。
Step05 选择输出类型
Step04:选择输出图形类型
Step05:完成操作
(1)基本统计结果输出
频数分析基本统计结果
N Percentiles
Valid Missing 25 50 75
38 0 18.00 20.00 23.00
表3-2 频数分析表
(2)频数分析表输出
频数分析表
Valid
14 15 16 17 18 19 20 21 22 23 24 26 27 Tota l
Spss统计应用基础第三章N

3.10
标准化Z分数及其线性转换
• 3.10.1 统计学上的定义和计算公式 ,标准差 • Z分数的定义:从平均数为,
为 ,的总体中抽出一个变量值x,Z分 数表示的是此变量大于或小于平均数几 个标准差。 x • 计算公式: z
• T=10Z+50
• 3.10.2 SPSS中实现过程
3.8
峰度(Kurtosis)
3.8.1 统计学上的定义和计算公式 • 定义:描述某变量所有取值分布形态陡缓程度 的统计量。 • 峰度为0表示其数据分布与正态分布的陡缓程度相同; • 峰度大于0表示比正态分布高峰要更加陡峭,为尖峰。 • 峰度小于0表示比正态分布的高峰要平坦,为平顶峰。
1 n 4 4 Kurtosis ( xi x) / SD 3 n 1 i 1
3.3
众数(Mode)
3.3.1 统计学上的定义和计算公式 定义:众数是一组数据中,出现次数最多的那个 变量的值。 计算公式
⑴原始数据法
出现频数最多的那个数值就是众数。
例:7,4,7,2,6,7的众数是7。 ⑵频数分布表法 频数最多一组的组中值就是众数。当相邻的两个组频数 都是最多时,两组的分组点就是众数。
• 3.9.2 SPSS中实现过程
研究问题 某班41个学生身高分布,试求学生身高分布偏度。 实现步骤:
(1)单击Analyze菜单Descriptive Statistics中的 Frequencies命令 (2)将变量列表中的变量“身高”添加到Variable(s)框 中。 (3)单击下方的Statistics按钮,对话框中选统计的项目。 在Distribution框中选Skewness, 选好后单击 Continue,返回Friquencies对话框,单击OK,SPSS即 开始计算。
SPSS统计分析--第3章--基本统计分析

3.2.1 频数统计的主要功能
• “频率”过程可以产生频数分布表,以对数据按组进行归 类整理。还可以生成各种描述性统计指标,以及条形图、 饼图、直方图等常用的统计图。通过选择SPSS中的“分析 ”︱“描述统计”︱“频率”命令,可以对各变量的数据 分布特征有一个概括的整体的认识。
.
3.2.2 频数统计的操作过程
.
3.2.3 实例分析:大学新生的心理健康状况(1)
【例3.1】某大学为了了解学生的心理健康状况,要对初 入学的大一新生进行心理测评,并建立心理档案。现要对 某班学生的生活事件量表进行分析。请用SPSS做出此测试 结果的频数分布情况。
解:本例中,主要通过“频率”过程对本班生活事件量表 的总分进行描述,并得出全班学生此量表总分各分数的频 数情况及其百分比和累积百分比,可以从中了解到学生整 体得分的高低水平,也可以由此注意到需要给予较多关注 的个体或群体。下面将介绍具体的操作过程。
• 均值标准误差:描述样本均值与总体均值之间的平均差异程度 的统计量。
• 全距:也称极差,是数据的最大值与最小值之间的绝对离差。 • 方差:也是表示变量取值离散程度的统计量,是各变量值与算
数平均数离差平方的算术平均数。
.
• 标准差:表示变量取值距离均值的平均离散程度的统计量。标 准差值越大,说明变量值之间的差异越大,距均值这个“中心 值”的离散趋势越大。
• 均值:即算术平均数,是反映某变量所有取值的集中趋势或平 均水平的指标。如某企业职工的平均月收入可用均值。
• 中位数:即一组数据按升序排序后,处于中间位置上的数据值 。如评价社会的老龄化程度时,可用中位数。
• 众数:即一组数据中出现次数最多的数据值。如生产鞋的厂商 在制定各种型号鞋的生产计划时应该运用众数。
SPSS统计分析第3章 描述性统计分析(新 )

变量“教育”的频率分布表
教育 频率 有效 1 2 3 4 5 6 合计 缺失 系统 合计 8 39 114 165 456 53 835 1 836 百分比 1.0 4.7 13.6 19.7 54.5 6.3 99.9 .1 100.0 有效百分 累积百分 比 比 1.0 1.0 4.7 5.6 13.7 19.3 19.8 39.0 54.6 93.7 6.3 100.0 100.0
5.百分位数(Percentile Value)
3.1 基本描述性统计量的定义及计算 3.1.2 描述离散程度的统计量
1.样本方差(Variance)
2.样本标准差(Std. deviation)
3.极差(Range)
4.均值标准误差(Standard Error of Mean)
3.1 基本描述性统计量的定义及计算 3.1.3 描述总体分布形态的统计量
表中显示了变量“教育”在各个 取值上出现的次数(频率)、其 频率占所有个案中的百分比、有 效百分比及累积百分比。
3.2 频数分析
变量“收入”的频率分布表
收入 频率 有效 0 1 2 3 4 5 6 7 8 9 10 11 合计 2 87 152 157 137 88 85 52 27 9 8 32 836 有效百分 累积百分 比 比 百分比 .2 .2 .2 10.4 18.2 18.8 16.4 10.5 10.2 6.2 3.2 1.1 1.0 3.8 100.0 10.4 18.2 18.8 16.4 10.5 10.2 6.2 3.2 1.1 1.0 3.8 100.0 10.6 28.8 47.6 64.0 74.5 84.7 90.9 94.1 95.2 96.2 100.0
第1步 数据组织:定义2个变量,分别为:“科目”、“成 绩”,“科目”的度量标准为“名义”,“成绩”的度量标 准为“度量”。 第2步 探索分析设置: 选择菜单“分析→ 描述统计 → 探索”,打开“探索” 对 话框,,将“成绩”字段移入“因变量列表”,“科目”移 入“因子列表”。
SPSS数据处理与分析教案-数据的描述性统计分析

(项目,任务)
项目二SPSS Statistics数据创建与数据预处理
任务4图表分析
教学目标:
1.掌握交叉表格的制作方法。
2.掌握柱形图和饼图的绘制方法。
教学重点、难点:
重点:能够绘制交叉表格、柱形图、饼图。
难点:理解数据的各种图形的特点。
教学内容及过程设计
时间分配
一、制作交叉表格
子任务1:“手机销售统计.sav”文件记录了某淘宝店铺某日手机的销售数据,通过交叉表格分析消费者的性别与手机品牌的关系。
2.箱图
子任务2:打开“满意度测评.sav”文件,绘制不同营业厅的满意度的箱图,并在图中标注个案。
【步骤1】~【步骤3】
二、数据的正态性检验
1.通过直方图进行正态性检验
子任务3:在“满意度测评.sav”文件中,绘制不同营业厅的满意度的直方图。
【步骤1】~【步骤3】
2.通过正态QQ图进行正态性验证
子任务4:在“满意度测评.sav”文件中,利用正态QQ图判断不同营业厅的满意度是否服从正态分布。
【步骤1】~【步骤3】
3.通过正态性验证指标进行正态性验证
子任务5:在“满意度测评.sav”文件中,判断不同营业厅的满意度是否服从正态分布。
【步骤1】~【步骤4】
任务实训
在“成绩.sav”文件中,判断不同性别的成绩是否服从正态分布。
(20分钟)
(20分钟)
(10分钟)
(10分钟)
(15分钟)
课后总结分析:
【步骤1】~【步骤8】
2.中位数
子任务3:某公司员工工资数据存放在“工资统计.sav”文件中,根据此数据文件计算平均值与中位数,并比较哪一个指标更能体现工资的集中趋势。
第三章描述性统计分析

描述性统计分析指标
统计量可分为两类
一类表示数据的中心位置,例如均值、中位数、众 数等 一类表示数据的离散程度,例如方差、标准差、极 差等用来衡量个体偏离中心的程度。
描述单变量分布的三种方式
用数字呈现一个变量的分布 用表格呈现一个变量的分布 用图形呈现一个变量的分布
Frequencies
在交叉列联表中,除了频数外还引进了各种百分 比。例如表中第一行中的33.3%, 33.3%, 33.3 %分别是高级工程师3人中各学历人数所占的比例 ,称为行百分比(Row percentage),一行的百 分比总和为100%;表中第一列的25.0%,25.0% ,50.0%分别是本科学历4人中各职称人数所占的 比例,称为列百分比(Column percentage), 一列的列百分比总和为100%,表中的6.3%,6.3 %,12.5%等分别是总人数16人中各交叉组中人 数所占的百分比,称为总百分比(Total percentage),所有格子中的总百分比之和也为 100%。
例子
假设我们有以下的三组观测值:
观测A:11,12,13,16,16,17,18,21 观测B:14,15,15,15,16,16,16,17 观测C:11,11,11,12,19,20,20,20
这三组观测值的均值都是15.5,那么这三组数 据是否相似呢?
离散趋势
离散趋势的描述
本科 职称 高 级工 程师 Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total 1 33.3% 25.0% 6.3% 1 25.0% 25.0% 6.3% 2 33.3% 50.0% 12.5% 0 .0% .0% .0% 4 25.0% 100.0% 25.0%
SPSS数据分析—描述性统计分析

SPSS数据分析—描述性统计分析描述性统计分析是一种针对数据本身的分析方法,通过使用统计学指标来描述数据的特征。
这种分析方法看似简单,但实际上却是许多高级分析的基础工作。
很多高级分析方法都对数据有一定的假设和适用条件,这些可以通过描述性统计分析来判断。
我们也会发现,许多分析方法的结果中都会穿插一些描述性分析的结果。
描述性统计主要关注数据的三个方面:集中趋势、离散趋势和数据分布情况。
描述集中趋势的指标包括均值、众数和中位数,其中均值包括截尾均值、几何均值和调和均值等。
描述离散趋势的指标包括频数、相对数、方差、标准差、标准误、全距、四分位间距、四分位数、百分位数和变异系数等。
需要注意的是,连续型变量和离散型变量的指标有所不同。
由于许多统计分析都有一个正态分布的假设,因此我们经常关注数据的分布特征。
常用峰度系数和偏度系数来描述数据偏离正态分布的程度。
也可以使用Bootstrap方法计算出结果与经典统计学方法计算出的结果进行对比,如果差异明显,则说明原数据呈偏态分布或存在极值。
SPSS用于描述性统计分析的过程大部分都在分析-描述统计菜单中,另有一个在比较均值-均值菜单。
虽然这几个过程用途不同,但基本上都可以输出常用的指标结果。
分析-描述统计-频率过程可以输出连续型变量集中趋势和离散趋势的主要指标,还可以输出判断分布的直方图、峰度值和偏度值。
此外,该过程最主要的作用是输出频数表。
分析-描述统计-描述过程输出的内容并不多,也没有统计图可以调用,唯一特别的是该过程可以对数据进行标准化变换,并保存为新变量。
分析-描述统计-探索过程是在原有数据进行描述性统计的基础上,更进一步的描述数据。
与前两种过程相比,它能提供更详细的结果。
分析-描述统计-比率过程主要用于对两个连续变量间的比率进行描述分析。
输出的结果比较简单,只是指标的汇总表格。
分析-描述统计-交叉表过程主要用于分类变量的描述性统计。
它可以完成频数分布和构成比的分析,也经常被用来做列联表的推断分析。
spss在财务管理中的应用-第3章

spss在财务管理中的应用-第3章第3章主要介绍了SPSS在财务管理中的应用。
SPSS是一种统计分析软件,可以帮助财务管理人员进行数据分析和决策支持。
以下是SPSS在财务管理中的具体应用:1. 数据清洗和整理:SPSS可以用于清洗和整理财务数据,包括删除重复数据、处理缺失值、标准化数据等。
这有助于确保数据的准确性和一致性。
2. 描述性统计分析:SPSS可以计算财务数据的描述性统计量,例如平均值、标准差、最大值、最小值等。
这有助于了解数据的分布情况和基本特征。
3. 相关性分析:SPSS可以进行相关性分析,帮助财务管理人员了解不同财务指标之间的关系。
通过计算相关系数,可以确定变量之间的线性关系强度和方向。
4. 回归分析:SPSS可以进行回归分析,帮助财务管理人员建立财务指标与其他变量之间的关系模型。
通过回归分析,可以预测财务指标的变化和影响因素。
5. 方差分析:SPSS可以进行方差分析,帮助财务管理人员比较不同组之间的财务指标差异。
通过方差分析,可以确定不同因素对财务指标的影响程度。
6. 时间序列分析:SPSS可以进行时间序列分析,帮助财务管理人员识别和预测财务数据中的趋势和周期性。
通过时间序列分析,可以制定更准确的财务预测和决策。
7. 聚类分析:SPSS可以进行聚类分析,帮助财务管理人员将相似的财务数据归类到一起。
通过聚类分析,可以发现不同财务数据的群组特征和相似性。
8. 假设检验:SPSS可以进行假设检验,帮助财务管理人员验证财务假设和推断。
通过假设检验,可以确定财务决策的有效性和可靠性。
总之,SPSS在财务管理中的应用非常广泛,可以帮助财务管理人员进行数据分析、模型建立和决策支持。
通过SPSS 的功能,财务管理人员可以更好地理解和利用财务数据,提高财务决策的准确性和效率。
SPSS统计分析—描述性统计分析

SPSS统计分析—描述性统计分析描述性统计分析(Descriptive statistics analysis)简介描述性统计分析是统计学的一个领域,主要目的是通过对样本数据进行总结、整理和分析,揭示数据中的模式、趋势和关联。
它可以通过计算和展示各种统计指标来帮助我们更好地理解和解释数据。
SPSS(Statistical Package for the Social Sciences)是一种常用的统计分析软件,可以用于进行各种描述性统计分析。
本文将介绍一些常用的描述性统计分析方法和在SPSS中的应用。
1.数据摘要数据摘要是描述性统计分析的基础,主要目的是对数据进行概括性的总结。
常用的数据摘要方法包括计数、频数、百分比、均值、中位数、标准差等。
在SPSS中,可以使用“Frequencies”命令对数据进行频数分析。
该命令可以列出每个变量的频数、百分比以及累积百分比。
此外,使用“Descriptives”命令可以计算各个变量的均值、中位数、标准差等统计量。
2.绘制图表图表可以帮助我们更好地理解和展示数据的特征和分布。
常用的图表包括直方图、饼图、箱线图等。
在SPSS中,可以使用“Graphs”菜单下的不同选项来绘制各种图表。
例如,使用“Bar Chart”选项可以绘制柱状图,使用“Pie Chart”选项可以绘制饼图,使用“Boxplot”选项可以绘制箱线图。
3.相关分析相关分析可以帮助我们研究数据之间的关联关系。
它可以通过计算相关系数来评估两个变量之间的线性关系。
在SPSS中,可以使用“Correlations”命令进行相关分析。
该命令可以计算出各个变量之间的相关系数,并提供了相关系数矩阵和散点图来展示结果。
4.因素分析因素分析是一种常用的数据降维方法,可以帮助我们理解并提取潜在的数据结构和变量之间的关系。
在SPSS中,可以使用“Factor Analysis”命令进行因素分析。
该命令可以根据指定的变量,自动提取主成分或因子,并计算出因子载荷矩阵和因子得分。
SPSS数据分析—描述性统计分析

描述性统计分析是针对数据本身而言,用统计学指标描述其特征的分析方法,这种描述看似简单,实际上却是很多高级分析的基础工作,很多高级分析方法对于数据都有一定的假设和适用条件,这些都可以通过描述性统计分析加以判断,我们也会发现,很多分析方法的结果中,或多或少都会穿插一些描述性分析的结果。
描述性统计主要关注数据的三大内容:1.集中趋势2.离散趋势3.数据分布情况描述集中趋势的指标有均值、众数、中位数,其中均值包括截尾均值、几何均值、调和均值等。
描述离散趋势的指标有频数、相对数、方差、标准差、标准误、全距、四分位间距、四分位数、百分位数、变异系数等。
注意:连续型变量和离散型变量的指标有所不同。
由于很多统计分析都有一个正态分布的假设,因此我们经常也会关注数据的分布特征,常用峰度系数和偏度系数来描述数据偏离正态分布的程度,也可以使用Bootstrap方法计算出结果与经典统计学方法计算出的结果进行对比,如果差异明显,则说明原数据呈偏态分布或存在极值SPSS用于描述性统计分析的过程大部分都在分析—描述统计菜单中,另有一个在比较均值—均值菜单,虽然这几个过程用途不同,但是基本上都可以输出常用的指标结果。
一、分析—描述统计—频率此过程可以输出连续型变量集中趋势和离散趋势的主要指标,还可以输出判断分布的直方图、峰度值和偏度值,此外,该过程最主要的作用是输出频数表,结果举例如下:二、分析—描述统计—描述看起来似乎这个过程才是正统的描述统计分析过程,实际上该过程输出的内容并不多,也没有统计图可以调用,唯一特别的是该过程可以对数据进行标准化变换,并保存为新变量。
三、分析—描述统计—探索探索性分析是对原有数据进行描述性统计的基础上,更进一步的描述数据,和前两种过程相比,它能提供更详细的结果。
四、分析—描述统计—比率该过程主要用于对两个连续变量间的比率进行描述分析输出的结果比较简单,只是指标的汇总表格,在此略去五、分析—描述统计—交叉表分类变量的描述性统计比较简单,主要就是看频数分布和构成比,基本用交叉表一个过程就可以完成,该过程虽然放在描述统计中,但是由于功能丰富,也经常被用来做列联表的推断分析。
SPSS 教程 第三章 基本分析

描述性统计分析(Descriptive Statistics)统计分析往往是从了解数据的基本特征开始的。
描述数据分布特征的统计量可分为两类:一类表示数量的中心位置,另一类表示数量的变异程度(或称离散程度)。
两者相互补充,共同反映数据的全貌。
这些内容可以通过SPSS中的“Descriptive Statistics”菜单中的过程来完成。
1 频数分析 (Descriptive Statistics - Frequencies)频数分布分析主要通过频数分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征。
下面我们通过例子来学习单变量频数分析操作。
1) 输入分析数据在数据编辑器窗口打开“data1-2.sav”数据文件。
2)调用分析过程在主菜单栏单击“Analyze”,在出现的下拉菜单里移动鼠标至“Descriptive Statistics”项上,在出现的次菜单里单击“Frequencies”项,打开如图3-4所示的对话框。
图3-4 “Frequencies” 对话框3)设置分析变量从左则的源变量框里选择一个和多个变量进入“Variable(s):”框里。
在这里我们选“三化螟蚁螟 [虫口数]”变量进入“Variable(s):”框。
4)输出频数分布表Display frequency tables,选中显示。
5)设置输出的统计量单击“Statistics”按钮,打开图3-5所示的对话框,该对话框用于选择统计量:图3-5 “Statistics”对话框① 选择百分位显示“Percentiles Values”栏:Quartiles:四分位数,显示25%、50%和75%的百分位数。
Cut points for 10 equal groups:将数据平分为输入的10个等份。
Percentile(s)::用户自定义百分位数,输入值0—100之间。
选中此项后,可以利用“Add”、“Change”和“Remove”按钮设置多个百分位数。
SPSS 第03章 数据的描述

(=<22) 44 789999999 000001112333344444 55555677789999 000011111112223333333344444 5555666666777888889999 000111111112222222333444444 55555566678888888899999 0000000111123333 555666677888999999 000222233344 5566899 22 5
43
44
一般把因变量放在纵轴上.
鼠标点 击散点 图的任 意位置 不松手, 拖动即 可旋转 散点图.
45
二、计算基本统计量
• 定性变量(定序型和定类型变量):频数分析 • 定量变量(数值型变量):描述统计分析 • 菜单选项:【分析】-> 【描述统计】
46
1、频数分析
• 目的:通过频数分析,可以产生详细的频数分布 表和常用的图形,从中能够了解变量取值的状况 ,对把握数据的分布特征非常有用。
2、计算基本描述统计量
• 目的:计算基本描述性统计量,对数据的分布特
征有更准确的认识。 • 主要适用于:定量变量 • 基本描述统计量可分为三类:
刻画集中趋势的统计量:均值、中位数、众数; 刻画离散程度的统计量:全距、方差、标准差、 均值的标准误; 刻画分布形态的统计量:偏度、峰度。
53
1、刻画集中趋势的统计量 集中趋势是指一组数据向某一中心值靠拢的倾向。
37
简单散点图
38
重叠散点图
39
矩阵散点图
40
41
旋转后的3-D散点图
42
可选入一个分组变量,则表示按该变 量的不同取值将样本数据分成若干组, 并在一张图上分别以不同颜色绘制各 组数据的散点图. (可以省略)
SPSS课件第三章 基本统计分析功能

吸烟史 病例
吸烟 647 不吸烟 2 合计 649
男性 对照 622 27 649
合计 1269
29 1298
病例 41 19 60
女性 对照 28 32 60
合计 69 51 120
辽宁医学院
SPSS统计软件应用
温有锋
一、Report(数据汇总报告菜单)
OLAP Cubes即时汇总过程 Cases Summary数据汇总 Report Summaries in Rows行汇 总报告
Report Summaries in Columns 列汇总报告
辽宁医学院
SPSS统计软件应用
温有锋
1、Frequencies(频数分布分析 )
频数分布分析主要通过频数分布表、条形图 和直方图,以及集中趋势和离散趋势的各种 统计量,描述数据的分布特征;
利用频数分布表可以方便地对数据按组进行 归类整理,形成各变量的不同水平(分组) 的频数分布表和图形,以便对各变量的数据 的特征和观测量分布状况有一个概括的认识。
Quartiles(四分位数) Cut point for(将数据平分 为所设定的相等等分。2~ 100之间) Percentile(s)(用户自定义 百分位数)
辽宁医学院
SPSS统计软件应用
温有锋
Statistics
Central Tendency (中心趋势)
Mean(均值) Median(中位数) Mode(众数) Sum(总和)
reportolapcubes即时汇总过程casessummary数据汇总reportsummariesrows行汇总报告reportsummariescolumns列汇总报告descrptivestatistics描述性统计分析frequencies频数分析descrptive描述统计量分析explore探索分析crosstabs多维频数分布ratio比率统计分析frequencies利用频数分布表可以方便地对数据按组进行归类整理形成各变量的不同水平分组的频数分布表和图形以便对各变量的数据的特征和观测量分布状况有一个概括的认识
SPSS统计分析—描述性统计分析

Skewness
中位数 Median
方差
Variance
峰度
Kurtosis
众数
Mode
极小值
Minimum
和
Sum
极大值
Maximum
全距
Range
均值的标准 误差
S.E.mean
• 【Descriptive Statistics】子菜单
• ① Frequencies:产生变量值的频数分布表,并可计算常见 描述性统计量和绘制相对应的统计图。
• 执行【Analyze】/【Descriptive Statistics】/ 【Crosstabs】命令,弹出如图所示对话框
• 结果解读
1、列联表 2、卡方检验结果
3、条图
相对比描述——Ratio
• 在实际问题中,研究者有时除了希望了解变量自身的统计特 征,还希望得到两个变量相对比之间的统计描述。
适用范围:更适用于对分类变量以及不服从正态分布的连 续性变量进行描述。
• 学生身高频数表:已知有某地120名12岁男童身高数据,编 制其传统的简易频数表。
执行【Analyze】/【Descriptive Statistics】/ 【Frequencies】命令,弹出如下所示对话框
• 结果解读 1、频数表
每个格子中的理论频数T是在假定两组的发癌率相等(均等于两组 合计的发癌率)的情况下计算出来的,如第一行第一列的理论频数 为71*91/113=57.18,故卡方值越大,说明实际频数与理论频数的 差别越明显,两组发癌率不同的可能性越大。
2、卡方检验方法的适用条件
• 吸烟习惯与患病率的关系
调查339名50岁以上吸烟习惯与患慢性气管炎病的关系,如 上表所示。试问吸烟者与不吸烟者慢性气管炎患病率是否有 所不同。 ◆ 数据的预处理:WEIGHT CASE
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.1.1 频数分析的基本原理
图3-14 【描述性】对话框
Step 02 在左侧的候选变量列表框中选择“male”和 “female”变量,将其添加至【变量】列表框中,表示它是 进行描述性统计分析的变量,如图3-15所示。
图3-15 选择分析变量
Step 03 单击【选项】按钮,其主要目的是选择需要输出 的描述性统计量,这里除了选择系统默认的统计量外,还勾 选了范围、偏度系数和峰度系数复选框;再单击【继续】按 钮,返回【描述性】对话框,如图3-16所示。 Step 04 单击【确定】按钮完成操作。
图3-13 【描述:选项】对话框
Step 04 在【描述性】对话框中,勾选【将标准化得分另 存为变量】复选框,表示对所选择的每一个变量进行标准化 处理,同时产生相应的Z得分,并作为新变量保存到数据窗 口中。
Step 05 单击【Bootstrap】按钮,弹出如图3-5所示的 【Bootstrap】对话框,在此对话框中可以进行均值、标准 差、方差、偏度和峰度的Bootstrap估计。
图3-17 【探索】对话框
Step 02 在对话框左侧的候选变量列表框中选取一个或多 个待分析变量,将它们移入右侧的【因变量列表】列表框中 ,表示要进行探索性分析的变量。 Step 03 在候选变量列表框中可以选取一个或多个分组变 量,将它们移入右侧的【因子列表】列表框中。分组变量的 选择可以将数据按该变量中的观测值进行分组分析。如果选 择的分组变量不止一个,那么会以分组变量的不同取值进行 组合分组。
Step 04 从候选变量列表框中选择一个变量作为标识变量 ,并将其移入【标注个案】列表框中。选择标识变量的作用 在于,当系统在数据探索过程中发现异常值时,便可利用标 识变量加以标记,以便于用户找这些异常值。如果不选择它 ,系统默认以ID变量作为标识变量。
Step 06 在【探索】对话框下面的【输出】选项组中可 以选择以下输出项。
SPSS中的探索过程用于计算指定变量的探索性统计量和 有关的图形。它既可以对观测量整体分析,也可以进行分组 分析。从这个过程可以获得箱线图、茎叶图、直方图、各种 正态检验图、频数表、方差齐性检验等结果,以及对非正态 或正态非齐性数据进行变换,并表明和检验连续变量的数值 分布情况。
Step 01 选择菜单栏中的【分析】→【描述统计】→ 【探索】命令,弹出【探索】对话框,如图3-17所示, 该对话框是探索性分析的主操作窗口。
图3-5 【Bootstrap】对话框
Step 07 单击【确定】按钮结束操作,SPSS软件自动 输出结果。
假设某公司每周大约卖出2000万件产品,但市场的需求不
稳定,该公司的生产经理想更好的掌握近期该产品的分布情 况。假设下面给出的销售数字(单位:百万)代表近期公司 该产品每周的销售数据。利用频数分析你能得到什么有助于 生产及销售的的信息?
女演员:50 44 35 80 26 28 41 21 61 38 49 33 74 30 33 41 31 35 41 42 37 26 34 34 35 26 61 60 34 24 30 37 31 27 39 34
Step 01 打开随书光盘中的数据文件3-2.sav,其中 “male”和“female”列分别表示男演员和女演员;选择 菜单栏中的【分析】→【描述性统计】→【描述】命令,弹 出【描述性】对话框,如图3-14所示。
百分百 有效百分比 累积百分比
2.6
2.6
2.6
7.9
7.9
10.5
5.3
5.3
15.8
2.6
2.6
18.4
7.9
7.9
26.3
15.8 15.8
42.1
10.5 10.5
52.6
13.2 13.2
65.8
7.9
7.9
73.7
7.9
7.9
81.6
10.5 10.5
92.1
5.3
5.3
97.4
2.6
2.6
Valid N (listwise
)
36
3.3.1 探索性分析的基本原理
1.使用目的 探索性数据分析(Exploratary Data Analysis,
简称EDA)的基本思想是从数据本身出发,不拘泥于模 型的假设而采用非常灵活的方法来探讨数据分布的大 致情况,也可以为进一步结合模型的研究提供线索, 为传统的统计推断提供良好的基础和减少盲目性。
Step 01 选择菜单栏中的【分析】→【描述统计】→【描 述】命令,弹出【描述性】对话框,如图3-12所示,该对话 框是描述性统计分析的主操作窗口。
图3-12 【描述】对话框
Step 02 在左侧的候选变量列表框中选取一个或多个待分 析变量,将它们移入右侧的【变量】列表框中。 Step 03 单击【选项】按钮,弹出如图3-13所示的【描 述:选项】对话框,该对话框用于指定输出的描述性统计 量。这些统计量的含义是:均数、总和、标准差、方差、 全距、最小值)、最大值、标准误差、峰度系数和偏度系 数。
Step 06 单击【确定】按钮结束操作,SPSS软件自动输 出结果。
请你分析不同性别演员获得奥斯卡奖的年龄差异性。
男演员:32 37 36 32 51 53 33 61 35 45 55 39 76 37 42 40 32 60 38 56 48 48 40 43 62 43 42 44 41 56 39 46 31 47 45 60
单击【统计量】按钮,弹出如图3-2所示的【频率: 统计量】对话框,该对话框主要用于输出各类基本统计 量结果。
图3-2 【频率:统计量】对话框
单击【图表】按钮,弹出如图3-3所示的【频率:图 表】对话框,该对话框主要用于输出图形结果。
图3-3 【频率:图表】对话框
Step 05 单击图3-1中的【格式】按钮,弹出如图3-4 所示的【频率:格式】对话框,在此对话框中可以设 置频数表输出的格式。
100.0
100.0 100.0
(3)直方图
3.2.1 描述统计分析的基本原理
1.使用目的 2.刻画集中趋势的描述统计量 3.刻画离散程度的描述统计量 4.刻画分布形态的描述统计量
描述过程过程是连续资料统计描述应用最多的一个过程, 它可对变量进行描述性统计分析计算,并列出一系列相应的 统计指标。这和其他过程相比并无不同。但该过程还有个特 殊功能,就是可将原始数据转换成标准化值,并以变量的形 式保存。
图3-6 【频率】对话框
Step 02 在左侧的候选变量列表框中选择“sale”变量,将 其添加至【变量】列表框中,表示它是进行频数分析的变量, 如图3-7所示。
图3-7 选择分析变量
Step 03 单击【统计量】按钮,弹出如图3-8所示的【频率: 统计量】对话框;勾选【四分位数】复选框,要求输出四分 数,然后单击【继续】按钮,返回【频率】对话框。
(1)采用重抽样技术从原始样本中抽取一定数量(自 己给定)的样本,此过程允许重复抽样。
(2)根据抽出的样本计算给定的统计量T。
(3)重上述N次(一般大于1000),得到N个统计量 T。
(4) 计算上述N个统计量T的样本值,最终得到统计 量的估计值。
Step 01 选择菜单栏中的【分析】→【描述统计】→ 【频率】命令,弹出【频率】对话框,如图3-1所示,这 是频数分析的主操作窗口。
两者都:输出图形以及描述性统计量。 统计量:只输出描述统计量。 图:只输出图形。 Step 07 在【探索】对话框中还可以点选【统计量】单 选钮,这个选项提供了各类基本描述性统计输出结果;
图3-18 【探索:统计量)】对话框
Step 07 在【探索】对话框中还可以点选【绘制】单选钮, 它提供了图形输出类型。
图3-4 【频率:格式】对话框
Step 06 单击图3-1中的【Bootstrap】按钮,弹出如图3-5 所示的【Bootstrap】对话框,在此对话框中可以进行下述 统计量的Bootstrap估计。 支持均值、标准差、方差、中位数、偏度、峰度和百分位 数的Bootstrap估计。 支持百分比的Bootstrap估计。
频数分析基本统计结果
N Percentiles
有效 缺失 25 50 75
38 0 18.00 20.00 23.00
(2)频数分析表输出
14 15 16 17 18 19 有 20 效 21 22 23 24 26 27 Tot al
频率 1 3 2 1 3 6 4 5 3 3 4 2 1
38
频数分析表
图3-16 选择输出图形类型
男演员
N 全距 极小值 极大值 均值 标准差
偏度
峰度
统计量 统计量 统计量 统计量 统计量 统计量 统计量 标准误 统计量 标准误
36 45 31 76 45.14 10.406 0.898 0.393 0.704 0.768
女演员
36 59 21 80 38.94 13.546 1.503 0.393 2.111 0.768
图3-8 选择输出统计量
Step 04 单击【图表】按钮,弹出如图3-9所示的【频率:图 表】对话框,由于该数据属于数值型,因此点选【条形图】 单选钮,表示结果输出条形图;再单击【继续】按钮,返回 【频率】对话框。
图3-9 选择输出图形类型
Step 05 单击【确定】按钮完成操作。 (1)基本统计结果输出
24 18 18 26 24 23 16 18 21 20 21 24 19 19 14 22 21 26 27 15 19 17 20 20 19 22 23 16 23 21 15 19 21 20 22 15 24 19