数据分析方法及软件应用 基本统计分析PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
•居民储蓄调查数据.sav
32
数据拆分操作
33
34
输出结果
35
2.4.3 交叉分组下的频数分析
• 目的和任务 • 交叉列联表的主要内容 • 交叉列联表行列变量间关系的分析 • 基本操作 • 应用举例 • SPSS中列联表分析的其他方法
36
问题描述
• 假定从A地铁站到B地铁站共有三条路径可以选 择,三条路径的行车时间、等待时间和换乘次数 有所差异。
• 问题:分析乘客的性别、年龄、职业、家庭收入 等因素对其选择三条路径的影响。
3
2.4 SPSS基本统计分析
2.4.1 频数分析 2.4.2 计算基本描述统计量 2.4.3 交叉分组下的频数分析(重点) 2.4.4 多选项分析(自学) 2.4.5 比率分析(自学) 2.4.6 探索性分析(自学)
4
2.4.1 频数分析
• 频数分析的目的和基本任务 • 频数分析的基本操作 • 频数分析的应用举例
28
上节频数分析中 -- 统计量对话框
势集 栏中
趋
离散趋势
分布形态栏29
2) 基本描述统计量的操作
(1) 选择菜单分析Analyze——描述统计 Descriptive Statistics——描述Descriptives,出现 如下窗口:
30
基本统计量
分布
当Variables框中有多个变量 时,此框确定其输出顺 序:
• (1) 选择菜单分析Analyze——描述统计 Descriptive Statistics——频率Frequencies。
• (2) 将若干频数分析变量选择到变量Variable(s) 框中。
• (3) 单击图表Chart按钮选择绘制统计图形,在图 表值Chart Values框中选择条形图中纵坐标(或 饼图中扇形面积)的含义,其中Frequencies表 示频数;Percentages表示百分比。
居民储蓄调查数据.sav
11
户口的基本情况-操作
12
户口的基本情况-输出结果
13
职业的基本情况 -- 操 作
14
职业的基本情况-输出结果
15
职业的基本情况-输出结果
16
目标二:分析储户一次存款金额的分布,并对城 镇储户和农村储户进行比较。
1、分析思路: (1)由于存(取)款金额数据为定距型变量,直 接采用频数分析不利于对其分布形态的把握,因 此考虑依据第三章中的数据分组功能对数据分组 后再编制频数分布表。 (2)进行数据拆分,并分别计算城镇储户和农村 储户的一次存(取)款金额的四分位数,并通过 四分位数比较两者分布上的差异。
数据分析方法及软件应用
授课教师:赵晖 副教授 2015年5月
1
第一部分
整体概述
THE FIRST PART OF THE OVERALL OVERVIEW, PLEASE SUMMARIZE THE CONTENT
2
wenku.baidu.com
基本统计分析
2.1 SPSS简介 2.2 SPSS数据的管理 2.3 SPSS数据的预处理 2.4 SPSS基本统计分析
9
3) 频数分析的应用举例
• 利用居民储蓄调查数据进行频数分析,有以下两 个分析目标:
• 目标一:分析储户的户口和职业的基本情况。 • 目标二:分析储户一次存款金额的分布,并对城
镇储户和农村储户进行比较。
10
目标一:分析储户的户口和职业的基本情况
(1)户口和职业两个变量都是定类变量,可通过基本频 数分析实现。 (2)职业变量的取值(分类)数目较多,为使频数分布 表更一目了然,应对内容的输出顺序进行调整,单击格式 Format按钮,选择Descending counts按频数的降序输出。 (3)单击图形Chart按钮指定输出户口变量的饼图和职业 变量的条形图。
5
1) 频数分析的目的和基本任务
1、目的:基本统计分析往往从频数分析开始。通 过频数分析能够了解变量取值的状况,对把握数 据的分布特征是非常有用的。
2、基本任务 •(1) 频数分析的第一个基本任务是编制频数分布 表; •(2) 频数分析的第二个任务是绘制统计图:条形 图、饼图、直方图。
6
2) 频数分析的基本操作
18
• 居民储蓄调查数据.sav
存款金额分布-数据分组操作
19
分组结果
存款金额分布-频数分布操作
20
存款金额分布-输出结果
21
存款金额城乡比较-数据拆分操作
• 居民储蓄调查数据.sav
22
存款金额城乡比较 -- 四分位数操作
数据拆分结果:数据按户口进行了排序,且后面的操 作都是按拆分变量的不同组分别进行分析计算。
23
城乡比较 -- 数据拆分后的输出结果
24
恢复全部数据的分析
25
未拆分的数据输出结果
26
2.4.2 计算基本描述统计量
• 基本描述统计量 • 基本描述统计量的基本操作 • 基本描述统计量的应用举例
27
4.2.1 基本描述统计量
• 常见的基本描述统计量有三大类:
• 刻画集中趋势的统计量 • 刻画离散程度的统计量 • 刻画分布形态的统计量
7
数据加工(职工数据).sav
8
(输出)统计量对话框
输出百分位数:
•输出四分位数,显示25%、50%、
75%的百分位数; •将数据平均分为所设定的相等等 份,可输入2—100 的整数,如键
集 中
入4则输出第25、50、75百分位数
趋
•自定义百分位数,可输入0—100 的整数。
势 栏
离散趋势 分布形态栏
17
2、分析过程:
(1)数据分组,将存(取)款金额重新分成五组, 五组区间分布为,少于500元,500~2000元, 2000~3500元,3500~5000元,5000元以上。分 组后进行频数分析并绘制带正态曲线的直方图。
(2)利用SPSS的频数分析计算所有样本的存 (取)款金额的四分位数;然后,按照户口类型 对数据进行拆分(Split file)并重新计算分位数, 分别得到城镇户口和农村户口的存(取)款金额 的四分位数。
• 按Variables框中的排列 顺序输出
• 按各变量的字母顺序输 出
• 按均值的升序排列 • 按均值的降序排列
选项对话框
31
3) 应用举例
1. 利用居民储蓄调查数据,对一次存款金额变量 计算基本描述统计量。有以下分析目标:计算存 款金额的基本描述统计量,并分别对城镇储户和 农村储户进行比较 •分析:首先按照户口对数据进行拆分(Split file),然后计算存(取)款金额的基本描述统计 量。
32
数据拆分操作
33
34
输出结果
35
2.4.3 交叉分组下的频数分析
• 目的和任务 • 交叉列联表的主要内容 • 交叉列联表行列变量间关系的分析 • 基本操作 • 应用举例 • SPSS中列联表分析的其他方法
36
问题描述
• 假定从A地铁站到B地铁站共有三条路径可以选 择,三条路径的行车时间、等待时间和换乘次数 有所差异。
• 问题:分析乘客的性别、年龄、职业、家庭收入 等因素对其选择三条路径的影响。
3
2.4 SPSS基本统计分析
2.4.1 频数分析 2.4.2 计算基本描述统计量 2.4.3 交叉分组下的频数分析(重点) 2.4.4 多选项分析(自学) 2.4.5 比率分析(自学) 2.4.6 探索性分析(自学)
4
2.4.1 频数分析
• 频数分析的目的和基本任务 • 频数分析的基本操作 • 频数分析的应用举例
28
上节频数分析中 -- 统计量对话框
势集 栏中
趋
离散趋势
分布形态栏29
2) 基本描述统计量的操作
(1) 选择菜单分析Analyze——描述统计 Descriptive Statistics——描述Descriptives,出现 如下窗口:
30
基本统计量
分布
当Variables框中有多个变量 时,此框确定其输出顺 序:
• (1) 选择菜单分析Analyze——描述统计 Descriptive Statistics——频率Frequencies。
• (2) 将若干频数分析变量选择到变量Variable(s) 框中。
• (3) 单击图表Chart按钮选择绘制统计图形,在图 表值Chart Values框中选择条形图中纵坐标(或 饼图中扇形面积)的含义,其中Frequencies表 示频数;Percentages表示百分比。
居民储蓄调查数据.sav
11
户口的基本情况-操作
12
户口的基本情况-输出结果
13
职业的基本情况 -- 操 作
14
职业的基本情况-输出结果
15
职业的基本情况-输出结果
16
目标二:分析储户一次存款金额的分布,并对城 镇储户和农村储户进行比较。
1、分析思路: (1)由于存(取)款金额数据为定距型变量,直 接采用频数分析不利于对其分布形态的把握,因 此考虑依据第三章中的数据分组功能对数据分组 后再编制频数分布表。 (2)进行数据拆分,并分别计算城镇储户和农村 储户的一次存(取)款金额的四分位数,并通过 四分位数比较两者分布上的差异。
数据分析方法及软件应用
授课教师:赵晖 副教授 2015年5月
1
第一部分
整体概述
THE FIRST PART OF THE OVERALL OVERVIEW, PLEASE SUMMARIZE THE CONTENT
2
wenku.baidu.com
基本统计分析
2.1 SPSS简介 2.2 SPSS数据的管理 2.3 SPSS数据的预处理 2.4 SPSS基本统计分析
9
3) 频数分析的应用举例
• 利用居民储蓄调查数据进行频数分析,有以下两 个分析目标:
• 目标一:分析储户的户口和职业的基本情况。 • 目标二:分析储户一次存款金额的分布,并对城
镇储户和农村储户进行比较。
10
目标一:分析储户的户口和职业的基本情况
(1)户口和职业两个变量都是定类变量,可通过基本频 数分析实现。 (2)职业变量的取值(分类)数目较多,为使频数分布 表更一目了然,应对内容的输出顺序进行调整,单击格式 Format按钮,选择Descending counts按频数的降序输出。 (3)单击图形Chart按钮指定输出户口变量的饼图和职业 变量的条形图。
5
1) 频数分析的目的和基本任务
1、目的:基本统计分析往往从频数分析开始。通 过频数分析能够了解变量取值的状况,对把握数 据的分布特征是非常有用的。
2、基本任务 •(1) 频数分析的第一个基本任务是编制频数分布 表; •(2) 频数分析的第二个任务是绘制统计图:条形 图、饼图、直方图。
6
2) 频数分析的基本操作
18
• 居民储蓄调查数据.sav
存款金额分布-数据分组操作
19
分组结果
存款金额分布-频数分布操作
20
存款金额分布-输出结果
21
存款金额城乡比较-数据拆分操作
• 居民储蓄调查数据.sav
22
存款金额城乡比较 -- 四分位数操作
数据拆分结果:数据按户口进行了排序,且后面的操 作都是按拆分变量的不同组分别进行分析计算。
23
城乡比较 -- 数据拆分后的输出结果
24
恢复全部数据的分析
25
未拆分的数据输出结果
26
2.4.2 计算基本描述统计量
• 基本描述统计量 • 基本描述统计量的基本操作 • 基本描述统计量的应用举例
27
4.2.1 基本描述统计量
• 常见的基本描述统计量有三大类:
• 刻画集中趋势的统计量 • 刻画离散程度的统计量 • 刻画分布形态的统计量
7
数据加工(职工数据).sav
8
(输出)统计量对话框
输出百分位数:
•输出四分位数,显示25%、50%、
75%的百分位数; •将数据平均分为所设定的相等等 份,可输入2—100 的整数,如键
集 中
入4则输出第25、50、75百分位数
趋
•自定义百分位数,可输入0—100 的整数。
势 栏
离散趋势 分布形态栏
17
2、分析过程:
(1)数据分组,将存(取)款金额重新分成五组, 五组区间分布为,少于500元,500~2000元, 2000~3500元,3500~5000元,5000元以上。分 组后进行频数分析并绘制带正态曲线的直方图。
(2)利用SPSS的频数分析计算所有样本的存 (取)款金额的四分位数;然后,按照户口类型 对数据进行拆分(Split file)并重新计算分位数, 分别得到城镇户口和农村户口的存(取)款金额 的四分位数。
• 按Variables框中的排列 顺序输出
• 按各变量的字母顺序输 出
• 按均值的升序排列 • 按均值的降序排列
选项对话框
31
3) 应用举例
1. 利用居民储蓄调查数据,对一次存款金额变量 计算基本描述统计量。有以下分析目标:计算存 款金额的基本描述统计量,并分别对城镇储户和 农村储户进行比较 •分析:首先按照户口对数据进行拆分(Split file),然后计算存(取)款金额的基本描述统计 量。