《用图表展示数据》PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
▪ 直方图可观察一组数据的分布状况,但没有给出具体的 数值
▪ 茎叶图既能给出数据的分布状况,又能给出每一个原始 数值,保留了原始数据的信息
▪ 直方图适用于大批量数据,茎叶图适用于小批量数据
July 30, 2010
用SPSS绘制茎叶图和箱线图 (包括直方图)
第1步:选择【Analyze】下拉菜单,并选择
定性数据的描述统计量
1. 频数(frequency) :落在各类别中的数据个 数
2. 比例(proportion) :某一类别数据个数占全 部数据个数的比值
3. 百分比(percentage) :将对比的基数作为 100而计算的比值
4. 比率(ratio) :不同类别数值个数的比值
July 30, 2010
例如,本例最大值为237,最小值为141,组
距=(237-141)÷10=9.6。为便于计算,组距宜取5或
10的倍数,且第一组的下限应低于最小变量值,最后
一组的上限应高于最大变量值,因此组距可取10
3. 统计出各组的频数。每个组的数据满足a<xb(上限值
不在内
July 30, 2010
分组中的几个概念
July 30, 2010
使用Excel数据透视表数计数
(pivot table)
第1步:选择【数据】菜单中的【数据透视表和数据透视 图】
第2步:确定数据源区域
第4步:在【向导—3步骤之3】中选择数据透视表的输出 位置
。然后选择【布局】
第5步:在【向导—布局】对话框中,依次将“分类变量 “(这里
July 30, 2010
第 2 章 用图表展示数据
2.1 用图表展示定性数据
2.1.1 生成频数分布表 2.1.2 定性数据的图示
2.1 用图表展示定性数 据
2.1.1 生成频数分布表
生成频数分布表
(定性数据)
1. 列出各类别 2. 计算各类别的频数 3. 生成频数分布表
☺☺☺ ☺☺
分类 A B C
2.2.1 生成频数分布表 2.2.2 定量数据的图示
2.1 用图表展示定性数 据
2.2.1 生成频数分布表
【例】某电脑 公 司 2008 年 前 4个月各天的 销售量数据( 单位:台)。 生成一张频数 分布表观察销 售额分布的特 征
July 30, 2010
生成频数分布表
(例题分析)
生成频数分布表
1. 下限(lower limit) :一个组的最小值 2. 上限(upper limit) :一个组的最大值 3. 组距(class width) :上限与下限之差 4. 组中值(class midpoint) :下限与上限之间的中点值
July 30, 2010
下限值+上限值 组中值 =
2
July 30, 2010
未分组数据看分布—茎叶图
(例题分析)
• 第一列给出每个 茎上叶子的频数
• 第二列是“茎”, 第三列是“叶”
• 下面标出了1个 极 端 值 237 、 茎 的 宽 度 10 、 每 个 叶代表一个数据 (案例)
• SPSS自动 将每个 茎重复了一次, 使分布的细节看 的更清楚一些。 当然,在数据较 少时茎的数值也 可以不重复
3. 条形图主要用于展示定性数据,而直方图则主要用于展示定量数据
July 30, 2010
未分组数据看分布—茎叶图
(stem-and-leaf plot)
1. 用于显示未分组的原始数据的分布 2. 由“茎”和“叶”两部分构成,其图形是由数字组
成的 3. 以该组数据的高位数值作树茎,低位数字作树叶 4. 树叶上只保留最后一位数字 6. 茎叶图类似于横置的直方图,但又有区别
【Descriptive statistics-
Explore】
选项进入主对话框
第2步:在主对话框中将变量选入【Variables】,
【Stem-
点击【Plots】,在对话框中选择
and-leaf】(根据需要可选
【Histogram】以
给出直方图用)S。PS点S绘击制【茎Co叶nt图inue】
回到主对话 July 30, 2010
July 30, 2010
男学生更容易逃课吗?
逃课情况
男
几乎一次不逃
28
1到3次
24
3到5次
6
5次以上
3
其他
1
合计
62
女
合计
49
77
31
55
4
10
3
6
2
3
89
151
你认为男学生更容易逃课吗?用哪些简单的统计描述支持你的看法?如果 要用图形表现上面的数据,反映男女学生逃课方面的差异、逃课次数的构 成以及男女学生在逃课方面是否具有相似性等等,有哪些图形可供你选择 使用呢?
第 2 章 用图表展示数 据
2.1 用图表展示定性数据 2.2 用图表展示定量数据 2.3 合理使用图表
男学生更容易逃课吗?
➢ 读完四年大学,一次课也没有逃过,这样的学 生恐怕不多。2004年5月,中国人民大学财政金 融学院的3名学生就逃课问题做了一次调查。调 查的对象是财政金融学院的大一,大二,大三 本科生。样本的抽取方式是分层抽样与简单随 机抽样结合,先根据年级划分层次,然后对各 个班级简单随机抽样,共抽取151名学生组成一 个样本,并对每个学生采用问卷调查。问卷内 容包括每周逃课次数、所逃课程的类型(选修 课、专业课等等)和逃课原因等。调查得到的 男女学生每周平均逃课次数的汇总表如下
【例】 从某 大学经济管理 专业二年级学 生中随机抽取 11 人 , 对 8 门 主要课程的考 试成绩进行调 查,所得结果 如表。试绘制 各科考试成绩 的批比较箱线 图,并分析各 科考试成绩的 分布特征
July 30, 2010
环形图
(doughnut chart )
北京、上海和天津地区按收入法计算的地区生产总值
31% 25%
36%
32% 36% 44%
July 30, 2010
16%
15% 17% 14%
18% 16%
劳动者报酬 生产税净额 固定资产折旧 营业盈余
第 2 章 用图表展示数据
2.2 用图表展示定量数据
频数
比例
百分比 比率
D
E
July 30, 2010
生成频数分布表
(定性数据)
【例】一家市场调查公 司为研究不同类型饮料 的市场占有率,对随机 抽取的一家超市进行调 查。下面的表是调查员 随机观察的50名顾客购 买的饮料类型记录。生 成一张频数分布表,观 察不同类型饮料的销售 分布状况
用Excel制作频数分布表
2.1 用图表展示定性数 据
2.1.2 定性数据的图示
条形图
(bar Chart)
1. 用宽度相同 的条形的高 度或长短来 表示各类别 数据
2. 各类别可放
在纵轴,称
为条形图,
可以放在横
轴,称为柱
形
图
(column
chart)
July 30, 2010
频数
16
15
12
10
8
6
11 8
4
0 果汁 矿泉水 碳酸饮料 绿茶
的角度来表示数值
其他 16%
大小的图形,主要
用于表示一个样本
(或总体)中各组成 绿茶 部分的数据占全部 22%
数据的比例
用于研究结构问题
果汁 12%
矿泉水 20%
碳酸饮料 30%
July 30, 2010
环形图
(doughnut chart)
1. 环形图中间有一个“空洞”,样本或 总体中的每一部分数据用环中的一段 表示
▪ 使用统计函数【FREQUENCY】创建频数分布表和直方 图可解决这一问题。具体步骤是
• 选择与接受区域相临近的单元格区域,作为频数分布表 输出的区域
• 选择统计函数中的【FREQUENCY】函数 • 在 对 话 框【Date-array】 后 输入 数据 区 域 , 在【Bins-
array】后输入接受区域 • 同时按下“ctrl-shift-Enter”组合键,即得到频数分
是饮料品牌)连续拖放两次:一次拖至左边
的“行”区域
,一次拖至 “数据”区域
第6步:用然数后据单透击【视确表定产】生,定自性动数返据回【的向频导数—分3步布骤之3】
对
July 30, 2010
话框。然后单击【完成】,即可输出数据透
生成频数分布表
(定性数据)
不同类型饮料的频数分布
July 30, 2010
2. 与饼图类似,但又有区别
饼图只能显示一个总体各部分所占的比 例
环形图则可以同时绘制多个样本或总体 的数据系列,每一个样本或总体的数据 系列为一个环
3. 用于结构比较研究
July 30, 2010
环形图
(doughnut chart)
【例】2006年北京、上海和天津地区按收入法计算 的地区生产总值(按当年价格计算)数据。绘制环形 图比较三个地区的生产总值构成
4 6 8 10 12
Median/Quart./Range箱线图
July 30, 2010
未分组数据看分布—箱线图
(例题分析)
最小值 141
25%四分位数 中位数 75%四分位数
170.25
182
197
最大值 237
140 150 160 170 180 190 200 210 220
某电脑公司销售额数据的 Median/Quart./Rang箱线图
(例题分析)
1. 确定组数:组数的确定应以能够显示数据的分布特征 为目的。在实际分组时,组数一般为5K 15。本例 中由于数据较多,可考虑分为10组
2. 确定组距:组距(Class Width)是一个组的上限与下 限之差,可根据全部数据的最大值和最小值及所分的 组数来确定,即
值)÷ 组数
组距=( 最大值 - 最小
上的两个分位数值
3. 绘制方法
首先找出一组数据的5个特征值,即最大值、最小值、中
位数Me和两个四分位数(下四分位数QL和上四分位数QU)
连接两个四分位数画出箱子,再将两个极值点与箱子相 连接
July 30, 2010
未分组数据看分布—箱线图
(箱线图的构成)
X Min Q 25% 中位数 Q 75% XMax
未分组数据看分布—箱线图
(box plot)
1. 用于显示未分组的原始数据的分布 2. 箱线图是由一组数据的最大值(maximum)、最小值
(minimum) 、 中 位 数 (median) 、 两 个 四 分 位 数 (quartiles)这5个值绘制而成的
中位数是一组数据排序后处于中间位置上的变量值 四分位数是一组数据排序后处在数据25%位置和75%位置
饮料类型
其他
帕累托图
(pareto chart)
1. 按 各 类 别 数据出现 的频数多 少排序后 绘制的柱 形图
2. 用 于 展 示 分类数据 的分布
频数
16
15
12
11 10
8
8
6
4
0 碳酸饮料
绿茶
矿泉水 饮料类型
其他
果汁
July 30, 2010
饼图
(pie Chart)
1. 用圆形及圆内扇形
用SPSS绘制直方图
分组数据看分布—直方图
(SPSS绘制的直方图)
July 30, 2010
分组数据看分布—直方图
(直方图与条形图的区别)
1. 条形图中wenku.baidu.com每一矩形表示一个类别,其宽度没有意义,而直方图的宽度则表 示各组的组距
2. 由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是 分开排列
用Excel制作频数分布
生成频数分布表
(例题分析)
某电脑公司销售额的频数分布
July 30, 2010
生成频数分布表
(例题分析—使用开口组)
July 30, 2010
使用Excel频数函数 (FREQUENCY)
▪ Excel的【直方图】工具的缺陷是:频数分布及直方 图没有与数据链接,当改变任何一个数据时,频数 分布表和直方图不会跟着改变
的频数就形成了一个矩形,即直方图 4. 直方图下的总面积等于1
July 30, 2010
用Excel制作直方图
用SPSS绘制直方图
第1步:选择【Graphs】下拉菜单,并选择
框
【histogram】选项进入主对话
第2步:在主对话框中将变量选入【Variables】
,点击【OK】
July 30, 2010
July 30, 2010
分布的形状与箱线图
左偏分布
Left-skewed distribution
July 30, 2010
对称分布
Bell-shaped distribution
不同分布的箱线图
右偏分布
Right-skewed distribution
未分组数据看分布—多批数据箱线图 (例题分析)
布
统计函数—FREQUENCY
July 30, 2010
2.1 用图表展示定性数 据
2.2.2 定量数据的图示
Excel
分组数据看分布—直方图
(histogram)
1. 用于展示分组数据分布的一种图形 2. 用矩形的宽度和高度来表示频数分布
本质上是用矩形的面积来表示频数分布 3. 在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应
▪ 茎叶图既能给出数据的分布状况,又能给出每一个原始 数值,保留了原始数据的信息
▪ 直方图适用于大批量数据,茎叶图适用于小批量数据
July 30, 2010
用SPSS绘制茎叶图和箱线图 (包括直方图)
第1步:选择【Analyze】下拉菜单,并选择
定性数据的描述统计量
1. 频数(frequency) :落在各类别中的数据个 数
2. 比例(proportion) :某一类别数据个数占全 部数据个数的比值
3. 百分比(percentage) :将对比的基数作为 100而计算的比值
4. 比率(ratio) :不同类别数值个数的比值
July 30, 2010
例如,本例最大值为237,最小值为141,组
距=(237-141)÷10=9.6。为便于计算,组距宜取5或
10的倍数,且第一组的下限应低于最小变量值,最后
一组的上限应高于最大变量值,因此组距可取10
3. 统计出各组的频数。每个组的数据满足a<xb(上限值
不在内
July 30, 2010
分组中的几个概念
July 30, 2010
使用Excel数据透视表数计数
(pivot table)
第1步:选择【数据】菜单中的【数据透视表和数据透视 图】
第2步:确定数据源区域
第4步:在【向导—3步骤之3】中选择数据透视表的输出 位置
。然后选择【布局】
第5步:在【向导—布局】对话框中,依次将“分类变量 “(这里
July 30, 2010
第 2 章 用图表展示数据
2.1 用图表展示定性数据
2.1.1 生成频数分布表 2.1.2 定性数据的图示
2.1 用图表展示定性数 据
2.1.1 生成频数分布表
生成频数分布表
(定性数据)
1. 列出各类别 2. 计算各类别的频数 3. 生成频数分布表
☺☺☺ ☺☺
分类 A B C
2.2.1 生成频数分布表 2.2.2 定量数据的图示
2.1 用图表展示定性数 据
2.2.1 生成频数分布表
【例】某电脑 公 司 2008 年 前 4个月各天的 销售量数据( 单位:台)。 生成一张频数 分布表观察销 售额分布的特 征
July 30, 2010
生成频数分布表
(例题分析)
生成频数分布表
1. 下限(lower limit) :一个组的最小值 2. 上限(upper limit) :一个组的最大值 3. 组距(class width) :上限与下限之差 4. 组中值(class midpoint) :下限与上限之间的中点值
July 30, 2010
下限值+上限值 组中值 =
2
July 30, 2010
未分组数据看分布—茎叶图
(例题分析)
• 第一列给出每个 茎上叶子的频数
• 第二列是“茎”, 第三列是“叶”
• 下面标出了1个 极 端 值 237 、 茎 的 宽 度 10 、 每 个 叶代表一个数据 (案例)
• SPSS自动 将每个 茎重复了一次, 使分布的细节看 的更清楚一些。 当然,在数据较 少时茎的数值也 可以不重复
3. 条形图主要用于展示定性数据,而直方图则主要用于展示定量数据
July 30, 2010
未分组数据看分布—茎叶图
(stem-and-leaf plot)
1. 用于显示未分组的原始数据的分布 2. 由“茎”和“叶”两部分构成,其图形是由数字组
成的 3. 以该组数据的高位数值作树茎,低位数字作树叶 4. 树叶上只保留最后一位数字 6. 茎叶图类似于横置的直方图,但又有区别
【Descriptive statistics-
Explore】
选项进入主对话框
第2步:在主对话框中将变量选入【Variables】,
【Stem-
点击【Plots】,在对话框中选择
and-leaf】(根据需要可选
【Histogram】以
给出直方图用)S。PS点S绘击制【茎Co叶nt图inue】
回到主对话 July 30, 2010
July 30, 2010
男学生更容易逃课吗?
逃课情况
男
几乎一次不逃
28
1到3次
24
3到5次
6
5次以上
3
其他
1
合计
62
女
合计
49
77
31
55
4
10
3
6
2
3
89
151
你认为男学生更容易逃课吗?用哪些简单的统计描述支持你的看法?如果 要用图形表现上面的数据,反映男女学生逃课方面的差异、逃课次数的构 成以及男女学生在逃课方面是否具有相似性等等,有哪些图形可供你选择 使用呢?
第 2 章 用图表展示数 据
2.1 用图表展示定性数据 2.2 用图表展示定量数据 2.3 合理使用图表
男学生更容易逃课吗?
➢ 读完四年大学,一次课也没有逃过,这样的学 生恐怕不多。2004年5月,中国人民大学财政金 融学院的3名学生就逃课问题做了一次调查。调 查的对象是财政金融学院的大一,大二,大三 本科生。样本的抽取方式是分层抽样与简单随 机抽样结合,先根据年级划分层次,然后对各 个班级简单随机抽样,共抽取151名学生组成一 个样本,并对每个学生采用问卷调查。问卷内 容包括每周逃课次数、所逃课程的类型(选修 课、专业课等等)和逃课原因等。调查得到的 男女学生每周平均逃课次数的汇总表如下
【例】 从某 大学经济管理 专业二年级学 生中随机抽取 11 人 , 对 8 门 主要课程的考 试成绩进行调 查,所得结果 如表。试绘制 各科考试成绩 的批比较箱线 图,并分析各 科考试成绩的 分布特征
July 30, 2010
环形图
(doughnut chart )
北京、上海和天津地区按收入法计算的地区生产总值
31% 25%
36%
32% 36% 44%
July 30, 2010
16%
15% 17% 14%
18% 16%
劳动者报酬 生产税净额 固定资产折旧 营业盈余
第 2 章 用图表展示数据
2.2 用图表展示定量数据
频数
比例
百分比 比率
D
E
July 30, 2010
生成频数分布表
(定性数据)
【例】一家市场调查公 司为研究不同类型饮料 的市场占有率,对随机 抽取的一家超市进行调 查。下面的表是调查员 随机观察的50名顾客购 买的饮料类型记录。生 成一张频数分布表,观 察不同类型饮料的销售 分布状况
用Excel制作频数分布表
2.1 用图表展示定性数 据
2.1.2 定性数据的图示
条形图
(bar Chart)
1. 用宽度相同 的条形的高 度或长短来 表示各类别 数据
2. 各类别可放
在纵轴,称
为条形图,
可以放在横
轴,称为柱
形
图
(column
chart)
July 30, 2010
频数
16
15
12
10
8
6
11 8
4
0 果汁 矿泉水 碳酸饮料 绿茶
的角度来表示数值
其他 16%
大小的图形,主要
用于表示一个样本
(或总体)中各组成 绿茶 部分的数据占全部 22%
数据的比例
用于研究结构问题
果汁 12%
矿泉水 20%
碳酸饮料 30%
July 30, 2010
环形图
(doughnut chart)
1. 环形图中间有一个“空洞”,样本或 总体中的每一部分数据用环中的一段 表示
▪ 使用统计函数【FREQUENCY】创建频数分布表和直方 图可解决这一问题。具体步骤是
• 选择与接受区域相临近的单元格区域,作为频数分布表 输出的区域
• 选择统计函数中的【FREQUENCY】函数 • 在 对 话 框【Date-array】 后 输入 数据 区 域 , 在【Bins-
array】后输入接受区域 • 同时按下“ctrl-shift-Enter”组合键,即得到频数分
是饮料品牌)连续拖放两次:一次拖至左边
的“行”区域
,一次拖至 “数据”区域
第6步:用然数后据单透击【视确表定产】生,定自性动数返据回【的向频导数—分3步布骤之3】
对
July 30, 2010
话框。然后单击【完成】,即可输出数据透
生成频数分布表
(定性数据)
不同类型饮料的频数分布
July 30, 2010
2. 与饼图类似,但又有区别
饼图只能显示一个总体各部分所占的比 例
环形图则可以同时绘制多个样本或总体 的数据系列,每一个样本或总体的数据 系列为一个环
3. 用于结构比较研究
July 30, 2010
环形图
(doughnut chart)
【例】2006年北京、上海和天津地区按收入法计算 的地区生产总值(按当年价格计算)数据。绘制环形 图比较三个地区的生产总值构成
4 6 8 10 12
Median/Quart./Range箱线图
July 30, 2010
未分组数据看分布—箱线图
(例题分析)
最小值 141
25%四分位数 中位数 75%四分位数
170.25
182
197
最大值 237
140 150 160 170 180 190 200 210 220
某电脑公司销售额数据的 Median/Quart./Rang箱线图
(例题分析)
1. 确定组数:组数的确定应以能够显示数据的分布特征 为目的。在实际分组时,组数一般为5K 15。本例 中由于数据较多,可考虑分为10组
2. 确定组距:组距(Class Width)是一个组的上限与下 限之差,可根据全部数据的最大值和最小值及所分的 组数来确定,即
值)÷ 组数
组距=( 最大值 - 最小
上的两个分位数值
3. 绘制方法
首先找出一组数据的5个特征值,即最大值、最小值、中
位数Me和两个四分位数(下四分位数QL和上四分位数QU)
连接两个四分位数画出箱子,再将两个极值点与箱子相 连接
July 30, 2010
未分组数据看分布—箱线图
(箱线图的构成)
X Min Q 25% 中位数 Q 75% XMax
未分组数据看分布—箱线图
(box plot)
1. 用于显示未分组的原始数据的分布 2. 箱线图是由一组数据的最大值(maximum)、最小值
(minimum) 、 中 位 数 (median) 、 两 个 四 分 位 数 (quartiles)这5个值绘制而成的
中位数是一组数据排序后处于中间位置上的变量值 四分位数是一组数据排序后处在数据25%位置和75%位置
饮料类型
其他
帕累托图
(pareto chart)
1. 按 各 类 别 数据出现 的频数多 少排序后 绘制的柱 形图
2. 用 于 展 示 分类数据 的分布
频数
16
15
12
11 10
8
8
6
4
0 碳酸饮料
绿茶
矿泉水 饮料类型
其他
果汁
July 30, 2010
饼图
(pie Chart)
1. 用圆形及圆内扇形
用SPSS绘制直方图
分组数据看分布—直方图
(SPSS绘制的直方图)
July 30, 2010
分组数据看分布—直方图
(直方图与条形图的区别)
1. 条形图中wenku.baidu.com每一矩形表示一个类别,其宽度没有意义,而直方图的宽度则表 示各组的组距
2. 由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是 分开排列
用Excel制作频数分布
生成频数分布表
(例题分析)
某电脑公司销售额的频数分布
July 30, 2010
生成频数分布表
(例题分析—使用开口组)
July 30, 2010
使用Excel频数函数 (FREQUENCY)
▪ Excel的【直方图】工具的缺陷是:频数分布及直方 图没有与数据链接,当改变任何一个数据时,频数 分布表和直方图不会跟着改变
的频数就形成了一个矩形,即直方图 4. 直方图下的总面积等于1
July 30, 2010
用Excel制作直方图
用SPSS绘制直方图
第1步:选择【Graphs】下拉菜单,并选择
框
【histogram】选项进入主对话
第2步:在主对话框中将变量选入【Variables】
,点击【OK】
July 30, 2010
July 30, 2010
分布的形状与箱线图
左偏分布
Left-skewed distribution
July 30, 2010
对称分布
Bell-shaped distribution
不同分布的箱线图
右偏分布
Right-skewed distribution
未分组数据看分布—多批数据箱线图 (例题分析)
布
统计函数—FREQUENCY
July 30, 2010
2.1 用图表展示定性数 据
2.2.2 定量数据的图示
Excel
分组数据看分布—直方图
(histogram)
1. 用于展示分组数据分布的一种图形 2. 用矩形的宽度和高度来表示频数分布
本质上是用矩形的面积来表示频数分布 3. 在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应