第03章_描述数据的图表方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算各组的宽度
K 1 lg n
lg 2
宽度 (最大值 最小值) 区间数
4.
确定组界(上下限) 5. 计算组中值 )2 某组的组中值 (该组下限值 该组上限值 6. 根据分组整理成频数分布表
计算每个组的频数、相对频数(即频率)
北京理工大学管理与经济学院
频数分布表实例
第3章 描述数据的图表方法
北京理工大学管理与经济学院
学习目标
1.
定量数据的图表描述
数据整理 单变量描述 双变量描述
2.
定性数据的图表描述
数据整理 单变量描述 双变量描述
北京理工大学管理与经济学院
单变量定量数据的图表描述
单定量数据的图表描述
分 组
数据整理
频数分布表 累积频数分布表
北京理工大学管理与经济学院
单变量定量数据的图表描述 ——数据整理
频数分布表
对定量数据进行分组时,需要建立频数分布表,以便更有
效地显示数据的特征和分布。 构成:
频数,各组的单位的次数 频率,各组次数与总次数之比 频数分布,由分组标志序列和各组相对应的分布次数这两个 要素构成。 频率分布,由分组标志序列和各组相应的频率构成频率分布 。
北京理工大学管理与经济学院
茎叶图
把每一项观察分解为茎值
和叶值
茎值确定组别 叶值确定频数
2 144677 3 028 4 1
Xi
(计数)
北京理工大学管理与经济学院
箱线图
20
18
最大值 中位数
16
14
四分位数 间距范围 大于1.5 倍四分 位数间 距
Korea Turkey Mexico
12
这一列 为类别
专业 会计 经济 管理 总计
计数 130 20 50 200
记录: |||| |||| |||| ||||
北京理工大学管理与经济学院
单变量定性数据的图表描述 ——数据图形描述
条形图 类似直方图,条形图的横轴表示的是各个分类,直方图的横轴 表示所分的组 饼图 通常用来描述落在各个分类中的观察值数分别在总数中所占的 比率 累积频数分布图 类似于描述定量数据中的累积频率分布图 帕雷托图 变量的分类数目较多时,用帕雷托图要比条形图和饼图更能直 观地显示信息。 广泛应用于过程分析和质量分析中
频数分布表(又叫总结表)
类似于整理定量数据的频数分布表 包含:
分类的频数或频率,即指落在某一特定类中的观察值数 分类的相对频数,指某个特定类的频数除以观察值总数所得 的商
累积频数分布表
类似于整理定量数据的累积频数分布表
北京理工大学管理与经济学院
频数分布表
(可参考书上实例)
多定性数据的图表描述
环形图
交叉图
多重条形图
北京理工大学管理与经济学院
多变量定性数据的图表描述
1. 环形图
显示具有相同分类且问题可比的多个样本或总体中各类别所占的相应比 例,对各总体进行比较研究 在类别值为定序数据时这种比较才有意义 可检测两个定性变量的关系 同样可用来描述两个变量都是数字变量,或者一个变量是定类或定序变 量,另一个是数字变量之间的关系 描述两个定类或定序变量间关系
用于直接描述未分组原始数据的探索性分析 描述数据分布形状,如数据是否集中,是否有极端值等 由茎、叶、每个茎对应叶的个数、茎的宽度这四元素组成
箱线图
用于直接描述未分组原始数据的探索性分析 描述数据的分布形状,如数据是否集中,是否有极端值等 可以比较多组数据分布特征 图中包含五个点组成:样本数据的最小值、下四分位数、中 位数、上四分位数、最大值
10
最小值 奇异值
8
6 4
N=
29
北京理工大学管理与经济学院
O VER 65
箱线图
(可参考书上实例)
中间的黑粗线为中位数
方框为四分位间距的范围 离方框上/下界的距离超过四分位数间距1.5倍的为离群值,以 “O” 表 示;超过3倍的则为极值,用“*”表示。
北京理工大学管理与经济学院
多变量定量数据的图表描述
——数据图形描述(分组后数据)
数据分组整理后的图形描述
直方图
用矩形的高度和宽度来表示频数分布 作用与直方图相似
折线图
累积频数分布图
描述累积频数或频率信息
北京理工大学管理与经济学院
直方图
(可参考书上实例)
计数 5 频数 或 频率 4 3 2 柱条接触
类别 15 ~ 25 25 ~ 35 35 ~ 45 频数 3 5 2
北京理工大学管理与经济学院
条形图
(可参考书上实例)
水平条表示 类型变量
专业
管理
经济
条长表示频 数或者 %
相同的条宽
条宽的1/2 到1倍
会计
零点
0
也可使用百分比
50
100
150
频数
北京理工大学管理与经济学院
饼 图
(可参考书上实例)
1. 表示出总量的分类
2.
是表示相对差异的有效 办法 角度大小
组箱线图
120
110
100
90
80
70
李晨
60
N= 20 20 20
上旬产量
中旬产量
下旬产量
北京理工大学管理与经济学院
单变量定性数据的图表描述
单定性数据的图表描述
数据整理
频数分布表
累积频数分布表
数据图 形描述
条形图
饼图
帕雷托图
累积频数分布图
北京理工大学管理与经济学院
单变量定性数据的图表描述 ——数据整理
1 0
0
北京理工大学管理与经济学院
15
25
35
45
55
下界
折线图
(可参考书上实例) 计数 5
频数 或 频率 4 3 2 虚拟的 外推组 0 10 20 30 40 50 60
组别 15 < 25 25 < 35 35 < 45 频数 3 5 2
1 0
中点
北京理工大学管理与经济学院
累积折线图
(可参考书上实例)
未分组
数据图 形描述
直方图
折线图
累积频数分布图
茎叶图
箱线图
北京理工大学管理与经济学院
单变量定量数据的图表描述 ——数据整理
统计分组
根据统计研究的目的和客观现象的内在特点,按某个标志(或几
个标志)把被研究的总体划分为若干个不同性质的组。 例,收集到某班所有同学的英语考试成绩,为了研究需要划分高 、中、低三个成绩段,每个成绩段的范围分别是85-100,70-85 ,0-70,将每个成绩归入到相应的组中。
2. 交叉表
3. 多重条形图
北京理工大学管理与经济学院
交叉表
住处:
性别:
C M
C F
O F
O C C M M M
O F
O C M M
O F
(C=校内, O=校外; M=男, F=女)
性别
住处 校内 校外 合计
北京理工大学管理与经济学院
男
女
4 2 6
1 3 4
合计 5 5 10
多重条形图
住处
校内 男 女 校外 男 女
0
北京理工大学管理与经济学院
1
2
3 4 频数
5
6
4. 雷达图
北京理工大学管理与经济学院
散点图
标出所有数对 (Xi, Yi)
(可参考书上实例)
60 40 20 0
Y
Biblioteka Baidu
0
北京理工大学管理与经济学院
20
40
X 60
时间序列图
(可参考书上实例)
销售 8
6 4 2 0
1991 1992 1993 1994 1995 1996
年份
北京理工大学管理与经济学院
北京理工大学管理与经济学院
频数分布表
原始数据: 24, 26, 24, 21, 27, 27, 30, 41, 32, 38
组别
15 且< 25 25 且< 35 35 且< 45
频数
3
5
2
北京理工大学管理与经济学院
编制频数分布表
1.
选择组数
可参考Sturges的经验公式
3.
原始数据: 24, 26, 24, 21, 27, 27, 30, 41, 32, 38
组别
15 ~ 25
组别下界
累计 百分比
0.0 30.0 80.0 100.0
小于组别下限的 百分数
25 ~ 35 35 ~ 45 45 ~ 55
30% + 50% 80% + 20%
北京理工大学管理与经济学院
单变量定量数据的图表描述
累计 % 100% 75%
组别
虚拟的 外推组
50% 25% 0%
0
北京理工大学管理与经济学院
15 ~ 25 25 ~ 35 35 ~ 45 > 45
累计 % 0% 30% 80%
100%
15
25
35
45
55
下界
单变量定量数据的图表描述 ——数据图形描述(未分组数据)
数据未分组整理后的图形描述
茎叶图
(可参考书上实例)
原始数据: 24, 26, 24, 21, 27, 27, 30, 41, 32, 38
组别 组中值 频数 频率
30.0 50.0 20.0
15 且< 25
组距
20
30 40
3
5 2
25 且< 35 35 且< 45
组界
(上界+下界)/ 2
北京理工大学管理与经济学院
累积频数分布表
多定量数据的图表描述
散点图
线 图
组箱线图
雷达图
北京理工大学管理与经济学院
多变量定量数据的图表描述
1. 散点图
同时研究两个数字变量的取值 在图上标出所有数对 (Xi, Yi) 表示一列定量数据如何随时间变化 比较多个总体的分布特征 用于要同时分析的变量个数较多的情况
2. 时间序列图
3. 组箱线图
为了统计分析的需要,有时要观察某一数值以上或某一数值以下频数或频 率之和,这就需要在频数分布表基本分组的基础上绘出累积频数或累计频 率。 “向下累积” 由表的上方向表的下方的频数或频率相加
“向上累积”
由表的上方向表的下方的频数或频率相加
北京理工大学管理与经济学院
累积频数分布表实例
(可参考书上实例)
360(百分数)
专业
经济 10%
管理 25%
36
3.
会计 65%
360°×10% = 36°
北京理工大学管理与经济学院
帕雷托图
(可参考书上实例)
百分数
100% 67% 33%
条的中点 累积频数分布图
递减顺序
竖直条形
0%
相同的条宽
北京理工大学管理与经济学院
会计
管理 专业
经济
多变量定性数据的图表描述