应用统计学第2章--统计表统计图
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
16
制作频数分布表的注意事项
4) 组中值 组中值是各组的代表值,在计算分组数据的许多统
计指标时要用到。通常取该组上限和下限的平均 值为组中值。如表2-7所示,10~19的组中值是14.5, 20~29的组中值是24.5,等等。 5) 表格线 统计表中的表格线应当是两边开口的表格。
17
使用 Excel 制作频数分布表
L = [ 10 × log 10 n ] 茎叶图类似于横置的直方图,但又有区别
直方图可大体上看出一组数据的分布状况,但没有给出 具体的数值 茎叶图既能给出数据的分布状况,又能给出每一个原始 数值,保留了原始数据的信息
26
未分组数据—茎叶图(茎叶图的制作)
树茎 树叶
数据个数
10 788
3
11 022347778889
倒J 形
图1.9 J 形曲线
其典型的应用分别是经济学中的供给曲线和需求曲线。 供给曲线(正 J 形)表现为随着价格的增加,供给量以更
2
1.频数分布表
频数分布表列出了一系列分类数据的频率、总数 或百分比,可以看出不同类别数据间的区别。
表2-1 1 000美元用途的频数分布表
用钱做什么 购买奢侈品、旅游或礼物 向慈善机构捐款 还贷 储蓄 购买必需品 其他
百分比/% 20 2 24 31 16 7
3
2.条形图
100美元的使用
其他
购买必需品
48 71 52 53 36 41 69 58 47 60 53 29 41 72 81 37 43 58 68 42 73 62 59 44 51 53 47 66 59 52 34 49 73 29 47 16 39 58 43 29 46 52 38 46 80 58 51 67 54 57 58 63 49 40 54 61 58 66 47 50
曲线图:当变量是连续型数据时,通常使用曲线图 来描述数据的分布情况,如连续型随机变量的密 度函数和分布函数曲线。
30
6.散点图、时间序列图和曲线图
⑴ Office 中曲线图的绘制 方法一:使用“平滑线散点图”绘制 方法二:将折线图转换为曲线图 右击折线后选择“数据系列格式”,在“图案”标
签下选“平滑线”复选框,就将折线图转换为曲 线图。
储蓄
还贷
向慈善机构捐款
购买奢侈品、旅游或礼物
0
5
10
15
20
25
30
35
百分比/%
4
3.圆饼图
购买必需品 16%
其他 7%
储蓄 31%
购买奢侈品、 旅游或礼物
20%
向慈善机构捐款 2%
还贷 24%
5
4.帕累托图
在帕累托图中,不同类别的数据是按其频率降序
排列的,并在同一张图中画出累积百分比图。帕 累托图可以体现帕累托原则:数据的绝大部分存 在于很少类别中,极少剩下剩余的数据分散在大 部分类别中。这两组经常被称为“至关重要的极 少数”和“微不足道的大多数”
图1.8 偏态曲线 例如收入和财富的频数分配曲线就是右偏的,大量财富 都集中在极少数富豪手中,而多数人则是低收入者。
此外,在产品质量管理中也普遍存在这种现象,如多数 次品都集中出在少数工人手中;次品也大都出在少数几道 工序上。这就要求在管理和控制上需要突出重点、抓住关 键因素。
33
③ J 形曲线
正J形
图 某地区各产业增加值构成比例的变化情况
22
3.柱形图、条形图和直方图
柱形图、条形图和直方图是使用的最为广泛 的统计图表。通常将横向绘制的柱形图称为条形 图,而将各柱形之间没有间隔的称为直方图,但 在Office中将直方图和柱形图统称为柱形图。 (1)柱形图
——主要用于表示时间序列数据。
23
柱形图示例
1800 1600 1400 1200 1000
800 600 400 200
0
1990 1991 1992 1993 1994 1995
图1.4 各类进口商品的变化情况
食品 燃料 工业原料 最终产品
24
(2)直方图——用以表示数据的频数分布规律。
25 20
频 15 数 10
5 0
图1.5 比特公司啤酒销售量的频数分布
100
80
频数
频 60 数 40
女学生 男学生
20
0 35 45 55 65 75 85 95 105
体体重/重千克
男、女学生的体重分布特征
28
5.圆饼图
当要表示总体各组成部分的个体数量在总体中占 的比率时,经常使用圆饼图,圆饼中各扇形的大 小代表了不同组成部分的相对重要性。
某企业资产、负债与所有者权益的构成情况
13
12 0012222333344466777889 24
13 0133445799
10
茎叶图类似横置 的直方图
某车间工人日加工零件数的茎叶图
27
4.频数多边形
频数多边形是直方图的另一种表现形式,是由直
方图的顶端中点(各组的组中值)连线而成,其中两 边都要连接到横轴上的某点,以便通过覆盖的面
积反映总频数。当希望在一个图上比较两种频数 分布的特征时,就需要使用频数多边形。
35
120
30
100
25 20 15 10
80 60 40
5
20
0
0
储蓄 还贷 购买奢侈品、 旅游或礼 物 购买必需 品 其他 捐款
有钱要做什么 6
§2.2 数值数据的整理
当数据量很大时,首先可以将数值数据进行排序或用 茎叶图描述以获得初步信息。 (1) 排序
从没有排序的数据中很难看出数据的整体范围。排序 是把数据从小到大(或从大到小)进行排列。 (2) 茎叶图
某企业职工工资的分组统计
月工资(分组)
1000 以下
1000~1500
1500~2000
2000~3000
3000~3500
3500~4000
4000 及以上
合
计
人数(频数) 150 185 256 262 120 54 8
1035
比率(频率%) 14.5 17.9 24.7 25.3 11.6 5.2 0.8 100
10
制作频数分布表的注意事项
1) 分组的数量
实际应用中分组的数量和组距应根据对象的特点和分析的需要决定。
如果分组是为了揭示数据的分布规律,则分组不能过多和过少。通 常应在5~15 之间。在绘制直方图时可以参照下表:
样本容量 n
参考分组数
20~50 51~100 101~200 201~500 501~1000 1000以上
19
过分压缩了Y轴
4000 失
业 人
3000
数 :
2000
千 人 1000
0 1989
1990 1991 1992 1993
图1.2 失业人数统计图
1994
1995
20
过分压缩了X轴
4000
失 业 人 3000 数 : 千 2000 人
1000
图1.3 失业人数统计图
21
1989 1990 1991 1992 1993 1994 1995
①利用 Excel 的 FREQUENCY 函数 语法规则: 格式:FREQUENCY(<数据区域>,<接收区间>)
接收区间——各组上限值组成的一列区域 功能:返回各组的频数。 ②使用【工具】→“数据分析”→“直方图”功能
18
其它数值数据统计图
统计图可以形象、直观、生动、简洁地显示数据 的特征。 常用的统计图有以下几种: 1.折线图 ——通常用来描述时间序列数据,用以表示某些 指标的变化趋势。 制作折线图时应正确选择坐标轴轴的刻度。对同 样的统计资料,延伸或压缩某一坐标轴可能传达 不同的甚至是误导的印象。
12
例: 按雇工人数分组的私营企业规模统计
雇工人数 1~19 20~99
100~199 200~499 500 及以上
合计
企业数 45 31 23 6 120
相对频数 37.5% 25.8% 19.2% 12.5% 5.0% 100%
13
制作频数分布表的注意事项
3)组限:组限也即各组区间的上、下限。确定各 组区间的上限和下限时,应保证各组之间既不重叠, 又不能遗漏任一数据,使每一个数据都属于某一确 定的分组。
第2章 统计表和统计图
本章教学目标:
掌握利用统计图表整理和表示统计数据的基本 方法;
掌握利用 Office 软件绘制各种统计图表、计算 各种统计综合指标。
掌握分类数据图表的制作方法。 掌握数值数据图表的制作方法。 了解图表汇总和制作原则。
1
§2.1 分类数据的图表
在获得原始数据资料之后,需要使用一定的方法 对数据进行整理和综合,目的是从大量的原始数 据资料中提炼所需要的信息,使之可以提供概要 信息并能反映对象总体的基本数量特征,便于人 们的理解和使用。表格和图形是整理和反映统计 资料的主要工具。 当数据是分类数据时,可以对每一分类数据制作 频率或百分比表格和图表。
5~6 7~8 8~9 9~10 10~11 11~20
11
制作频数分布表的注意事项
2) 分组的方法 分组的方法可以有等距分组和不等距分组两类。 采用哪种分组方法应根据数据的分布特点而定。 通常,当数据在一定范围内基本呈对称分布时, 宜采用等距分组;而当数据的分布状态极度偏斜 时,则宜采用不等距分组。
29
6.散点图、时间序列图和曲线图
Microsoft Office中的曲线图属于平滑线散点图 。
散点图:在回归分析中,经常需要用样本数据的散 点图来分析两个变量之间大致的曲线关系,如正 相关关系,即一个变量的增长引起另一个变量的 增长;负相关关系,即一个变量的增长引起另一 个变量的减少。
时间序列图:研究数值变量随时间变化的趋势。X轴 代表时间,Y轴代表数值。时间序列图可用折线图 来实现。
31
⑵经济管理中几种常见的频数分布曲线
①正态分布曲线 ——这是客观事物数量特征上表现得最为普遍的一
类频数分布曲线。 如人的身高、体重、智商,钢的含碳量、抗拉强度,
某种农作物的产量等等。
正态分布曲线
32
②偏态曲线
——按其长尾拖向哪一方又可分为右偏(正偏)和 左偏(负偏)两类。
右偏(正偏)
左偏(负偏)
某公司某月汽车销售量的频数分布表
销售量(辆)
10~19 20~29 30~39 40~49 50~59 60~69 70~79 80~89
合计
销售点数量(频数)
1 3 5 16 20 9 4 2 60
相对频数(%)
1.7 5.0 8.3 26.7 33.3 15.0 6.7 3.3 100
15
例:连续型变量的分组(上限不在内)
茎叶图就是将数据分成几组(称为茎),每组中数据的 值(称为叶)放置在每行的右边。结果可以显示出数据是如 何分布的,以及数据中心在哪里。
为了制作茎叶图,可以将整数作为茎,把小数(叶)化 整。例如,数值5.40,它的茎(行)是5,叶是4;数值4.30, 它的茎(行)是4,叶是3。也可以将数据的十位数作为茎, 个位数作为叶。
9
1.频数分布表
销售量(辆)
10~19 20~29 30~39 40~49 50~59 60~69 70~79 80~89
合计
销售点数量(频数)
1 3 5 16 20 9 4 2 60
频率(%)
1.7 5.0 8.3 26.7 33.3 15.0 6.7 3.3 100
分组统计整理后, 将杂乱无章的 60 个原始数 据压缩到8组,清晰地反映了更多的有用信息。
7
§2.3 数值数据的图表
当数据量很大时,排序和茎叶图都很难得出结论。 此时需要使用图表。有多种不同类型的图表可以 用来精确描述数值数据,包括频数分布表、折线 图、面积图、柱形图、条形图、直方图、频数多 边形、圆饼图、散点图、时间序列、曲线图以及 对数图等等。
8
例:某公司汽车销售量 (单位:辆)
2.面积图
面积图可以直观地表示时间序列各组成部分的变
化情况。
100%
百分比/ %
91000% 8090% 7080%
70
百 6060% 分 5050% 比 4040%
3030%
信息产业 工业原料 能源 民用产品
2020%
1010%
00% 19199797 11999988 11999999 22000000 22000011 20200202 年
重叠和组限不重叠组限
重叠组限——相邻组的上下限重合。
适用于连续型变量。但各组上、下限中有一个不包含 再内。通常按“上限不在内”处理,即组区间是 [a, b) 的形式。
注意:Excel在制作频数分布表时采用的是“上限在 内”的规则。
不重叠组限——相邻组的上下限不重合。 适用于离散型变量。
14
例:离散型变量的分组(不重叠组限)
25
0—9 10—19 20—29 30—39 40—49 50—59 60—69 70—79 80—89 90以上
未分组数据的茎叶图
• 用于显示未分组的原始数据的分布 • 由“茎”和“叶”两部分构成,其图形是由数字组
成的 • 以该组数据的高位数值作树茎,低位数字作树叶 • 对于n(20≤n≤300)个数据,茎叶图最大行数不超过