应用统计学第2章--统计表统计图

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
重叠和组限不重叠组限
重叠组限——相邻组的上下限重合。
适用于连续型变量。但各组上、下限中有一个不包含 再内。通常按“上限不在内”处理,即组区间是 [a, b) 的形式。
注意:Excel在制作频数分布表时采用的是“上限在 内”的规则。
不重叠组限——相邻组的上下限不重合。 适用于离散型变量。
14
例:离散型变量的分组(不重叠组限)
35
120
30
100
25 20 15 10
80 60 40
5
20
0
0
储蓄 还贷 购买奢侈品、 旅游或礼 物 购买必需 品 其他 捐款
有钱要做什么 6
§2.2 数值数据的整理
当数据量很大时,首先可以将数值数据进行排序或用 茎叶图描述以获得初步信息。 (1) 排序
从没有排序的数据中很难看出数据的整体范围。排序 是把数据从小到大(或从大到小)进行排列。 (2) 茎叶图
倒J 形
图1.9 J 形曲线
其典型的应用分别是经济学中的供给曲线和需求曲线。 供给曲线(正 J 形)表现为随着价格的增加,供给量以更
31
⑵经济管理中几种常见的频数分布曲线
①正态分布曲线 ——这是客观事物数量特征上表现得最为普遍的一
类频数分布曲线。 如人的身高、体重、智商,钢的含碳量、抗拉强度,
某种农作物的产量等等。
正态分布曲线
32
②偏态曲线
——按其长尾拖向哪一方又可分为右偏(正偏)和 左偏(负偏)两类。
右偏(正偏)
左偏(负偏)
L = [ 10 × log 10 n ] 茎叶图类似于横置的直方图,但又有区别
直方图可大体上看出一组数据的分布状况,但没有给出 具体的数值 茎叶图既能给出数据的分布状况,又能给出每一个原始 数值,保留了原始数据的信息
26
未分组数据—茎叶图(茎叶图的制作)
树茎 树叶
数据个数
10 788
3
11 022347778889
图1.8 偏态曲线 例如收入和财富的频数分配曲线就是右偏的,大量财富 都集中在极少数富豪手中,而多数人则是低收入者。
此外,在产品质量管理中也普遍存在这种现象,如多数 次品都集中出在少数工人手中;次品也大都出在少数几道 工序上。这就要求在管理和控制上需要突出重点、抓住关 键因素。
33
③ J 形曲线
正J形
16
制作频数分布表的注意事项
4) 组中值 组中值是各组的代表值,在计算分组数据的许多统
计指标时要用到。通常取该组上限和下限的平均 值为组中值。如表2-7所示,10~19的组中值是14.5, 20~29的组中值是24.5,等等。 5) 表格线 统计表中的表格线应当是两边开口的表格。
17
使用 Excel 制作频数分布表
①利用 Excel 的 FREQUENCY 函数 语法规则: 格式:FREQUENCY(<数据区域>,<接收区间>)
接收区间——各组上限值组成的一列区域 功能:返回各组的频数。 ②使用【工具】→“数据分析”→“直方图”功能
18
其它数值数据统计图
统计图可以形象、直观、生动、简洁地显示数据 的特征。 常用的统计图有以下几种: 1.折线图 ——通常用来描述时间序列数据,用以表示某些 指标的变化趋势。 制作折线图时应正确选择坐标轴轴的刻度。对同 样的统计资料,延伸或压缩某一坐标轴可能传达 不同的甚至是误导的印象。
第2章 统计表和统计图
本章教学目标:
掌握利用统计图表整理和表示统计数据的基本 方法;
掌握利用 Office 软件绘制各种统计图表、计算 各种统计综合指标。
掌握分类数据图表的制作方法。 掌握数值数据图表的制作方法。 了解图表汇总和制作原则。
1
§2.1 分类数据的图表
在获得原始数据资料之后,需要使用一定的方法 对数据进行整理和综合,目的是从大量的原始数 据资料中提炼所需要的信息,使之可以提供概要 信息并能反映对象总体的基本数量特征,便于人 们的理解和使用。表格和图形是整理和反映统计 资料的主要工具。 当数据是分类数据时,可以对每一分类数据制作 频率或百分比表格和图表。
2.面积图
面积图可以直观地表示时间序列各组成部分的变
化情况。
100%
百分比/ %
91000% 8090% 7080%
70
百 6060% 分 5050% 比 4040%
3030%
信息产业 工业原料 能源 民用产品
2020%
1010%
00% 19199797 11999988 11999999 22000000 22000011 20200202 年
13
12 0012222333344466777889 24
13 0133445799
10
茎叶图类似横置 的直方图
某车间工人日加工零件数的茎叶图
27
4.频数多边形
频数多边形是直方图的另一种表现形式,是由直
方图的顶端中点(各组的组中值)连线而成,其中两 边都要连接到横轴上的某点,以便通过覆盖的面
积反映总频数。当希望在一个图上比较两种频数 分布的特征时,就需要使用频数多边形。
10
制作频数分布表的注意事项
1) 分组的数量
实际应用中分组的数量和组距应根据对象的特点和分析的需要决定。
如果分组是为了揭示数据的分布规律,则分组不能过多和过少。通 常应在5~15 之间。在绘制直方图时可以参照下表:
样本容量 n
参考分组数
20~50 51~100 101~200 201~500 501~1000 1000以上
某企业职工工资的分组统计
月工资(分组)
1000 以下
1000~1500
1500~2000
2000~3000
3000~3500
3500~4000
4000 及以上


人数(频数) 150 185 256 262 120 54 8
1035
比率(频率%) 14.5 17.9 24.7 25.3 11.6 5.2 0.8 100
19
过分压缩了Y轴
4000 失
业 人
3000
数 :
2000
千 人 1000
0 1989
1990 1991 1992 1993
图1.2 失业人数统计图
1994
1995
20
过分压缩了X轴
4000
失 业 人 3000 数 : 千 2000 人
1000
图1.3 失业人数统计图
21
1989 1990 1991 1992 1993 1994 1995
7
§2.3 数值数据的图表
当数据量很大时,排序和茎叶图都很难得出结论。 此时需要使用图表。有多种不同类型的图表可以 用来精确描述数值数据,包括频数分布表、折线 图、面积图、柱形图、条形图、直方图、频数多 边形、圆饼图、散点图、时间序列、曲线图以及 对数图等等。
8
例:某公司汽车销售量 (单位:辆)
25
0—9 10—19 20—29 30—39 40—49 50—59 60—69 70—79 80—89 90以上
未分组数据的茎叶图
• 用于显示未分组的原始数据的分布 • 由“茎”和“叶”两部分构成,其图形是由数字组
成的 • 以该组数据的高位数值作树茎,低位数字作树叶 • 对于n(20≤n≤300)个数据,茎叶图最大行数不超过
12
例: 按雇工人数分组的私营企业规模统计
雇工人数 1~19 20~99
100~199 200~499 500 及以上
合计
企业数 45 31 23 15 6 120
相对频数 37.5% 25.8% 19.2% 12.5% 5.0% 100%
13
制作频数分布表的注意事项
3)组限:组限也即各组区间的上、下限。确定各 组区间的上限和下限时,应保证各组之间既不重叠, 又不能遗漏任一数据,使每一个数据都属于某一确 定的分组。
1800 1600 1400 1200 1000
800 600 400 200
0
1990 1991 1992 1993 1994 1995
图1.4 各类进口商品的变化情况
食品 燃料 工业原料 最终产品
24
(2)直方图——用以表示数据的频数分布规律。
25 20
频 15 数 10
5 0
图1.5 比特公司啤酒销售量的频数分布
29
6.散点图、时间序列图和曲线图
Microsoft Office中的曲线图属于平滑线散点图 。
散点图:在回归分析中,经常需要用样本数据的散 点图来分析两个变量之间大致的曲线关系,如正 相关关系,即一个变量的增长引起另一个变量的 增长;负相关关系,即一个变量的增长引起另一 个变量的减少。
时间序列图:研究数值变量随时间变化的趋势。X轴 代表时间,Y轴代表数值。时间序列图可用折线图 来实现。
100
80
频数
频 60 数 40
女学生 男学生
20
0 35 45 55 65 75 85 95 105
体体重/重千克
男、女学生的体重分布特征
28
5.圆饼图
当要表示总体各组成部分的个体数量在总体中占 的比率时,经常使用圆饼图,圆饼中各扇形的大 小代表了不同组成部分的相对重要性。
某企业资产、负债与所有者权益的构成情况
图 某地区各产业增加值构成比例的变化情况
22
3.柱形图、条形图和直方图
柱形图、条形图和直方图是使用的最为广泛 的统计图表。通常将横向绘制的柱形图称为条形 图,而将各柱形之间没有间隔的称为直方图,但 在Office中将直方图和柱形图统称为柱形图。 (1)柱形图
——主要用于表示时间序列数据。
23
柱形图示例
某公司某月汽车销售量的频数分布表
销售量(辆)
10~19 20~29 30~39 40~49 50~59 60~69 70~79 80~89
合计
销售点数量(频数)
1 3 5 16 20 9 4 2 60
相对频数(%)
1.7 5.0 8.3 26.7 33.3 15.0 6.7 3.3 100
15
例:连续型变量的分组(上限不在内)
茎叶图就是将数据分成几组(称为茎),每组中数据的 值(称为叶)放置在每行的右边。结果可以显示出数据是如 何分布的,以及数据中心在哪里。
为了制作茎叶图,可以将整数作为茎,把小数(叶)化 整。例如,数值5.40,它的茎(行)是5,叶是4;数值4.30, 它的茎(行)是4,叶是3。也可以将数据的十位数作为茎, 个位数作为叶。
48 71 52 53 36 41 69 58 47 60 53 29 41 72 81 37 43 58 68 42 73 62 59 44 51 53 47 66 59 52 34 49 73 29 47 16 39 58 43 29 46 52 38 46 80 58 51 67 54 57 58 63 49 40 54 61 58 66 47 50
曲线图:当变量是连续型数据时,通常使用曲线图 来描述数据的分布情况,如连续型随机变量的密 度函数和分布函数曲线。
30
6.散点图、时间序列图和曲线图
⑴ Office 中曲线图的绘制 方法一:使用“平滑线散点图”绘制 方法二:将折线图转换为曲线图 右击折线后选择“数据系列格式”,在“图案”标
签下选“平滑线”复选框,就将折线图转换为曲 线图。
2
1.频数分布表
频数分布表列出了一系列分类数据的频率、总数 或百分比,可以看出不同类别数据间的区别。
表2-1 1 000美元用途的频数分布表
用钱做什么 购买奢侈品、旅游或礼物 向慈善机构捐款 还贷 储蓄 购买必需品 其他
百分比/% 20 2 24 31 16 7
3
2.条形图
100美元的使用
其他
购买必需品
储蓄
还贷
向慈善机构捐款
购买奢侈品、旅游或礼物
0
5
10
15
20
25
30
35
百分比/%
4
3.圆饼图
购买必需品 16%
其他 7%
Baidu Nhomakorabea
储蓄 31%
购买奢侈品、 旅游或礼物
20%
向慈善机构捐款 2%
还贷 24%
5
4.帕累托图
在帕累托图中,不同类别的数据是按其频率降序
排列的,并在同一张图中画出累积百分比图。帕 累托图可以体现帕累托原则:数据的绝大部分存 在于很少类别中,极少剩下剩余的数据分散在大 部分类别中。这两组经常被称为“至关重要的极 少数”和“微不足道的大多数”
9
1.频数分布表
销售量(辆)
10~19 20~29 30~39 40~49 50~59 60~69 70~79 80~89
合计
销售点数量(频数)
1 3 5 16 20 9 4 2 60
频率(%)
1.7 5.0 8.3 26.7 33.3 15.0 6.7 3.3 100
分组统计整理后, 将杂乱无章的 60 个原始数 据压缩到8组,清晰地反映了更多的有用信息。
5~6 7~8 8~9 9~10 10~11 11~20
11
制作频数分布表的注意事项
2) 分组的方法 分组的方法可以有等距分组和不等距分组两类。 采用哪种分组方法应根据数据的分布特点而定。 通常,当数据在一定范围内基本呈对称分布时, 宜采用等距分组;而当数据的分布状态极度偏斜 时,则宜采用不等距分组。
相关文档
最新文档