精编03-第3章统计整理资料

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

非常不满意 24
8
300
100
不满意
108 36
276
92
一般
93 31
168
56
满意
45 15
75
25
非常满意
30 10
30
10
合计
300 100


累计次数分布图
累计户数(户)
350
300
300
250 200
270 225
150
132
100
和异距。组距=上限-下限
等距数列的组距

全距R 组数
全距 分组数列中最大值的上限与最小值的
下限之差。
组中值 组的上限和下限的中间值。
因数列两端组限形式不同分:
开口式组距:最低组与最高组不封口。例: 成绩60分以下,90分以上。
闭口式组距:例40-60分,90-100分。
组距数列
表3-4 某车间50名工人日加工零件数分组表
志,也可以是数量标志。如学生按专业分组、产品按 等级分组等
品质标志
分组标志
数量标志
2、选取分组标志的原则: 选取的分组标志要能够反映总体的基本性质和特
征并能符合统计研究的目的和要求。
3.分组方式
- 简单分组:按单个标志进行分组。 - 复合分组:按两个或两个以上标志进行分组。
- 分组体系:对社会经济现象需要从各方面进 行观察和分析研究,需要采用一系列相互联系、 相互补充的标志对现象进行多种分组,这些分组 结合起来构成一个体系,叫做分组体系。
再排列 分组体系对现象的认识更加全面、深刻
第三节 分配数列
一 分配数列的概念和种类
1.概念
统计总体按照某一标志分组以后, 用以反映总体各单位分配情况的 统计数列,称分配数列,分配数 列能够看出总体分配在各组中的 次数,又可称次数分配,或次数 分布。

月工资分组(元) 工人数(人) 占总数比重(%)
按零件数分组
频数(人)
频率(%)
105~110
3
6
110~115
5
10
115~120
8
16
120~125
14
28
125~130
10
20
130~135
6
12
135~140
4
8
合计
50
100
等距数列(上下组限不等)
表3-5 某车间50名工人日加工零件数分组表
按零件数分组
频数(人)
频率(%)
105~109
3
6
110~114
5
10
115~119
8
16
120~124
14
28
125~129
10
20
130~134
6
12
135~139
4
8
合计
50
100
等距数列(开口组)
表3-6 某车间50名工人日加工零件数分组表
按零件数分组
频数(人)
频率(%)
105~以下
3
6
110~114
5
10
115~119
8
16
120~124
2、 数据整理的基本任务是:提炼出大量的、 复杂的、零散的数据中隐含的信息,并展示数 据的规律和特性,为下一个阶段的任务服务。
统计整理
主要任务 资料审核、分组、
汇总、制表、制图等。
分组
频数分布 统计表
统计图
数据整理的步骤
1、对调查来的资料进行预处理 2、对调查来的资料按有关标志进行分组 3、计算有关指标 4、数据整理结果的展示(图表化) 5、保存数据整理的结果
月工资额是连续变量;全距=940-640=300
2.确定组距和组数
在全距一定的情况下,组距和组数呈反向变 化关系:组距越大,组数越小;组距小,组 数就多。
在等距分组情况下:
全距(R)=组数(n)组距(d)
按月工资额分组 600~700 700~800 800~900
职工数 4 8 6
按月工资额分组 900~1000 合计
单项数列见例如下:
某厂第二季度工人平均日产量
工人平均日产量(件) 工人人数(人)
2
10
3
15
4
30
5
40
6
20
合计
115
从另一角度看,变量数列分为:
连续变量数列 —— 可有小数,采
取组距式。
非连续变量数列 —— 整数,采取单
项式或组距式
二 组距数列的编制
组限 组距两端的数值。分为上限和下限。
组距 某一组的上限和下限的距离,分等距
职工数 2 20
3.确定组限和组中值
离散型变量:通常取相邻的两个整数,作为相邻两 组的上限和下限
连续型变量:通常用同一个整数分别作为相邻两组 的上限和下限。但是,必须规定,组的上限不包括 在本组之内。
组中值:是各组变量范围的中间值,反映组距数列 中分布在各组中各单位变量值的一般水平。
组中值 上限 下限 2
累计次数分布图
例、 在一项有关住房问题的研究中,研 究人员在甲、乙两个城市各抽样调查300 户家庭,其中的一个问题是:“您对您 家庭目前的住房状况是否满意?” (1)非常不满意;(2)不满意; (3)一般;(4)满意;(5)非常满 意。调查结果整理如下:
甲城市家庭对住房状况的评价
回答类别
非常不满意 不满意 一般 满意 非常满意 合计
例 某乡某种农作物的耕作深度与收获率的关系
耕作深度分组(cm) 地块数 平均收获率(斤/亩)
10-12
7
400
12-14
10
460
14-16
16
540
16-18
12
620
18-20
5
680
例 恩格尔系数与生活状况的依存关系
恩格尔系数 生活状况 恩格尔系数 生活状况
(%)
(%)
>59
绝对贫困 30—40
不同爱好
舞蹈 绘画 音乐 体育 文学
0
7
20
10
15
8
5
10
15
20
25
人数(人)
圆形图
将上例中的数据用圆形图展示出来
12% 33%
13%
25% 17%
文学 体育 音乐 绘画 舞蹈
定序数据的展示
定序数据的展示有两种方法: 1、累计次数分布图: 2、环形图:环形图与圆形图类似,所
不 同的是,环形图中间有一个“空 洞”,总体中的每一部分数据用环中 的一段表示。
14
28
125~129
10
20
130~134
6
12
135~以上
4
8
合计
50
100
不等距数列
表3-7 某企业职工月收入分组
按月收入分组 500以下
人数(人) 10
频率(%) 14.28
500—800
15
21.42
800—1000
25
35.71
1000—1500
12
1500以上
8
合计
70
17.14 11.45 100
富裕
50—59 勉强度日 <30
最富裕
40—50 小康水平
二、统计分组的意义
1. 统计分组是一种定性分类。 2. 分组的结果要做到:组内同质性,
组间差异性;不重复,不遗漏。 3. 是对复杂总体进行认识的第一步。
三、统计分组的方法ห้องสมุดไป่ตู้
分组标志 分组方法 分组体系
分组标志
1、分组标志: 对总体进行分组时所依据的标志,可以是品质标
从变量值大的方向向变量值小的方向逐次 累加,以计算各组的累计次数。向下累计表明 各组下限以上总共所包含的总体次数和比率的 大小。
累计频数
考分 50—60 60—70 70—80 80—90 90—100
合计
人数(人) 向上累计
2
2
7
9
11
20
12
32
8
40
40
向下累计 40 38 31 20 8
累计次数分布图
30
75
10
25
次40数
频10率0
⑵ 变量数列(分组标志是变量,用x表示;频
数表示各组的次数,用f表示)
单项变量数列(单项数列)—— 按每
个变量值分别列组编制数列,适用于 离散变量或变量能以整数表示,其变 量数不多时。
组距变量数列(组距数列)—— 按组
距分组编制数列。适用于连续变量或 变量可用小数表示,其变动范围较大 时。
林业
936.5 938.8 1 033.5 1239.9
牧业 7 393.1 7 963.1 8 454.6 9538.8
渔业 2 712.6 2 815.0 2 971.1 3137.6 合 计 24 915.8 26 179.6 27 390.8 29691.8
⑵ 结构分组
说明社会经济现象的内部结构。
1.确定变量的类型、测定全距
离散型变量——单项式数列 连续型变量——通常采取组距式数列 全距(又称级差):全部变量的最大值和最小值之差
例:某商店有职工20人,月工资额(单位:元) 如下:
640 640 760 760 780 780 800 800 820 820 840 840 790 790 798 798 690 690 940 940
Ö·
三 次数分布的主要类型
钟型分布:一般次数分布呈正态分布曲线, 或称正态曲线
对称型
很多是偏态分布曲线,或称偏态曲线
Y
右偏型 (上偏型)
X
Y
左偏型 (下偏型)
X
还有其他形态
U型分配曲线 J型分配曲线
第四节 数据资料的展示
一、定类数据的展示 二、定序数据的展示 三、定距数据的展示 四、定比数据的展示
定类数据的展示方法
1、条形图: 条形图是用宽度相同的条形的长短来
表示数据的变动。 2、圆形图:
又称饼图,是用圆形及圆内扇形的面 积来表示数值大小的图形。
条形图
例、某班级有60名 同学,根据他们的 爱好分为5组,其中 爱好文学的有8人, 爱好体育的有15人, 爱好音乐的有10人, 爱好绘画的有20人, 爱好舞蹈的有7人 。 现将这组数据资料用 条形图展示出来 。
简单分组
例:中国的金融机构按所从事的业务分组
银行 保险公司 证券公司
金融机构 汽车金融公司
典当、担保 信托,基金管理公司
复合分组
中国的金融机构按业务范围和所有制性质分组 国有
银行 非国有
国有
金融机构
保险 非国有
证券
国有 非国有
汽车金融公司
国有
典当 非国有 信托 国有
国有 非国有
非国有
累计次数的特点是:同一数值的向上 累计和向下累计次数之和等于总体总次 数,而累计比率之和等于1。
ËÈ ýÊ
45
40
40
38
40
35
30
31
32
25
20
20
20
15
10
9
8
5
0
2
50-60· Ö 60-70· Ö 70-80· Ö 80-90· Ö 90-100
ÀÛ ¼Æ ´Î Êý ÕÛ Ïß Í¼
2000 以下
210
39.6
2000-2500
187
35.3
2500 以上
133
25.1


530
100.0
组别(变量) 次数(频数) 频率(比率)
一 分配数列的概念和种类
2.种类 以分组标志特征不同分为:
品质数列
变量数列
⑴ 品质数列

某班学生的性别构成情况
按性别分 组 男

合组别计
绝对数人 比重(%) 数

我国国内生产总值构成(%)
年份 第一产业 第二产业 第三产业 合计
2000 2001 2002 2003 16.4 15.8 15.3 14.6 50.2 50.1 50.4 52.5 33.4 34.1 34.3 33.1
100.0 100.0 100.0 100.0
⑶ 分析分组
研究经济现象之间的依存关系。
缺下限开口组的组中值 上限 邻组组距 2
缺上限开口组的组中值 下限 邻组组距 2
4.计算各组的频数和频率
频率

每组次数 总次数
5.做出次数分布的直方图和折线图
累计频数
在分配数列中,如果想知道某数值以上或 某数值以下的次数,必须计算各组的累计次数。 (一)向上累计
从变量值小的方向向变量值大的方向逐次 累加,以计算各组的累计次数。向上累计表明 各组上限以下总共所包含的总体次数和比率的 大小。 (二)向下累计
第三章 统计资料的整理
了解数据资料整理的重要意义 熟悉数据资料整理的基本步骤 掌握统计分组的原则和技巧 学会编制各种分配数列 能够用Excel制作各种统计图形 学会设计统计表
第一节 数据整理的基本问题
1、 数据整理是统计研究工作的第二个阶段, 是对统计调查来的资料用科学的方法进行加工 处理,使资料系统化、条理化、档案化,为统 计分析服务。
甲城市
户数 百分比 向上累计
(户) (%) 户数(户) 百分比(%)
24
8
24
8.0
108 36
132
44.0
93 31
225
75.0
45 15
270
90.0
30 10
300
100.0
300 100


甲城市家庭对住房状况的评价
甲城市
回答类别 户数 百分比 向下累计
(户) (%) 户数(户) 百分比(%)
复合分组
例,国际上对中小企业的标准界定为“2、3、4”, 即员工在2000人以下,销售额在3亿元以下,资 产总额在4亿元以下。由此标准,我国目前的大 企业仅1948家,99%以上为中小企业。
分组体系
对现象进行多种分组、再排列起来的结果 平行分组体系:按多个标志进行简单分组,
再排列 层叠复合分组体系:先进行多种复合分组,
第二节 统计分组
一 统计分组的概念和作用
1.概念 把同质总体中的具有不同特点的
单位分开,从而正确地认识事物 的本质及其规律性。
2.作用 主要有三个方面:
1、划分现象的类型 2、揭示现象的内部结构 3、分析现象之间的依存关系
⑴ 类型分组
揭露社会经济现象的类型,反映各类型的特点。

单位:亿元
类 型 2000年 2001年 2002年 2003年 农业 13 873.6 14 462.8 14 931.5 14870.1
相关文档
最新文档