统计基础项目化教程第三章统计整理
统计学基础第三章统计整理

第三章统计整理【教学目的】1. 深刻理解统计分组的作用,并且能够对不同的社会经济现象进行统计分组2. 运用分配数列对原始数据进行系统整理3. 制作统计表,运用计算机绘制统计图【教学重点】1. 能够对不同的社会经济现象进行统计分组2. 运用分配数列对原始数据进行系统整理3. 制作统计表,运用计算机绘制统计图【教学难点】1. 运用分配数列对原始数据进行系统整理2. 制作统计表,运用计算机绘制统计图【教学时数】教学学时为8 课时【教学内容参考】第一节统计整理的意义一、统计整理的意义统计整理,就是根据统计研究的目的和任务的要求,对统计调查所搜集到的原始资料进行分组、汇总,使其条理化、系统化,从而得到表现总体特征的综合统计资料的工作过程。
对于已整理过的初级资料进行再整理,也属于统计整理。
统计调查取得的各种原始资料是分散的、不系统的,只能表明各个被调查单位的具体情况,反映事物的表面现象或一个侧面,不能说明事物的总体情况与全貌。
因此,只有对这些资料进行加工、整理,才能认识事物的总体及其内部联系。
例如,工业企业普查中,所调查的每个工业企业资料,只能说明每个工业企业的经济类型、注册资本、职工人数、工业总产值、工业增加值、实现利税等具体情况。
必须通过对所有资料进行分组、汇总等加工处理后,才能得到全国工业企业的综合情况,从而分析工业企业的构成、经营状况等,达到对全国工业企业的全面的、系统的认识。
统计整理是统计调查的继续,也是统计分析的前提,它在统计研究中起着承前启后的作用。
因此,资料整理得是否正确,直接决定着整个统计研究任务的完成,不恰当的加工整理,不完善的整理方法,往往使调查得来的丰富、完备的资料失去价值。
因此,必须十分重视统计整理工作。
二、统计整理的步骤统计整理的基本步骤是:(一)对原始资料进行审查。
1. 审查被调查单位的资料是否齐全;2. 应审查数据是否准确。
审查的办法主要有:①逻辑审查:主要是从定性角度审查数据是否符合逻辑,内容是否合理,各项目或数量之间有无相互矛盾的现象。
第三章统计整理

实践环节:用EXCEL绘制统计图和统计表。 包括:表格的绘制、填写、编辑
直方图、折线图、条形图、圆形图等的绘制和编辑。
本章习题
1、某工厂同工种的50名工人完成生产定额百分数(%) 资料如下:
83 88 123 110 118 158 121 146 137 120 163 125 136 127 142 118 123 126 138 151 101 86 82 113 142 108 101 105 125 116 132 138 117 103 114 131 108 87 119 127 105 115 126 125 110 107 141 135 117 93 要求:(1)根据上述资料编制变量数列
4.房地产广告 5.招生招聘广告 6.其他广告
某城市居民关注广告类型的频数分布表
广告类型
人数(人)
比例
频率(%)
商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告
合计
112
0.560
56.0
51
0.255
25.5
9
0.045
4.5
16
0.080
8.0
10
0.050
5.0
2
0.010
1.0
品质分布数列: 数量分布数列:简称为变量数列
二、变量数列的种类
按组的表示方式不同可分为:
1、单项变量数列:每组用一个数表示。 适合于离散型变量,而且 变量值较少的情况。
如:
工人按日产量(件)分组 工人数(人)
2
5
3
10
4
3
2、组距数列:
适合于连续型变量,而且变量值较多的情况。 可采用等距分组,也可采用不等距分组
统计基础项目化教程-学习领域3

2020/11/22
5
学习领域3:统计整理
• 【学习目标】
知识目标
· 统计整理的基本内容 · 统计分组方法 · 分布数列的编制 · 统计表的设计、统计图的绘制
能力目标
·能通过调查资料,掌握统计整理的基本技能 ·能将基本理论知识转化为实践应用和实际操作 ·能用Word、Excel等工具软件编制统计表、绘制统计图
5
合计
52
人数频 率(%)
1.92 9.62 19.23 34.26 13.46 11.54 9.62
100.00
向上累计
人数 频率(%)
1
1.92
6
11.54
16
30.77
34
65.38
41
78.84
47
90.38
52
100.00Βιβλιοθήκη ------向下累计
人数 频率(%)
52
100.00
51
98.08
46
7
13.46
6
11.54
5
9.62
52
100.00
2020/11/22
11
学习单元3.3 分布数列
2016年1月A公司一车间工人月生产零件数的累计分布数列
月生产零件 人数 数(件) (人)
350件以下
1
350—400
5
400-450
10
450-500
18
500-550
7
550-600
6
600件以上
二、统计整理的步骤(或整理的内容)
第一步:审核资料 准确性审核、完整性审核和及时性审核三个方面
第三章 统计整理(第3、4节)

2.组距数列的编制
组距数列:指每个组的变量值用一个区间来表现的变量数列。
编制条件:
变量是连续变量; 或:总体单位数较多变量不同取值个数也较多的离散变量。 编制步骤:
(1)将变量按由小到大的顺序排列,以看出变量值变动的范围大小 ,并确定全距。 全距=最大变量值-最小变量值
@2012 SIE Management Engineer System
5
第三章 统计整理
二、分类数列的种类
(一)品质数列
根据品质标志分组形成的分配数列叫品质分配数列,简称品质数列。
(二)变量数列
根据数量标志分组形成的分配数列称为变量分配数列,简称变量数列 。
@2012 SIE Management Engineer System
6
第三章 统计整理
三、变量数列的种类
13
第三章 统计整理
(2)确定组距和组数。 等距数列:变量值变动区间的长度相等。 异距数列:变量值变动区间的长度不完全相等。
确定组距的原则:
要能区分各组的性质差异 要能反映总体资料的分布特征 为方便计算,尽可能为5或10的整数倍 (3)确定组限及组限的表式方法。 (4)计算频数,编制变量数列。
日产量/件 20 21 22 23 24 25 26 合计 工人数/人 3 5 6 4 3 2 1 24 比重/% 12.5 20.8 25.0 16.7 12.5 8.3 4.2 100.0
@2012 SIE Management Engineer System
12
第三章 统计整理
100以下
《统计学基础》模块3统计整理

统计分组的原则:必须保证在某一标志上组内 各单位的同质性和组与组之间的差异性。
《统计学基础》模块3 统计整理
单元二 统计分组
三、统计分组的种类
1.按照统计的任务和作用的不同,分为类型分组、结 构分组和分析分组。
类型分组 是把复杂的现象总体按主要的品质标志分成不同性质 的部分的分组。
把所有数据分成若干组,每个小组的两个端点之间的距离 (组内数据的取值范围)称为组距。
3.开口组和闭口组:若一组内有上限缺下限,或有下限缺上
限称为开口组;若一组内的上限、下限都齐全称为闭口组。 开口组常常用“××以下” (称下开口) 或“××以上” (称上开 口)表示
《统计学基础》模块3 统计整理
关于组距式变量数列的几个主要概念
结构分组 在对总体分组的基础上计算出各组对总体的比重,以 便研究总体内部的结构。
分析分组 是为研究现象之间的依存关系的分组。分析分组有明 显的特征,易与类型分组、结构分组区别。分析分组的分组 标志称为原因标志,与原因标志对应的标志称为结果标志。 原因标志多是数量标志,也运用品质标志;结果标志一定是 数量标志,而且要求计算为相对数或平均数。
《统计学基础》模块3 统计整理
单元二 统计分组
三、统计分组的种类
2.按照分组标志的多少统计分组分为简单分组和复 合分组。
简单分组 是指总体只按一个标志进行的分组。 复合分组 则是各个组按两个以上的标志重叠起来进
行分组。
《统计学基础》模块3 统计整理
单元二 统计分组
三、统计分组的种类
复合分组
1980——1984年我国对外贸易发展变化情况的统计表
《统计学基础》模块3 统计整理
《统计学基础》模块3 统计整理
统计基础知识项目三 统计整理 教学课件

课外补充
统计整理软件SPSS简介
SPSS(Statistical Product and Service Solutions),“统计产品与服务解决方案”软 件。它集数据录入、整理、分析功能于一身。用户可以根据实际需要和计算机的功能选择模块, 以降低对系统硬盘容量的要求,有利于该软件的推广应用。SPSS的基本功能包括数据管理、统计 分析、图表分析、输出管理等等。SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、 相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响 应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、 Logistic回归、Probit回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且 每个过程中又允许用户选择不同的方法及参数。SPSS也有专门的绘图系统,可以根据数据绘制各 种图形。
课外补充
组中值 在统计分析时,通常会以组中值来代表各族标志值的平均水平。所 谓组中值,是指代表每组数值中间水平的值。其计算公式如下:
闭口组的组中值=(上限+下限)/2 缺下限的开口组组中值=上限-邻组组距/2 缺上限的开口组组中值=下限+邻组组距/2
02 知识链接
五、统计的分工组作的过原程则
1. 穷尽原则
01 三、统计数据的审核
2. 数据校订
(2) 处理不满意答案。处理不满意答案有两种方法:按缺失值处理、整 个问卷作废。
① 出现以下情况时,将含不满意答案的问卷按缺失值处理: a.存在不满意答案的问卷数量很小。 b.在整份问卷中,不满意的答案所占比例较小。 c.含有不满意答案的变量(问题)不是关键变量。 处理缺失值的方法有三种:一是用一个样本统计量的值去代替缺失值;二 是用从一个统计模型计算出来的值去代替缺失值;三是保留问卷,缺失的答案 仅在相应的分析中做必要的删除。
统计基础项目化教程第三章统计整理

2020/10/22
扬州大学管理学院
11
正确选择分组标志的要求:
(1)必须根据统计研究的任务及其目的来 选择分组标志; (2)必须选择最能反映现象本质区别和内 在联系的标志作为分组标志; (3)必须结合现象所处的具体历史条件和 经济条件动态地选择分组标志。
2020/10/22
扬州大学管理学院
12
2、正确确定各组的界限
2020/10/22
扬州大学管理学院
10
二、 统计分组的方法
统计分组的关键在于选择分组标志和确定各组 的界限。
1、分组标志的选择:
分组标志,即将同质总体区分为不同组的标准或 依据。分组标志的选择是统计分组的关键。分组标 志一旦选定,就必然突出了总体在该标志下的性质 差别,其他的差别看不见了。分组标志选择不当, 不但无法显示现象的根本特征,甚至会混淆事物的 性质,歪曲社会经济的真实情况。
2020/10/22
扬州大学管理学院
14
(2)选择数量标志分组的方法
按数量标志分组,其变量有两种类型:离散型变 量和连续型变量。
离散变量指所描述对象的数量特征可以按一定次 序一一列举它的数值;连续变量指所描述的数量特 征在一个区间里可以有无限个数值,无法一一列举。 根据这两种变量的不同特征,在分组时,对离散变 量,如果变量值的变动幅度小,就可以一个变量值 对应一组,称单项式分组。如居民家庭按儿童数或 人口数分组,均可采用单项式分组。
就是说,离散变量根据情况既可用单项式分组,也
可用组距式分组。在组距式分组中,相邻组既可以有
确定的上下限,也可将相邻组的组限重叠。
连续变量由于不能一一列举其变量值,只能采用
组距式的分组方式,且相邻的组限必须重叠。如以
第三章统计整理

按照习惯,成绩一般分为不及格、及格、 按照习惯,成绩一般分为不及格、及格、中 良好、 等、良好、优秀
即 组限 60分以下 60~70 70~80 80~90 90分以上 65 75 85 组中值
上组限不在内
利用Excel Excel进行分组 ㈢ 利用Excel进行分组
数据分析” 直方图 直方图” 选“工具”-“数据分析”-“直方图” 工具” 数据分析 定义“输入区域” 数据 定义“输入区域”—数据 分组中每组上限, “接收区域”—分组中每组上限,包括在本组 接收区域” 分组中每组上限 内 “输出区域”—结果 输出区域” 结果
编制结果如下: 编制结果如下:
日产量(件)X 日产量(件)X 20 21 22 23 24 25 26 合计 工人数(人) 工人数(人) f 3 5 6 4 3 2 1 24
组距数列
指每个组的变量值用一个区间来表现 的变量数列
编制条件:
变量是连续变量; 变量是连续变量; 或:总体单位数较多,变量不同取值个数 总体单位数较多, 也较多的离散变量。 也较多的离散变量。
复合分组
按性别 分类
对教师 的分类
共计12组 共计 组 × × 男 2×3×2
女 高级 中级 初级 青年 中年
按职称 分类 按年龄 分类
第三节 次数分布 ★ 一、分布数列的概念及种类
二、组距数列的编制 三、累计次数与累计频率
将总体各单位按分组标志分组后, 将总体各单位按分组标志分组后, 次数分布 形成的各单位在各组的分布
地位
统计整理的步骤
拟定统计整理方案 统计资料的预处理 数据处理 制作统计表或统计图
第二节 统计分组
将总体中所有单位按一定的标志划 统计分组 分为类型或性质不同的若干部分的 过程 统计分组的作用: 划分现象的类型 反映现象内部结构 分析现象之间的依存关系
第三章 统计整理PPT教学课件

第一节统计整理的意义和内容 一、统计整理的意义 统计整理:根据统计研究的任务与要求,
对通过统计调查取得的资料进行分组、 汇总,使其条理化、系统化的工作过 程。
2020/12/101二、统计整理的步骤和内容 1、设计和编制统计资料整理方案 2、对调查来的资料进行审核 3、对资料进行分组、汇总和计算 4、对整理后的资料再一次进行审核 5、将汇总整理的结果编制成统计表
2020/12/10
24
(二)国民经济中常用的几种分组(类)标 准
1、经济类型分组(9类) (1)国有经济(2)集体经济 (3)私营经济(4)个体经济 (5)联营经济(6)股份制经济 (7)外商投资经济(8)港澳台投资经济 (9)其他经济
2020/12/10
25
三次产业分类
第一产业:农业(农业、林业、牧业、渔业)
2020/12/10
14
为了解工业企业职工总体的基本情况,选择 年龄、文化程度、工龄和操作形式等标志 进行分组:
2020/12/10
15
按年龄分组 20岁及20岁以下 21岁—35岁 36岁—50岁 51岁—55岁 56岁—60岁 60岁以上
按文化程度分组 大专以上 中专 技工 高中 初中 小学
2.选择能够反映事物本质特征的标志作 为分组标志
2020/12/10
8
(二)分组方法
1.按品质标志分组
按品质标志分组是指选择反映事物属性 差异的品质标志作为分组标志进行分 组,并在品质标志的变异范围内划定 各组界限,将总体划分为若干个性质 不同的组成部分。
2020/12/10
9
为了使复杂的分类在全国统一执行, 国家统计局及中央有关部门,统一制 订有各种分类目录与规定标准,如: 《工业部门分类目录》《工业产品目 录》《大中小型工业企业划分标准》 《经济类型划分规定》
第三章 统计整理 《统计学原理》PPT课件

(一)正确选择分组标志
1.根据统计研究的目的选择分组标志 2.选择最能反映事物本质特征的标 志进行分组 3.选择分组标志时,要考虑到现象发展 的历史条件和经济条件
(二)按品质标志或按数量标志分组
1.按品质标志分组 2.按数量标志分组
(三)简单分组和复合分组
1.简单分组。简单分组是指对所研究 的总体按一个标志进行分组。
品质分布数列和变量分布数列
按品质标志分组形成的次数分布 数列叫品质分布数列,简称品质数列 (见表3-3)。
按数量标志分组形成的次数分布 数列叫变量分布数列,简称变量数列 (见表3-4) 。
查看Excel表3-3 查看Excel表3-4
品质分布数列
变量分布数列
(返回组距数列) 返回组限 下一个
二、变量数列的种类
在Excel内排序
(3)编制变量数列
查看Excel
下一个
(4)编制累计次数(频数)分布数列与 累计频率分布
查看Excel
下一个
四、次数分布的主要类型
(一)钟形分布 (二)U形分布
(三)J形分布
(一)钟形分布
图3—2 钟形分布图
(二)U形分布
图3—3 U形分布图
(三)J形分布
图3—4 正、反J形分布图 下一个
组限
在组距变量数列中,表示各组界 限的变量值叫组限,其中较小的变量 值称为下限,较大的变量值称为上限。 (见表3-4) 。
组距=上限-下限 组中值=(上限+下限)÷2
开口组
编制组距变量数列时,常常使用 像“× ×以上”或“× ×以下”这样 不确定组限的组,称为开口组(见表 3-6) 。
查看Excel表3-6
开口组组中值计算公式
第三章统计整理

统计整理
第一节 统计整理的意义和步骤
第二节 统计分组
第三节 分配数列 第四节 统计表和统计图
本章的教学目的、要求及内容
一般了解统计整理的概念和内容、统计分组、分配 数列及统计表等概念和内容。
重点与难点:重点掌握统计分组的方法,在分组的 基础上进行次数分配数列的编制,并学会用统计表 来表示统计资料。
预处理
分组汇总
编制表图
数据的预处理
数据的预处理,主要包括三个方面: 1. 数据的审核 2. 数据的筛选 3. 数据的排序
统计数据资料整理的内容
统计整理的步骤:
(1)拟定统计整理方案 (2)审查原始资料 (3)对各项原始资料分组、汇总,计算总体总量指标 (4)将汇总的结果,以统计表或统计图的形式表现出 来 (5)将统计资料进行系统积累
统计分组的作用 3、揭示现象的内部结构
现象的内部结构是表明现象本质特点的一个重要方面,将同 一总体不同时期的结构联系起来,还可以看到现象的发展趋 势和规律。 “九五”期间我国国内生产总值构成(%)
年
份
1996
20.4
1997 1998
19.1 18.6
1999
17.6
2000
15.9
第一产业
第二产业
分配数列表
频数
分布数列的种类
分布数列以分组标志特征不同可以 分为: 品质数列
Байду номын сангаас
变量数列
品质数列
品质数列:按品质标志分配而形成的数列叫属性 分配数列,简称品质数列。用来观察总体单位中 不同属性的单位分布情况。
例 某班学生的性别构成情况
按性别分 组 男 女 合计
绝对数人 比重(%) 数 30 75 10 40 25 100
第三章 统计整理

开口组组中值的确定
缺下限开中组组中值=上限-邻组组距/2 缺下限开中组组中值=上限-邻组组距/2 缺上限开中组组中值=下限+邻组组距/2 缺上限开中组组中值=下限+邻组组距/2
19:18:05
31
把资料中各数值归到应属的组内
按照各个总体单位的具体标志值, 按照各个总体单位的具体标志值 , 将其划归某一 具体组之中, 在归类汇总时 , 要遵循 “ 具体组之中 , 在归类汇总时, 要遵循“ 不重复不 遗漏”的基本原则。 遗漏”的基本原则。 对于单项数列和不重叠设置的离散型组距数列来 说,上述原则容易做到。 上述原则容易做到。 对于重叠设置的连续型组距数列来说, 对于重叠设置的连续型组距数列来说 , 应处理好 恰好是组限的标志值的总体单位之归类问题, 恰好是组限的标志值的总体单位之归类问题 , 一 般应按“ 上组限不在内 ” 原则 , 般应按 “ 上组限不在内” 原则, 即本组下限的次 数属于本组, 本组上限的次数归于邻近的较大组 。 数属于本组 , 本组上限的次数归于邻近的较大组。
19:18:05
34
确定组数和组距
根据考试成绩性质的不同,在60分的基础上 根据考试成绩性质的不同,在60分的基础上 分为不及格、及格、中等、良好、优秀五 个类型。 令组距=10 令组距=10 则组数=43/10=4.3,因此组数取5 则组数=43/10=4.3,因此组数取5。
19:18:05
35
品质标志分组 数量标志分组
19:18:05
17
四、简单分组和复合分组
根据分组选择标志的多少不同,统计分组又可分 为: 简单分组
简单分组是指对统计总体仅按一个标志进行分组
统计基础第三章

次数
2.较大制累计。从最大一组算起,大于该组下限的累计 次数
• 根据累计次数表可以绘制累计次数图。 • 以累计次数为纵坐标,分组为横坐标,较小制累计次 数曲线以各组上限为横轴,较大制以各组下限为横轴。
第四节 统计数据的表现形式 一、统计表
(一)统计表的意义 是表现统计资料的一种形式,即将调查得来的原始资 料经过整理,使之系统化,用表格形式表现。 优点:
(二)次数分布的主要类型
• 社会经济现象的复杂性,决 定了在分组基础上形成的次 数分布的类型也不一样,概 括起来主要有钟形分布、U 形分布和J形分布三种。
三、累计频数和频率分布
累计频数(cumulative frequencies)即从数列的头或尾开始, 截止到某一组的上限或下限止,累计出现的次数。 分为: 1.较小制累计。从最小一组算起,小于该组上限的累计
(二)组距式分配数列
• 2.组距数列的相关概念 上限(upper limit):组的最大值 下限(low limit):组的最小值
组距=上限-下限
全距=最大组的上限-最小组的下限
组中值(class midpoint)即各组上、下限的中点
=(上限值+下限值)/2
缺下限的开口组组中值=上限-邻组组距/2 缺上限的开口组组中值=下限+邻组组距/2
二、统计分 组的作用
(三)分析现象之间的 数量依存关系
三、统计分组的基本原则 通过统计分组,必须保持组内统 计资料的同质性,组间统计资料的差 异性。 四、分组标志的选择 1.要能充分反映研究目的 2.要能反映事物的本质 3.不能脱离现象所处的历史条件且要科学、 互斥和穷尽
五、统计分组的类型
性别 男 女
某企业工人性别构成情况(1) 人数/人 200 52 26 频率(% ) 100 43 22
第三章 统计整理

单项式分组:
工人平均日产量资料
工人平均日产量(件) 2 3 4 5 6 合计 工人数 绝对数 比重(%) 10 8.7 15 13.0 30 26.1 40 34.8 20 17.4 115 100.0 上一页 下一页
返回本节首页
组距式分组:
某工厂工人完成生产定额情况表 工人完成生产定额分组(%) 工人数 绝对数 比重(%) 80~90 30 16.7 90~100 40 22.2 100~110 60 33.3 110~120 30 16.7 120~130 20 11.1 合计 180 100.0
某班学生籍贯分布表 地区分 绝对数人数 安徽 30 非安徽 10 合计 40
比重(%) 75 25 100
第3章 统计整理
42
单项式数列:一个变量值代表一组。
工人生产情况表 产量(件) 工人数
第3章 统计整理 11
2、统计分组目的: 总体经过分组,能够突出组与组之间的 差异,抽象掉组内各单位之间的差异, 使数据变得条理化,便于进一步分析研 究。
上一页
下一页
返回本节首页
3、统计分组的原则
⑴穷尽性
就是使总体中的每一个单位都应有组可归, 或者说各分组的空间足以容纳总体所有的单位。 例如:从业人员按文化程度分组,分为小学 毕业、中学毕业(含中专)和大学毕业三组,那 么,文盲及识字不多的以及大学以上的学历者则 无组可归。如果将分组调整为:文盲及识字不多、 小学程度、中学程度、大学及大学以上,那么就 可以包括全部从业人员的各种不同层次的文化程 度,符合了分组的穷尽性原则。
位数。
频率(f/∑f):次数的相对数,各组次数占总
次数的比重。
上一页 下一页 返回本节首页
㈡统计分布(分配数列)的分类
第三章 统计整理

1.分组标志的选择原则 (1)应根据研究的目的与任务选择分组标志。 例如,同一个工人总体,有多种不同分组方法: ①如果研究学历对收入的影响时,应选择“文 化程度”作为分组标志。 ②如果研究资历对收入的影响时,则应选择 “工龄”作为分组标志。
(2)要选择能够反映事物本质或主要特征的标志。 例如,研究职工生活水平的高低情况时,可 以用“职工的工资水平”作为分组标志,也可以 用“职工家庭成员平均收入水平”作为分组标志。 应该选择后者作为分组标志。 (3)要根据现象的历史条件变化来选择分组标志。 例如,前面讲到研究职工生活水平问题,如 果要列出“职工生活贫困户”一组,则“贫困户” 的标准就随历史条件变化而变化,而且不同地区 标准也不相同。
第三节,变量数列(分配数列)
一、分配数列(次数分布)的概念
在统计分组的基础上,将总体中所有单位按组 归类整理,并按一定的顺序排列,形成总体中各单 位数在各组间的分布称为次数分布,又称分布数列 分布在各组的个体单位数叫次数,又称频数 (fi)。各组次数与总次数(Σfi)之比称为比 率,又称频率。 分配数列(次数分布)有两个构成要素:一 个是分组,另一个是次数。 统计分布的实质:把总体的全部单位按某标 志所分的组进行分配所形成的数列。
第二节 统计分组
一、统计分组的意义: • 统计分组的含义:是根据统计研究任务的 要求和现象总体的内在特点,把统计总体 按照某一标志划分为若干性质不同而又联 系的几个部分(或组)的一种统计方法。 统计分组的关键是分组标志的选择和 划分各组界限。而核心问题是正确地选择 分组标志。 (下)
• 在一个总体中,单位的品质标志或数量标志, 其标志表现可能是互不相同的,总体内部各 个单位间存在许多的变异标志又是人们把总 体进一步分为性质不同的几个部分的客观依 据。 • 统计分组是在总体内部进行的一种分类。兼 有“分”和“合”的双重含义:对总体而言 是“分”(分为范围更小的总体),而对总 体单位而言是“合”(合为性质相同的组); 对分组标志而言是“分”(按分组标志划分 总体成为标志表现不同的许多组),而对其 它标志来说又是“合”(其它标志表现的差 异消失了)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2、意义
(1)区分社会经济现象的类型 亦称类型分组。由于社会经济现象的复 杂性,客观上存在着各种不同的社会类型, 利用统计分组,就能根据统计研究的目的, 将现象区分为各种性质不同的类型,来研究 各类现象的数量差异和特征以及相互关系。 例如(下表)
某地区工业资金利润率的类型差别情况
企业经济类型 (品质标志)
商店按销售额 商店数 商品流通费用率
分组(万元) (个)
(%)
100以下
10
9.8
100—300
12
8.7
300—500
11
7.5
500—700
9
6.5
700—900
8
5.8
900以上
6
5.4
从表中可以看出,随着商品销售规模的扩 大,其流通费率在相应降低,两者表现出负依 存关系。
二、 统计分组的方法
国有 集体 其他 全市工业
资金利润率% (被分组指标)
5.2 4.8 7.6 5.6
从上表可以看出,其他所有制的工业企业 指标最好。国有企业次之,集体企业最差。
(2)反映经济现象的内部结构
亦称结构分组。现象内部的结构,表明 现象内部的组成状况和比率关系。利用统 计分组,计算出各组数值在总体中所占的 比重,对其进行内部结构研究,来说明现 象的基本性质和特征。同时,对现象内部 结构的变化进行动态研究,还可以反映总 体现象发展变化的过程、趋势和规律。
离散变量如果变量值变动幅度很大,变量值个数很 多,则把整个变量值依次划分为几个区间,各个变量 值则按其大小确定应归并的区间,区间的距离称为组 距,这样的分组称为组距式分组。
就是说,离散变量根据情况既可用单项式分组,也 可用组距式分组。在组距式分组中,相邻组既可以有 确定的上下限,也可将相邻组的组限重叠。
统计分组的关键在于选择分组标志和确定各组 的界限。
1、分组标志的选择:
分组标志,即将同质总体区分为不同组的标准或 依据。分组标志的选择是统计分组的关键。分组标 志一旦选定,就必然突出了总体在该标志下的性质 差别,其他的差别看不见了。分组标志选择不当, 不但无法显示现象的根本特征,甚至会混淆事物的 性质,歪曲社会经济的真实情况。
分组体系有平行分组体系和复合分组体系 两种。平行分组体系是选择两个或两个以上 的标志对总体进行一次次简单分组后所形成 的体系;复合分组体系就是选择多个分组标 志层迭起来的分组形成的体系。
平行分组体系:
选择多个分组标志进行多次的简单分组。
工业企业
所有制 国有及国有控股 集体企业 股份制企业
┅┅
规模 大型企业 中型企业 小型企业
(2)选择数量标志分组的方法
按数量标志分组,其变量有两种类型:离散型变 量和连续型变量。
离散变量指所描述对象的数量特征可以按一定次 序一一列举它的数值;连续变量指所描述的数量特 征在一个区间里可以有无限个数值,无法一一列举。 根据这两种变量的不同特征,在分组时,对离散变 量,如果变量值的变动幅度小,就可以一个变量值 对应一组,称单项式分组。如居民家庭按儿童数或 人口数分组,均可采用单项式分组。
第二节统计分组
一、统计分组的意义
1、概念: 根据统计研究任务的要求和现象总体的内在
特点,把统计总体按照某一标志划分为若干性质 不同而又有联系的几个部分,称为统计分组。
把统计总体的各个单位按照一个或几个标志 划分为若干部分,使同一性质的单位集中起来即 “组(合)”,不同性质的单位区分开来即“分”,
以 便形成“组内同质性,组间差别性”的分组效果。
分组标志按其形式的不同,可分为品 质标志和数量标志。统计总体可按品质 标志分组,也可按数量标志分组。
(1) 选择 品质标志分组的方法
按品质标志分组即选择反映事物属性差异的品 质标志作为分组标志进行分组,当分组标志一旦 确定,组名称和组数就确定,不存在组与组之间 的界限区分的困难。有些复杂的品质标志分组可 根据统一规定的划分标准和分类目录进行。
统计基础项目化教程第 三章统程第三章统计整理
2、意义:
统计整理在整个统计研究中占有重要 的地位。统计整理包括对原始资料和次级 资料的整理。 统计整理是统计调查的继续, 是统计分析的前提和基础,在整个统计工 作中发挥着承上启下的作用。
二、统计整理的步骤
1、对统计调查资料进行审核 2、编制统计汇总方案 3、根据统计汇总方案,进行实际汇总工作, 并进行有关计算 4、再一次进行审核 5、编制统计图表
正确选择分组标志的要求:
(1)必须根据统计研究的任务及其目的来 选择分组标志; (2)必须选择最能反映现象本质区别和内 在联系的标志作为分组标志; (3)必须结合现象所处的具体历史条件和 经济条件动态地选择分组标志。
2、正确确定各组的界限
分组标志确定后,就可以进一步在分 组标志的变异范围内,具体划分各组的 界限。
某地区工业企业经济类型产值结构情况
企业经济类型 (分组标志)
国有 集体 其他 全市工业
产值(亿元) (被分组指标)
75 40 29 144
反映了该市工业企业经济类型的产值结 构状况
(3)揭示经济现象的相互依存关系
亦称分析分组。社会经济现象之间都 存在着不同程度的相互联系、相互制约的 依存关系。利用统计分组,可以从数量上 揭示出现象之间的这种依存关系。即分析 现象中的影响因素和被影响因素,结合分 组,来观察影响因素对被影响因素作用的 程度和方向。
1492
3、统计分组的种类:
按分组标志的性质分为品质分组和变量 分组。(如前面所讲)
按分组标志的多少分为简单分组和复合 分组。简单分组:只选择一个分组标志进 行的分组;复合分组:选择多个分组标志 进行的分组,并且层叠在一起。
4、统计分组体系:
统计分组后所形成的一系列互相联系、互 相补充的组的整体称分组体系。
连续变量由于不能一一列举其变量值,只能采用 组距式的分组方式,且相邻的组限必须重叠。如以 总产值、商品销售额、劳动生产率、工资等为标志 进行分组,就只能是相邻组限重叠的组距式分组。
年龄 0—2 3—6 7—16 17—25 26—40 41—60 >60 合计
人数 30 87 141 248 473 415 98
行业 机械 电子 化工 冶金
复合分组体系:
选择多个分组标志层叠起来进