第三章 统计整理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

组中值 每一组中点位置的数值
重合式组限组的组中值= 非重合式组限组的组中值=
上限 下限
2
本组下限 后一组下限
2
注意
开口组以相邻组的组距作为该组的组距, 确定其下限或上限,再计算组中值。
缺下限开口组的组中值=上限 - 邻组的组距 2
缺上限开口组的组中值=下限 邻组的组距 2
某地区100个百货商店 月销售额与流通费用情况
3.数据的排序
数据排序就是按照一定的顺序将数据排列,以 便初步显示数据的一些明显特征和规律,为研究者 找到解决问题的线索。此外,排序还有助于对数据 的检查纠错,为分组、汇总提供依据。
对于定类数据,可以按字母的顺序或笔画数的 多少顺序排序;
对于定距数据和定比数据,可以按递增顺序排列 或按递减顺序排列。
编制结果如下:
日产量(件)X 工人数(人) f
20
3
21
5
22
6
23
4
24
3
25
2
26
1
合计
24
将作为分组依据的数量标志的整个取 组距式分组 值范围依次划分为若干个满足互斥性
和包容性的区间,用这些数值区间作
编制条件: 为组的名称。
变量是连续变量;
或:总体单位数较多,变量不同取值个数也较
多的离散变量。
二、统计整理的内容
工作内容
资料审核
分组和汇总
统计图表
资料积累
完整性
准确性
及时性
三、统计数据预处理
1.数据的审核与筛选
完整性
检查应调查的单位或个体是否有遗漏, 所有的调查项目或指标是否填写齐全等。
准确性
一是检查数据资料是否真实地反映了客 观实际情况,内容是否符合实际;二是 检查数据是否有错误,计算是否正确等。
复合分组体系
对同一总体选择两个或两个以上 标志分别进行层叠分组。各分组 标志表现交叉结合使用。
平行分组体系
按性别分类
对教师 的分类
按职称分类
按年龄分类
男性 女性
高级 中级 初级
青年 中年
共计7组 2+3+2
复合分组体系
按性别 分类
对教师 的分类
按职称 分类
按年龄 分类
共计12组 男 2×3×2 女
=150(万元)
七、统计资料的再分组
统计资料的再分组是指把统计分组资料按某种 要求重新划定各组界限,再将资料中的单位数或比 重分布做出相应的调整。
再分组的步骤如下: 1.确定再分组的各自范围。 2.计算新组各自相连组的比例。可用相连组的 部分组距除以相连组的组距之和而求得。 3.确定再分组的对应单位数。即计算各组变量 值的区间范围所对应的单位数 。
某班学生统计学 成绩分组
60分以下 60—70分 70—80分 80—90分 90分以上
组距式分组中的一些概念
组限
上限 下限
区间数值的最大值 区间数值的最小值
如果分组标志是连续型变量,则组限一般用重合式表达;如 果分组标志是离散型变量,则组限一般用不重合式表达。
相邻两组中,前一组的上限与后一组 重合式 的下限数值相重叠。
(1)对于可以肯定的一般错误,应及时代为更 正,并向有关单位核对;
(2)对于可疑之处或无法代为更正的错误,应 通知原报单位复查更正;
(3)对于在一个单位发现的有代表性的重大差 错,除通知原报单位更正外,还要将差错情况通报尚 未报送资料的单位,以防止类似错误的发生;
(4)对于严重的错误,应发还重填,并查明发 生错误的原因;属于违反法规的,应依法严肃处理。
再分组中用比例分摊相应的单位数是假定现象 为均匀变动,而客观情况并非完全如此,故再分组 的结果一般表现为近似值。
某工业部门劳动生产率分组表
组号
1 2 3 4 5 6 7 8 9 10
按劳动生产率 分组(千元/人)
6以下 6~7 7~8 8~9 9~10 10~11 11~12 12~13 13~14 14以上
销售额(万
上组限U 元)
商 (店 个数 )=1每 额0如0百 中费-:元 支5(0组商 付=元品 的距5)0销流d(售通=万U-元L )
50以下
10
14.2
50~100 20
11.4
100~200 30
10.1
200~300
下组限L 300以上
25 如:组9中.2值x=(U+L)/2
15
8=.5(100+200)/2
1. 简单品质标志分组 简单品质分组指分组标志一经确定,组的名称
和组数也就随之确定,而且各单位应分在哪一组也 比较明确,不存在组与组之间界限区分困难的分组。
2.复杂品质标志分组 复杂品质分组指分组标志选定以后组间界限不
易划分,存在交叉过渡形态,总体中的各单位归并 于何组比较困难的统计分组。这种分组又叫分类。
统计分组 若干类型(组),使组内的差异尽可能
小,组间的差别尽可能明显,从而使大 量无序的、混沌的数据变为有序的、反 映总体特征的资料。
统计分组具有分与合的双重功能,是分与合的对立 统一。 统计分组的目的是要在同质性的基础上研究总体的 内在差异性。 统计分组存在一定的局限性。 统计分组的关键是选择分组标志和划分各组界限。
一般按“上限不在内”的原则处理。
不重合式
前一组的上限与后一组的下限两变 量值紧密相连但不重叠。
组距 每一组的区间长度 组距=上限-下限
开口组 缺少上限数值或下限数值的组
各组组距都相等的分组称为等距分组。 各组组距不相等的分组则称为异距分组,或称 不等距分组。
组数 分组的个数
等距分组组距=(最大值-最小值)/组数 组数与组距成反比,即组数少,则组距大;组数多, 则组距小。
二、统计分组的作用
1. 划分现象的不同类型
例:按所有制性质划分,我国现有8种经济类型: 国有经济;集体经济;私营经济;个体经济联营经 济;股份制经济;外商投资经济;港澳台投资经济
2. 反映总体内部结构和特征 例:上海市按GDP计算的三次产业结构(%)
GDP 第一产业 第二产业 第三产业
1980年 100 3.2 75.7 21.1
合计
企业数 比例(%)
11 14 10 15 20 9 12 4 2 3
100
职工数 比例(%)
6.20 9.48 10.78 16.26 20.00 12.93 11.54 5.40 2.69 4.72
100.00
总产值 比例(%)
9.66 12.83 13.00 16.78 19.12 10.98 9.04 3.82 1.84 2.93
f
f/∑f
2000以下
50
2000~2100
72
2100~2200
105
2200~2300
487
2300~2400
f f
≤1,(2)
f f
=1
二、频数分布的种类
按分组标志和分组形式的不同可分成如下类别:
频数分布
品质数列 变量数列
单项数列 组距数列
等距数列 异距数列
品质频数分布 2009年末我国大陆人口的城乡分布
按城乡别分组
总人口 城镇 乡村
人口(万人) f
133474 62186 71288
构成(%) f/∑f
例:研究贫富差别的基本方法:将人口按收入水平等 分为 5 组,观察收入差别。
20% 20% 20% 20% 20%
中国2003年:最富的20%家庭拥有全部财富的41%, 最穷的20%家庭拥有全部财富的8%。
三、统计分组的原则
1.穷尽原则:使总体中的每一个单位都应有组可 归。 2.互斥原则:使总体中的任何一个单位只能归属 于某一个组,而不能同时或可能归属于几个组。
100.0 46.6 53.4
单项式频数分布
某高校在校学生年龄分布
按年龄分组(岁) 学生人数(人) 比重(%)
f
f/∑f
17
54
5.4
18
189
18.8
19
228
22.7
20
283
28.1
21
131
13.0
22
97
9.6
23
24
2.4
合计
1006
100.0
组距式频数分布
某集团公司职工分组表
按月工资分组(元) 职工人数(人) 比重(%)
排序后的数据称为顺序统计量。
四、统计资料汇总
(一)统计资料的汇总技术 1.手工汇总:点线法、凭证法、过录法、折叠法、 卡片法 2.电子计算机汇总
(二)统计汇总的组织形式
1.逐级汇总 2.集中汇总 3.综合汇总
第二节 统计分组
一、统计分组的概念
根据统计研究的目的和要求,将总体 单位或全部数据按照一定的标志划分成
和统计图的制作。
第一节 统计整理概述
一、统计整理的意义
统计整理
对收集得到的初始数据进行审核、 分组、汇总,使之条理化、系统 化、科学化,变成能反映总体特 征的综合数据的工作过程。
意义
1.统计整理是统计调查的继续,统 计分析的前提和基础,起着承前启 后的作用。
2.统计整理是积累历史资料的必要 手段。
(二)按照分组标志的多少和分组的形式不同
1、简单分组
2、复合分组
将总体按一个标 志进行分组。它 只能从某一方面 说明总体的分布 状况和内部结构。
对所研究的总体按 两个或两个以上的
标志重叠起来分组。
可用于对事物多方 面、多层次的分析 研究。
高校教师的复合分组
第一标志(职务) 第二标志(年龄) 第三标志(性别)
100.00
某工业部门劳动生产率再分组表
组 别
按劳动生产率 分组
(千元/人)
A
7.5以下
B
7.5~10
C
10~12.5
D
12.5以上
合计
企业数 比例 (%)
30 40 23 7
100
职工数 比例 (%)
21.07 41.65 27.17 10.11
100.00
总产值 比例 (%)
28.99 42.40 21.93 6.68

高级职称
45岁以上

(教授、副教授)

45岁以下


非高级职称
45岁以上

(讲师、助教)

45岁以下

3、分组体系
指根据统计研究的要求,对同一总体进行多种不 同的分组而成的一种相互联系,相互补充,从不同 角度说明总体的内部状况的认识体系。
平行分组体系
对同一总体选择两个或两个以上 标志分别进行简单分组。各分组 标志表现并列使用。
第三章 统计整理
第一节 统计整理概述 第二节 统计分组 第三节 频数分布 第四节 统计表和统计图
教学目的
了解统计整理的基本内容;掌握选择分组标 志、编制变量数列、制作统计图表的技术和方 法。能够运用统计分组理论和频数分布技术, 依据客观事物的数据进行基本统计描述和分析。
重点难点 统计分组的方法;变量数列的编制;统计表
100.00
第三节 频数分布
一、频数分布的概念
频数分布
在统计分组的基础上,将总体的所有单 位按组归类整理,并按一定顺序排列, 形成总体中各个单位在各组间的分布,
又称为次数分布或分配数列。
构成
总体按某标志所分的组 各组的频数或频率
频数 各组分配的总体单位数
频率 各组单位数占总体单位总数的比重
频率有两个性质:(1)0≤
四、分组标志的选择
1.要符合统计研究的目的和要求 2.必须选择最重要的标志作为分组依据 3.要考虑到社会经济现象所处的具体历史条件
五、统计分组的类型
(一)按照分组标志的性质不同
1、品质分组
2、数量分组
或称属性 分组。按 照品质标 志进行的 分组。
或称变量 分组。按 照数量标 志进行的 分组。
一是逻辑检查,检查调查资料内容是否合理,各个项目之 间有没有相互矛盾的地方,答案是否合乎逻辑.
二是计算检查,检查调查中各项数据在计算方法和计算结 果上有无错误,数字的计量单位有没有差错等。
2. 数据的订正
对审核过程中发现的迟报、漏报及计算错误,应 及时催报、补报、改正,并针对不同的错误作出不同 的处理:
高级
中级
初级
青年 中年
统计分组的程序与原则
选择分组 标志
确定分组 体系
总体单位 归类
科学性: 组间差异 大,组内 差异小。
完备性和互斥 性:每个单位 均能且只能归 到某个组中。
六、统计分组方法
分组方法
按品质标志分组
按数量标志分组
单项式分组
组距式分组
等距分组
异距分组
(一)品质标志分组
选择反映事物属性差异的标志作为分组依据。
(二)数量标志分组
选择反映事物数量方面的差别的标志作为分组依据。
单项式分组
指用单一的数值作为分组标志的 分组。每个数值作为一个组。
编制条件:
变量是离散变量 变量的不同取值个数较少
同时 具备
如某班学生按年龄分组:17岁,18岁,19岁, 20岁, 21岁,22岁。
百度文库
【例】己知某车间有24名工人,他们的日产量(件) 分别是:20,23,20,24,23,21,22,25,26,20, 21,21,22,22,23,22,22,24,25,21,22,21, 24,23.要求根据以上资料编制变量数列。
1990年 100 4.3 63.8 31.9
1996年 100 2.5 54.5 43.0
1997年 100 2.3
52.2 45.5
3. 研究现象之间的依存关系 如农作物的耕作深度与收成率之间的关系、家庭收
入与生活费支出之间的关系、市场商品价格与其需求 量之间的关系等等,都可以通过统计分组来研究。
相关文档
最新文档