第三章 统计资料整理

合集下载

第3章 统计整理

第3章 统计整理



(2)必须选择最主要的标志作为分组依据;
例3:根据统计调查资料来研究人民生活水平变动情况时, 可供选择的分组标志有家庭人口数、每户就业人数、每 一就业者负担人数、家庭总收入、平均每人每月生活费 收入等,其中最能反映人民生活水平变动的标志是:平 均每人每月生活费收入,应选择这一标志作为分组标志。
练习:企业按净产值分组为:单位(万元) 10以下 10-20 20-30 计算首组和末组的组中值。 30-40 40-70 70以上 首组组中值=10-10/2=5(万元) 末组组中值=70+30/2=85(万元)
第四节
统计汇总
一、统计汇总:即在统计分组的基础上,将统计资料
归并到各组中去,并计算各组和总体的合计数(包 括单位总数和标志总量)的工作过程。


例如:对全国的工业企业进行
简单分组: 按所有制类型分:全民所有制企业、集体所有制企业 按轻重工业分:重工业、轻工业 按企业规模大小分:大型企业、中型企业、小型企业

复合分组:
重工业 全民所有制 轻工业 集体所有制
大型企业 中型企业 小型企业
重工业
轻工业

3、按分组标志的性质分为品质分组和数量分 组。
N 15-24 25-44 45-89 90-179 n 5 6 7 8
180-359 9
360-719 10
适用条件:
1.近似正态分布 2.现象特性适合等距分组


组限:指每组两端数值。分为上限和下限。 上限:每组的终点数值(最大值)。 下限:每组的起点数值(最小值)。 组限的形式:与变量的特点有关,重合式和不重合式。
第一节 统计整理的意义和程序
一、统计整理的意义 二、统计整理的程序

第三章 统计资料整理

第三章  统计资料整理

2.分组表: 2.分组表:主词按一个标志分组的统计表. 分组表
复合表: 3. 复合表:主词按两个或两个以上标志复合 分组的统计表. 分组的统计表.
四,统计表的编制原则
应遵循科学,实用,简明,美观的原则. 应遵循科学,实用,简明,美观的原则. 统计表的各种标题要简明扼要; 1.统计表的各种标题要简明扼要; 要合理安排统计表的结构; 2.要合理安排统计表的结构; 数据计量单位相同时,可放在表的右上角标明, 3. 数据计量单位相同时 , 可放在表的右上角标明 , 不同 时应放在每个指标后或单列出一列标明; 时应放在每个指标后或单列出一列标明; 表中的上下两条横线一般用粗线,其他线用细线; 4.表中的上下两条横线一般用粗线,其他线用细线; 5.统计表的栏数较多时,通常要加以编号; 统计表的栏数较多时,通常要加以编号; 通常情况下,统计表的左右两边不封口; 6.通常情况下,统计表的左右两边不封口; 表中的数字应该填写整齐,对准位数; 7.表中的数字应该填写整齐,对准位数; 对于没有数字的表格单元,一般用" 表示; 8.对于没有数字的表格单元,一般用"—"表示; 表中主词各行和宾词各栏, 9. 表中主词各行和宾词各栏 , 应按先局部后整体的原则 排列; 排列; 10.必要时可在表的下方加上注释. 10.必要时可在表的下方加上注释.

编制
四,次数分布的主要类型 钟型分布——"两头小,中间大" 两头小,中间大" 钟型分布 两头小
对称分布
右偏分布
左偏分布
两头大, U型分布——"两头大,中间小" 型分布 两头大 中间小"
U型分布
一边小, J型分布——"一边小,一边大" 型分布 一边小 一边大"

统计学第3章统计整理

统计学第3章统计整理

14
7.0 21 10.5 193 96.5
4 90 —100 31 15.5 52 26.0 179 89.5 5 100—110 65 32.5 117 58.5 148 74.0
6 110—120 52 26.0 169 84.5 83 41.5
7 120—130 8 130—140
23 11.5 192 96.0 31 15.5
一、分配数列的概念和种类
1.概念
统计总体按照某一标志分组以后, 用以反映总体各单位分配情况的统计 数列,称分配数列,又可称次数分配, 或次数分布。
它由两部分组成: 总体所分的各个组和各组所拥有的 单位数(次数或频数)。

月工资分组(元) 工人数(人) 占总数比重(%)
1000 以下
210
39.6
1000-1500
组距式 分组
以变量值变动的一个区间作为一组,区间的 距离称为组距。适用于连续型变量和离散型 变量的变量值较多的情况。
第三章 统计整理
在进行组距分组时,会涉及到一 些问题,包括:等距分组和不等距分 组、组限、组中值。
第三章 统计整理
等距 分组
不等距 分组
各组组距均相等。如: 10—20 20—30 30—40
组中值 = (上限值+下限值)÷2
开口组组中值的计算: 缺下限:组中值=本组上限— 相邻组组距/2
缺上限:组中值=本组下限+ 相邻组组距/2

产值(万元)
第一组组中值:
50以下 50 — 60 60 — 70 70以上
50-(10÷2)= 45 最后一组组中值: 70+(10÷2)= 75
第二节 分配数列
较合适是? (c)

第三章统计整理

第三章统计整理
66.78% 10.33%
20.27%
68.70% 11.03%
16.60%
70.14% 13.26%
工厂按产量分组
Â Ý Ô · 1 2 3 4 5 6 Ï Æ º ¼
ú ¿ ¨Ô ² Á £ ª þ © ¼ £ x
2 3 4 3 4 5 21
¥ » É ± µ Î ³ ¾ ¨Ô £ y £ ª © 73 72 71 73 69 68 426
•向下累计是将各组频数和频率由变量值大的组 向变量值小的组累计(是各组下限以上的累计频 数或累计频率)
向下累计 生活费 250 275 300 325 350 375 合计 频数 10 8 12 9 5 6 50 累计频数 50 40 32 20 11 6 累计频率 100% 80% 64% 40% 22% 12%
2. 统计表的内容构成:主词部分和宾词部分。
注:统计表的构成和内容构成见表3-2
总标题
表3-2
按考试成绩分组 (分)
某班统计学原理考试成绩分布表
频数 组中值 学生数 (人) 比重 (%) 向上累计 学生数 (人) 比重 (%) 向下累计 学生数 (人) 比重 (%)
纵 栏 标 题
90以上 80-90 横 行 标 题 70-80 60-70 60以下 合计
大型企业 中型企业 小型企业 大型企业 中型企业 小型企业 重工业
轻工业
按分组标志的性质分

学生按性别分组
男 女
学生按民族分组
学生按考试成绩分组
90分以上 80-90 70-80 60-70 60 分以下 19岁及以下 20岁 21岁 22岁 23岁 24岁及以上
汉族 回族 苗族 土家族 羌族 壮族 . . .

统计资料整理

统计资料整理

第三章统计资料整理一、解释概念1. 统计整理是根据统计研究的目的要求,对统计调查所得的原始资料进行科学的分类、汇总,或对已初步加工的资料进行再加工,使之成为系统化、条理化的综合资料,以反映现象总体特征的工作过程。

2. 统计分组,就是根据统计研究的需要,按照一定的标志,将统计总体划分为若干个组成部分的一种统计方法。

3.分组标志就是将统计总体划分为几个性质不同部分的标准或依据。

4.复合分组是对被研究现象按两个或两个以上的标志结合起来所进行的分组。

5. 分布数列又称分配数列、次数分布,是在统计分组的基础上形成的,用来反映总体单位在各组中分布状况的统计数列。

6.统计表是把统计数据按照一定的结构和顺序,用表格显示出来的一种形式。

二、填充内容1. 统计调查、统计分析。

2.逐级汇总、综合汇总。

3. 及时性、准确性。

4. 简单分组、复合分组、分组体系。

5. 并列标志、分别。

6. 离散型、组距式。

7. 反比。

8. 组中值、一般水平。

9. 重合式、非重合式。

10. 总标题、纵标目。

11. 调查表、分析表、分组表、复合表。

12. 几何图形、具体形象。

三、选择答案1.( a b c d )2.( d )3.( a )4.( b c )5.( b )6.( b )7.( d )8.( a b )9.( a )10.( a c d )11.( b )12.( c d )13.( a )14.( a c )15.( c d )四、判断改错1.(√)2.(×)分布数列包括品质数列和变量数列。

3.(√)4.(√)5.(×)是一个品质数列。

6.(√)7.(×)通常是把该数值列人下限的所在组。

8.(√)9.(×)是离散变量数列。

10.(×)开口数列是指最大值只有下限没有上限,或者是最小值只有上限没有下限。

五、简答问题1.【回答要点】①统计整理是统计工作的中间环节,是统计调查的继续,又是统计分析的基础②实现由个体到全体、由特殊到一般、由现象到本质、由感性到理性的转化,从整体上反映出事物的数量特征。

统计学统计数据的整理和显示

统计学统计数据的整理和显示

组数
组中值:各组中点位置所对应的变量值。其计算公式为:
01
或= (适用上开口组)
03
组中值= (适用所有闭口组)
02
或= (适用下开口组)
表3—2 三次产业增加值结构变化 资料来源:《中国统计年鉴》《2003年中国发展报告》,国家统计局2003年版,中国统计出版社。
从表中可以看出,我国1998—2002年,GDP年均增长7.7%,其中第一产业增加之年均增加2.9%,第二产业、第三产业增加值分别增长8.9%和8.0%。反映在结构中,第一产业比重下降,二、三产业比重上升。其中第一产业比重从1997年的19.1%下降到2002年的14.5%,下降了4.6个百分点;第二产业从50%提高到51.8%,上升了1.8个百分点;第三产业从30.9%提高到33.7%,上升了2.8个百分点。它反映着我国产业结构的变化发展过程。
举例说明:
1
某工厂生产车间30人工人日产量原始数据如下:
第三章 统计数据的整理和显示
本章主要内容




统计整理及其类型 统计整理:就是对搜集得到的初始数据进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的综合数据的工作过程。包括(1)对统计调查所搜集到的各种数据进行分类和汇总;(2)对现成的综合统计资料的整理。本章指的是第一种整理。
第一节 统计数据整理概述
3.历史资料的审核:在利用历史资料(或其他间接资料)时,应审核资料的可靠程度、指标含义、所属时间与空间范围、计算方法和分组条件与规定的要求是否一致。一般可以从调查资料的历史背景、调查者搜集资料的目的以及资料来源等,来判断资料的可靠程度,也可以从指标间的相互关系以及指标的变动趋势来检查它的正确性。

统计学第三章 统计数据的整理

统计学第三章 统计数据的整理

汇总技术:
有传统手工汇总和现代电子计算机汇总两种技术。
(1)手工汇总。常用的汇总方式有四种: • 划记法。划“正”字符号计数,多用于对总体单位数或次数的简单汇总。
• 过录法。将原始资料分类过录到事先设计的汇总简表中,可用于对内容项 目较多的资料的汇总。
• 折叠法。将每张调查表中需要汇总的同类项目及数据折压一个印记,一张 一张的重叠在一起,再进行汇总。这种方法一次只能选择一个项目及其数 据进行汇总,故适用于数据较少的资料。
• 卡片法。将需要汇总的项目数据分类登记在卡片上,再汇总计算。这种方 法适用于总体单位数多、且多采用复合分组形式的事物,特别是设备、器 材类的实物资产的汇总。
(2)电子计算机汇总。其数据处理程序如下: • 第一步,编程。使用计算机语言编写出一套完整的数据处理程序。
• 第二步,数据录入。计算机自动按程序进行数据处理,并将数据处理结果 存储在磁盘、磁带等磁介质中。
树茎
数叶
数据 个数
10 7 8 8
3
11 0 2 2 3 4 5 7 7 7 8 8 8 9
13
向上累 计个数
3
16
12 0 0 1 2 2 2 2 3 3 3 3 4 4 4 5 5 6 6 7 7 7 8 8 9
24
40
13 0 1 3 3 4 4 5 7 9 9
10
50
14 0 0 1 3
16284
22.3
第三产业
20228
27.7
合计
73025
100.0
3、变量数列的编制
成绩 (分)
某班学生《统计学》考试成绩分布表
学生人数 频率 (人) (%)
向上累计

3管理统计学-统计整理

3管理统计学-统计整理

3
6
110~114
5
10
115~119
8
16
120~124
14
28
125~129
10
20
130~134
6
12
135~139
4
8
合计
50
100
等距分组表
(使用开口组)
表3-7 某车间50名工人日加工零件数分组表
按零件数分组
频数(人)
频率(%)
110以下
3
6
110~114
5
10
115~119
8
16
120~124
——
第四节 统计表
统计表的作用
(1) (2)比用叙述的方式表现统计资料更简明易懂, (3)便于比较各项目之间的关系, (4)便于检查统计数字的完整性和正确性。
均能且只能归 到某个组中。
统计分组的方法
分组标志的选择
关键:服从研究任务需要,反映总体本质特征 (1)要根据研究目的选择
(2)要反映现象的本质特征 (3)要因时、因地制宜
统计 分组 方法
按品质标志分组
按数量标志分组 按主要标志和 辅助标志分组
统计分组体系
分组体系指同时使用两个以上 标志分组时,分组标志的组合形式。 具体形式有:平行分组体系和交叉 分组体系。
金牌数 占总数比例
5枚
5枚 4枚 4枚 3枚 3枚 2枚 1枚 1枚
频率 f /∑f
0.1786
0.1786 0.1429 0.1429 0.1071 0.1071 0.0714 0.0357 0.0357
变量数列的编制
频数分布表的编制步骤 (一)排序

第三章统计整理

第三章统计整理

按照习惯,成绩一般分为不及格、及格、 按照习惯,成绩一般分为不及格、及格、中 良好、 等、良好、优秀
即 组限 60分以下 60~70 70~80 80~90 90分以上 65 75 85 组中值
上组限不在内
利用Excel Excel进行分组 ㈢ 利用Excel进行分组
数据分析” 直方图 直方图” 选“工具”-“数据分析”-“直方图” 工具” 数据分析 定义“输入区域” 数据 定义“输入区域”—数据 分组中每组上限, “接收区域”—分组中每组上限,包括在本组 接收区域” 分组中每组上限 内 “输出区域”—结果 输出区域” 结果
编制结果如下: 编制结果如下:
日产量(件)X 日产量(件)X 20 21 22 23 24 25 26 合计 工人数(人) 工人数(人) f 3 5 6 4 3 2 1 24
组距数列
指每个组的变量值用一个区间来表现 的变量数列
编制条件:
变量是连续变量; 变量是连续变量; 或:总体单位数较多,变量不同取值个数 总体单位数较多, 也较多的离散变量。 也较多的离散变量。
复合分组
按性别 分类
对教师 的分类
共计12组 共计 组 × × 男 2×3×2
女 高级 中级 初级 青年 中年
按职称 分类 按年龄 分类
第三节 次数分布 ★ 一、分布数列的概念及种类
二、组距数列的编制 三、累计次数与累计频率
将总体各单位按分组标志分组后, 将总体各单位按分组标志分组后, 次数分布 形成的各单位在各组的分布
地位
统计整理的步骤
拟定统计整理方案 统计资料的预处理 数据处理 制作统计表或统计图
第二节 统计分组
将总体中所有单位按一定的标志划 统计分组 分为类型或性质不同的若干部分的 过程 统计分组的作用: 划分现象的类型 反映现象内部结构 分析现象之间的依存关系

统计学原理与实务第三章统计整理

统计学原理与实务第三章统计整理

平均指标与变异指标
总结词
平均指标是用来反映社会经济现象总体的一 般水平或集中趋势的指标。
详细描述
平均指标通常用平均数表示,如人均收入、平 均工资等,用于描述总体的一般水平。
平均指标的分类
数值平均数和位置平均数,如算术平均数、调和 平均数、几何平均数等。
变异指标
变异指标是用来反映总体各单位之间数量差异程度 的指标。
直接计数法、测量法、推算法等。
相对指标
总结词
相对指标是用来反映社会经济 现象之间数量对比关系的指标 。
相对指标的分类
结构相对数、比例相对数、比 较相对数、强度相对数等。
详细描述
相对指标通常用相对数或比例表示 ,如人口密度、劳动生产率等,用 于揭示事物之间的数量关系。
相对指标的计算方法
直接计算法、对比法、平均法 等。
通过调查、观测、实验等方式直 接获取原始数据。
间接来源
通过文献资料、政府部门或统计机 构等途径获取已整理过的数据。
现代技术
利用互联网、大Biblioteka 据等技术手段进 行数据收集。数据预处理与筛选
01
02
03
04
缺失值处理
根据实际情况对缺失数据进行 填充或删除。
异常值处理
识别并处理异常值,如使用Z 分数法或IQR法。
详细描述
变异指标通常用变异系数或标准差表示,用于揭 示总体各单位之间的数量差异程度。
变异指标的分类
绝对变异指标和相对变异指标,如标准差系数、离差系 数等。
05
统计整理的应用实例
人口普查数据的整理
总结词
系统化、标准化
详细描述
人口普查数据涉及大量个体数据,需要进行系统化、标准化的整理,以便进行 后续的数据分析。具体包括数据清洗、分类、编码等步骤,确保数据质量可靠、 准确。

第三章 统计整理 《统计学原理》PPT课件

第三章  统计整理  《统计学原理》PPT课件

(一)正确选择分组标志
1.根据统计研究的目的选择分组标志 2.选择最能反映事物本质特征的标 志进行分组 3.选择分组标志时,要考虑到现象发展 的历史条件和经济条件
(二)按品质标志或按数量标志分组
1.按品质标志分组 2.按数量标志分组
(三)简单分组和复合分组
1.简单分组。简单分组是指对所研究 的总体按一个标志进行分组。
品质分布数列和变量分布数列
按品质标志分组形成的次数分布 数列叫品质分布数列,简称品质数列 (见表3-3)。
按数量标志分组形成的次数分布 数列叫变量分布数列,简称变量数列 (见表3-4) 。
查看Excel表3-3 查看Excel表3-4
品质分布数列
变量分布数列
(返回组距数列) 返回组限 下一个
二、变量数列的种类
在Excel内排序
(3)编制变量数列
查看Excel
下一个
(4)编制累计次数(频数)分布数列与 累计频率分布
查看Excel
下一个
四、次数分布的主要类型
(一)钟形分布 (二)U形分布
(三)J形分布
(一)钟形分布
图3—2 钟形分布图
(二)U形分布
图3—3 U形分布图
(三)J形分布
图3—4 正、反J形分布图 下一个
组限
在组距变量数列中,表示各组界 限的变量值叫组限,其中较小的变量 值称为下限,较大的变量值称为上限。 (见表3-4) 。
组距=上限-下限 组中值=(上限+下限)÷2
开口组
编制组距变量数列时,常常使用 像“× ×以上”或“× ×以下”这样 不确定组限的组,称为开口组(见表 3-6) 。
查看Excel表3-6
开口组组中值计算公式

(完整版)第3章统计整理

(完整版)第3章统计整理

第三章统计整理学习要求:明确统计整理在统计研究中承前起后的地位;掌握分组的方法和汇总技术;认识统计分布是统计整理的重要表现形式;学会统计表的编制并能熟练地运用。

§1 统计整理的意义和方法一、统计整理的意义统计整理是指根据统计研究任务的要求,对调查所搜索的原始资料进行分组、汇总,使其条理化、系统化的工作过程。

统计整理实现了从个别单位的标志值向说明总体数量特征的指标值过渡,是人们对社会经济现象从感性认识上升到理性认识的过渡阶段,为统计分析提供基础。

二、统计整理的方法:1、统计分组就是根据整理的目的要求,按照规定的标志进行区分若干组成部分的一种统计方法。

(科学的分组是搞好统计整理的前提条件)2、汇总是对分组后的各项指标进行汇总,并计算各组的单位数和合计数,计算出说明总体和各组情况的统计指标数值。

汇总是统计整理的中心内容汇总技术:①手工汇总:划记法、过录法、折叠法、卡片法。

②电子计算机汇总。

3、编表:经过汇总,得出表明社会现象总体和各个组的单位数和一系列标志总量的资料,把这些资料按一定的规则在表格上表现出来。

§2 统计分组一、统计分组的意义:统计分组的含义:指根据统计研究任务的要求和现象总体的内在特点,把统计总体按照某一标志划分为若干性质不同而又联系的几个部分。

统计分组是在总体内部进行的一种定性分类。

①对总体而言是“分”,即将总体区分为性质相异的若干组成部分。

②对个体而言是“合”,即将性质相同的个体组合起来。

(统计分组的关键是分组标志的选择)二、统计分组的种类1、按统计分组任务和作用不同分:类型分组:划分社会经济类型;结构分组:研究同类总体的结构;分析分组:分析被研究现象总体诸标志之间的联系和依存关系。

类型分组、结构分组:现象总体按品质标志分组,多属类型分组(例如工业生产按经济类型分-----国有、私营、集体);现象总体按数量标志分组,多属结构分组(例如企业按职工人数分------1000人以下、1000-5000人、5000人以上)。

第三章统计整理

第三章统计整理
第三章
统计整理
第一节 统计整理的意义和步骤
第二节 统计分组
第三节 分配数列 第四节 统计表和统计图
本章的教学目的、要求及内容
一般了解统计整理的概念和内容、统计分组、分配 数列及统计表等概念和内容。
重点与难点:重点掌握统计分组的方法,在分组的 基础上进行次数分配数列的编制,并学会用统计表 来表示统计资料。
预处理
分组汇总
编制表图
数据的预处理
数据的预处理,主要包括三个方面: 1. 数据的审核 2. 数据的筛选 3. 数据的排序
统计数据资料整理的内容
统计整理的步骤:
(1)拟定统计整理方案 (2)审查原始资料 (3)对各项原始资料分组、汇总,计算总体总量指标 (4)将汇总的结果,以统计表或统计图的形式表现出 来 (5)将统计资料进行系统积累
统计分组的作用 3、揭示现象的内部结构
现象的内部结构是表明现象本质特点的一个重要方面,将同 一总体不同时期的结构联系起来,还可以看到现象的发展趋 势和规律。 “九五”期间我国国内生产总值构成(%)


1996
20.4
1997 1998
19.1 18.6
1999
17.6
2000
15.9
第一产业
第二产业
分配数列表
频数
分布数列的种类
分布数列以分组标志特征不同可以 分为: 品质数列
Байду номын сангаас
变量数列
品质数列
品质数列:按品质标志分配而形成的数列叫属性 分配数列,简称品质数列。用来观察总体单位中 不同属性的单位分布情况。
例 某班学生的性别构成情况
按性别分 组 男 女 合计
绝对数人 比重(%) 数 30 75 10 40 25 100

第三章 统计整理

第三章 统计整理

1.分组标志的选择原则 (1)应根据研究的目的与任务选择分组标志。 例如,同一个工人总体,有多种不同分组方法: ①如果研究学历对收入的影响时,应选择“文 化程度”作为分组标志。 ②如果研究资历对收入的影响时,则应选择 “工龄”作为分组标志。
(2)要选择能够反映事物本质或主要特征的标志。 例如,研究职工生活水平的高低情况时,可 以用“职工的工资水平”作为分组标志,也可以 用“职工家庭成员平均收入水平”作为分组标志。 应该选择后者作为分组标志。 (3)要根据现象的历史条件变化来选择分组标志。 例如,前面讲到研究职工生活水平问题,如 果要列出“职工生活贫困户”一组,则“贫困户” 的标准就随历史条件变化而变化,而且不同地区 标准也不相同。
第三节,变量数列(分配数列)
一、分配数列(次数分布)的概念
在统计分组的基础上,将总体中所有单位按组 归类整理,并按一定的顺序排列,形成总体中各单 位数在各组间的分布称为次数分布,又称分布数列 分布在各组的个体单位数叫次数,又称频数 (fi)。各组次数与总次数(Σfi)之比称为比 率,又称频率。 分配数列(次数分布)有两个构成要素:一 个是分组,另一个是次数。 统计分布的实质:把总体的全部单位按某标 志所分的组进行分配所形成的数列。
第二节 统计分组
一、统计分组的意义: • 统计分组的含义:是根据统计研究任务的 要求和现象总体的内在特点,把统计总体 按照某一标志划分为若干性质不同而又联 系的几个部分(或组)的一种统计方法。 统计分组的关键是分组标志的选择和 划分各组界限。而核心问题是正确地选择 分组标志。 (下)
• 在一个总体中,单位的品质标志或数量标志, 其标志表现可能是互不相同的,总体内部各 个单位间存在许多的变异标志又是人们把总 体进一步分为性质不同的几个部分的客观依 据。 • 统计分组是在总体内部进行的一种分类。兼 有“分”和“合”的双重含义:对总体而言 是“分”(分为范围更小的总体),而对总 体单位而言是“合”(合为性质相同的组); 对分组标志而言是“分”(按分组标志划分 总体成为标志表现不同的许多组),而对其 它标志来说又是“合”(其它标志表现的差 异消失了)。

第三章 统计整理

第三章 统计整理

《统计学》第三章 统计整理
完整性
是指所有的调查表格或问卷是否都已 收齐,所有的问题是否都有答案。
准确性 是指原始资料是否准确可靠.
一是逻辑检查,检查调查资料内
审 核
容是否合理,各个项目之间有没有相 互矛表格或
法 问卷中各项数字在计算方法和计算结
果上有无错误,数字的计量单位有没
分组
《统计学》第三章 统计整理
25%
33%
分组前
分组后
42%
作用:1·区分事物的性质
例:按所有制性质划分,我国现有8种经济类型:
国有经济;集体经济;私营经济;个体经济 联营经济;股份制经济;外商投资经济;港 澳台投资经济
《统计学》第三章 统计整理
2·反映总体内部结构
例:上海市按GDP计算的三次产业结构(%)
从不同角度说明总体的内部状况的认识体系。
对同一总体选择两个 平行分组体系 或两个以上标志分别进行
简单分组。各分组标志表 现并列使用。
复合分组体系 各分组标志表现交叉 结合使用。
平行分组体系
《统计学》第三章 统计整理
对教师 的分类
按性别分类
男性 女性
高级 按职称分类 中级 共计7组
初级 2+3+2
青年 按年龄分类
将统计调查得到的原始资料进行科
统计整理 学的分类和汇总,使之成为系统化、
条理化的综合资料,以反映研究总 体的特征。
地位 是统计调查的继续,统计分析的前提 和基础,起着承前启后的作用。
统计整理的种类
《统计学》第三章 统计整理
根据定期统计报表资料进 定期统计资料的整理 行综合整理
专题统计资料的整理 历史统计资料的整理

统计资料的整理

统计资料的整理

第三章统计资料的整理教学目的与要求:本章是统计研究活动的第三阶段—统计资料整理阶段,阐述了统计整理的理论与方法,包括分组、汇总和统计表的设计。

重点要求为:1、明确统计资料整理的概念,了解统计整理的步骤。

2、通过学习统计分组理论,能够对不同的社会经济现象进行统计分组。

3、运用分配数列对原始数据进行系统整理。

4、掌握统计表的具体编配方法。

重点掌握:1、统计分组方法。

2、分配数列的编制与汇总教学方式:用多媒体课件讲练结合。

课时安排:理论4学时,实训4学时第一节统计整理的意义和步骤一、统计整理的意义1、定义统计整理,就是根据统计研究的目的,对所搜集到的资料进行科学的加工,使之系统化,条理化的工作过程。

统计整理即包括对统计调查所得到的原始资料进行整理,也包括对加工过的综合资料,即次级资料进行再整理。

2、意义统计整理在整个统计研究中占有重要的地位。

统计整理的正确与否,将直接影响和决定着能否完成整个统计研究的任务。

如果采用不科学不完整的整理方法,即使搜集到准确、全面的统计资料,也往往使这些资料失去应用价值,掩盖客观现象的本质,难以得出正确的结论。

因此,必须十分重视统计整理工作。

二、统计资料整理的步骤第一步,设计和制定统计整理方案。

第二步,对原始资料进行审核。

第三步,对经过审核的资料进行分组、并结合汇总,计算出总体总量指标。

第四步,将汇总计算的结果,以统计表或统计图的形式表现出来。

第五步,对统计资料妥善保存,系统积累。

第二节统计分组一、统计分组的概念统计分组就是根据统计研究的需要,将统计总体按照一定的标志分为若干个组成部分的一种统计方法。

例如,将某一班级的全体同学按照性别划分为男、女两个组;对某市100家大型零售商店按照零售额、职工人数进行分组等。

统计分组具有两个方面的含义:对总体而言,是“分”,即将同质总体区分为性质有别的不同组成部分;对总体单位而言,它是“组”,即将性质相同或相近的不同总体单位组合在一起,构成一个组。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

31
简单表案例
某年某公司所属两企业自行车合格品数量表
厂别 甲厂 乙厂 合 计 合格品数量(辆) 5000 7000 12000
32
简单分组表案例
2005年某月某公司各企业劳动生产率统计表 分组 总产值 (万元) 职工人 数(人) 劳动生产率 (元/人)
大型
中型 小型 合计
33
复合分组表案例
某年某地区工业增加值和职工人数
26
第三步:确定组限和组中值。以区分事物质的差别。
对于离散变量,相邻组组限可以间断,也
可重叠;
对于连续变量,相邻组组限必须重叠; 符合“上组限不计入”原则; 首末两组可使用“××以下”及“××以
上”的开口组。
27
第四步:归类汇总,计算各组次数。
本着“不重复,不遗漏”的原则,按照各个总体单位的具体 标志值,将其划归某一具体组之中。 对于重叠设置的组距数列,要本着“上限不在内”的原则。
19
某地区人口分布状况
人口按年龄分组 1岁以下(婴儿组) 1-7岁(幼儿组) 7-17岁(学龄儿童组) 17-55岁(有劳动能力的人口组) 55岁以上(老年组) 合计
人口数(万人) 1 6 12 24.6 8.1 51.7
20
对于异距数列,为了消除各组组距大小对次数分布的影响,
需计算
次数密度=该组次数/该组组距
14-16
16-18 18-20
16
12 5
540
620 680
8
三、统计分组的种类和分组标志的选择
(一)统计分组的种类 1、按标志的性质不同分为:品质标志分组和数量标志分组: 2、按选择标志的多少不同,可分为: 简单分组:对统计总体仅按一个标志进行分组。特点:只能 反映现象在某一标志特征方面的差异情况,说明的问题比较 简单明了。 复合分组:对同一总体采用两个或两个以上的标志重叠起来 进行分组。特点:可从几个不同角度了解总体内部的差别和 关系,因此能更全面、更深入地研究问题;复合分组的组数 随着分组标志的增加而成倍地增加。
17
几个概念
全距:原始资料的最大值与最小值之差。 全距 = 最大值 - 最小值 组数:即把总体划分成几个组。 组距:每组中最大变量值与最小变量值之间的距离或差数。 上限:每组中的最大变量值,称为上组限,简称上限。 下限:每组中的最小变量值,称为下组限,简称下限。 组距 = 上限 - 下限 组中值:每组变量取值的中点数值。 组中值=(上限 – 下限)/ 2 缺少下组限的组中值=该组上限-邻组组距一半 缺少上组限的组中值=该组下限+邻组组距一半
用清晰、直观的方式表达已整理的资料。 一、统计表 用纵横垂直交叉的直线所绘制的表格来表现统计资料的形式。 (一)种类 分类1:按表的作用不同,分为: 调查表: 整理表(汇总表): 分析表:
30
分类2:按对总体是否分组或分组情况的不同,分为: 简单表:对总体未经任何分组。 简单分组表:对总体只按一个标志分组而成。 复合分组表:对总体进行了复合分组而形成。
35
(二)统计表的设计
1.统计表的构成 ①从表式结构看,有以下几部分构成: 总标题:简明扼要地表明全表统计资料的内容。上端中部 横行标题:表明各组的名称。 表的左方 纵栏标题:表明统计指标的名称。 表的上方 指标数值:统计指标的具体数值表现。 交叉处 ②从内容上看,有两部分组成: 主词:统计表所要说明的总体及其各组成部分。表的左方 宾词:说明总体数量特征的各项统计指标。 表的右方
18
几个概念
等距分组:每组组距相等。 等距数列适用于标志变异比较均匀的现象。 异距分组:或称为不等距分组,指每组组距不相等。 异距数列则常在以下场合运用: 1、有许多社会经济现象的分布存在明显的偏斜状况; 2、有些社会经济现象的标志变异范围较大,其变量若按一 定比例关系变化发展的话,可按等比间隔分组编制异距数列。
3.分类:根据分组标志的特征不同,可分为: 品质数列:按品质标志分组形成的分布数列。 变量数列:按数量标志分组形成的分布数列。
14
品质数列实例
某班学生的性别构成情况
按性别分组 男 女 绝对数人数 30 10 比重(%) 75 25
合计
40
100
组别
次数
频率
15
变量数列实例
某厂第二季度工人平均日产量
28
销售额 编制 (百万元) 结果: 5以下 5~10 10~15 15~20 20~25 25以上 合计
组中值
商店数
X
7.5 12.5 17.5 22.5
f
5- ( (10-5)/2) =2.5
4 10 16 25+ ( 13 4 =27.5 3 50
29
(25-20)/2)

第四节
统计表和统计图
=100-50=50(万元)
14.2 11.4 10.1 9.2 如:组中值x=(U+L)/2 8.5
下组限L
=(100+200)/2 =150(万元)
23
组距数列的编制
第一步:确定全距。 第二步:确定组距和组数。 第三步:确定组限、组中值。 第四步:分类汇总,计算各组次数。
这里以等距分组为例,不等距分组,需据实际情况具体分析。
项目 增加值(万元) 职工人数(人)
大型
内资企业 中型 小型 外商投资 经营企业 大型 中型 小型
9 750
8 600 4 200 7 300 5 200 4 400
13 800
45 000 10 050 7 500 10 400 4 500
34
分类3:按表性质的不同,可分为: 时间数列表:同一空间不同时间的资料编制。 空间数列表:同一时间不同空间的资料编制。 时空数列结合表:同时反映不同时间和不同空间的 交叉资料。
第一产业 第二产业
第三产业 合 计
30.1 100.0
30.9 100.0
32.1 100.0
33.0 100.0
33.2 100.0
7
(三)分析现象之间的依存关系 某乡某种农作物的耕作深度与收获率的关系 耕作深度分组(cm) 10-12 12-14 地块数 7 10 平均收获率(斤/亩) 400 460
5
第二节
统计分组
一、统计分组的概念 根据统计研究的目的和社会经济现象的特点,按照一个 或几个标志把统计总体区分为性质不同的若干个组成部分的 一种统计方法。 注意: 1.统计分组,对总体而言,是“分”;但对总体单位而言, 是“合”。 2.对分组标志而言,突出了总体在各组的差异;对其他标志 而言,掩盖了总体在这些标志下的差异。
复习
1、什么是统计调查?
2、统计调查有哪些? 3、一个完整的统计调查方案包括哪几个方面?
4、什么是普查?
5、什么是专门调查?它有哪几种?
1
第三章
统计资料整理
第一节
统计资料整理的原则和步骤
第二节
第三节 第四节
统计分组
分布数列 统计表和统计图
2
第一节
统计资料整理的原则和步骤
一、统计资料整理(简称统计整理) (一)概念 狭义的统计整理:指根据统计研究的目的和任务的要求,对 统计调查所得到的各项原始资料进行科学的分类和汇总,为 统计分析提供准确、系统、条理清晰、能在一定程度上说明 总体特征的综合资料的工作过程。 广义的统计整理:不仅包括对原始资料的整理,也包括对次 级资料的再整理。
3
二、统计资料整理的原则和步骤
(二)统计资料整理的原则
在对所研究的社会经济现象进行深刻的政治经济分析的 基础上,抓住最基本的、最能说明问题本质特征的统计分组 和统计指标对统计资料进行加工整理。
4
(三)统计资料整理的步骤 1.设计和制订统计资料的汇总方案(即:统计整理方案设计) 2.对原始资料进行审核和检查,包括四个方面: ①准确性②及时性③完整性④可比性。 3.用一定的组织形式和方法,对原始资料进行分组、汇总和 计算。 4.对整理好的资料再一次进行审核,以便及时发现和纠正总 过程中的各种差错。 5.将汇总的结果表示出来。表示方法有统计表、统计图、统 计报告等。 6.系统地积累和保存统计资料。
要求编制组距数列。
25
第一步:全距=29.0-2.0=27 第二步:确定组距和组数。 原则: 1.全距=组距×组数 2.要能区分各组的性质差异,能反映总体资料的分布特征 3.为方便计算,组距组限尽可能为5、10的整数倍 上例中,如取组距=5,则组数=27/5=5.4,取6 (开始确定组数时,可以定得多一点,细一点)
21
总结:分布数列的分类
分 类
品质数列 变量数列
单项数列
组距数列
等距数列 异距数列
22
某地区100个百货商店 月销售额与流通费用情况
销售额(万元)
商店数 (个) 每百元商品销售额中 如:组距d=U-L 支付的流通费(元)
上组限U
50以下 50~100 100~200 200~300 300以上 10 20 30 25 15
6
二、统计分组的主要作用
(一)区别社会经济现象的的性质和不同类型(根本作用) (二)研究总体的内部结构 “九五”期间我国国内生产总值构成(%) 年 份 1996 20.4 49.5 1997 19.1 50.0 1998 18.6 49.3 1999 17.6 49.4 2000 15.9 50.9
工人平均日产量(件) 2
3 4 5 6 合计
工人人数(人) 10
15 30 40 20 115
16
二、编制分配数列的方法
品质数列的编制一般较为简单,这里着重介绍变量数列的编制。 变量数列,可分为: 单项变量数列:简称为单项数列,指变量数列中每个组只用 一个变量值表示。适用于:分组的数量标志是离散变量且变 量值的变动范围不是太大的情况。(前例) 组距变量数列:简称为组距数列,指变量数列中每个组用一 个变量值区间表示。适用于:分组的数量标志是连续变量或 变量值的变动范围较大的离散变量分组情况。(前例) 以下我们研究的是组距变量数列。
相关文档
最新文档