统计整理的概念
统计整理——精选推荐
第三章统计整理本章内容提要第一节 统计整理的概念和程序一、统计整理的概念统计整理就是根据统计研究的目的和任务,将调查取得的大量原始资料进行科学的分类(或分组)、汇总,为统计分析提供条理化、系统化的综合统计资料的工作过程。
二、统计整理的程序统计整理按以下程序进行:(1)对调查资料的审核。
主要包括:准确性审核、完整性审核、及时性审核、适用性审核。
(2)统计分组。
(3)统计汇总。
(4)编制统计表。
第二节 统计分组一、统计分组的意义和作用统计分组就是根据统计研究的目的和任务,按照选定的变异标志将总体划分为若干部分或组别,使组与组之间具有差异性,而同一组内的单位保持相对的同质性。
统计分组在统计研究中的作用主要体现在以下三方面:(1)区分社会经济现象的类型。
(2)研究总体内部结构。
(3)研究现象之间的依存关系。
二、分组标志的选择正确选择分组标志是统计分组的核心问题。
分组标志就是将总体划分为若干部分或组别的标准或根据。
正确选择分组标志必须遵循以下三个基本原则:(1)根据统计研究的具体任务和目的,选择与研究现象联系最密切的标志作为分组标志。
(2)在对被研究现象进行理论分析的基础上,从中选择具有本质性的重要标志作为分组标志。
(3)结合现象所处的具体历史条件或社会经济发展条件选择分组标志。
三、统计分组的种类(一)按分组标志的性质可分为品质标志分组和数量标志分组品质标志分组就是根据统计研究的目的,选择反映事物性质属性差异的品质标志作为分组标志,在品质标志变异的范围内划定各组的界限,将总体区分为若干个性质不同的部分或组别。
数量标志分组就是根据统计研究的目的,选择反映事物数量差异的数量标志作为分组标志,在数量标志变异范围内划定各组的数量界限,将总体划分为性质不同的若干部分或组别。
(二)按分组标志的多少可分为简单分组和复合分组简单分组就是对总体只按一个标志进行分组。
复合分组就是对同一总体采用两个或两个以上标志结合起来进行分组。
第二章第二节 统计整理
第二节统计整理一、统计整理的概念和意义统计整理是指根据统计研究的目的和任务,对统计调查或科学实验获得的大量原始资料进行科学的分类、汇总,或对已经加工过的资料进行再加工,使之成为系统化、条理化、标准化的能反映总体特征的综合统计资料的工作过程。
通过统计调查或实验,我们取得了大量的原始资料,但这些原始资料一般是分散的、不系统的个体资料。
它们只能说明总体各单位的具体情况,而不能说明总体特征,难以反映总体的全貌情况。
用这样的资料,无法从总体上认识和研究社会经济现象的数量表现,无法揭示社会经济现象发展变化的本质和规律。
因此,必须对这些分散的、不系统的个体资料采用科学的方法进行加工、整理、汇总,使之成为系统化、条理化、标准化的能反映总体特征的综合统计资料,并以此计算各种反映总体特征的综合指标,认识社会经济现象的总体特征和全貌,认识、分析社会经济现象的本质和发展变化规律。
可见,统计整理不是单纯的数据汇总,而是运用科学的方法,对调查资料进行分类和综合,从感性认识上升到理性认识。
它是从对社会经济现象个体量的认识到社会经济现象总体量的认识的连接点,是统计调查的继续,是统计显示与分析的前提和基础,在整个统计工作中起着承前启后的作用。
统计数据整理的质量,直接影响着统计工作的成果。
二、统计整理的内容统计整理的内容,主要包括以下几个方面:(1)对原始资料进行审核与检查,如果发现被调查单位的资料不齐全或有差错,要及时查询订正。
(2)对各项指标进行综合汇总,并按调查和分析目的的要求进行各种分组,汇总出各组单位数和各项指标的总数。
(3)将汇总的结果编制成统计表与统计图,以便进一步分析和应用。
三、统计整理的方法与步骤(一)统计分组统计分组是根据研究的任务和对象的特点,按照某种分组标志将统计总体分为若干组成部分。
理解统计分组的概念要注意三点:(1)统计分组的对象是总体。
(2)统计分组应有分组标志。
(3)统计分组对总体而言是“分”,对总体单位而言是“合”。
统 计 整 理
变动比例/%
7.0
6.0
5.0
4.0
3.0
2.0
1.8
1.0
0.0
-1.0 2005
1.5 2006
4.8 2007
5.9 2008
-0.7 2009 年
第四节 统计资料的表现形式
(三)饼形图 饼形图是以“饼”的面积大小来显示统计资料的一种图形。它主要用于反映现象的内 部结构及其变化。下图所示为典型的饼形图。
第二节 统 计 分 组
二、分组标志的选择 分组标志是指分组时作为划分统计组界的标准。 (一)根据研究的目的和任务选择分组标志 (二)选择能反映事物本质或主要特征的标志 (三)根据经济发展变化及历史条件选择分组标志 三、统计分组的种类 (一)统计分组按分组标志的多少分为简单分组和复合分组 (二)统计分组按分组标志的性质分为品质分组和变量分组
四部分构成。 2.从表的内容上看,统计表主要由主词和宾词两部分组成。 (二)统计表的种类
统计表按主词是否分组和分组的程度,分为简单表、分组表和复合 表。
第四节 统计资料的表现形式
(三)统计表的编制规则 1)各标题应简明扼要,能概括表的基本内容,标题内或标题下要
有资料所属的时间和空间范围,栏、行要表达统计资料的逻辑 关系。 2)栏目较多时应编号。主词常用(甲)、(乙)、(丙)等文字 表明,宾词栏应按1、2、3等数字编号。 3)上下端用粗横线,其余用细线表示,表的左右两端不封口。
350 000
300 000 250 000
200 000 150 000
184 937
100 000
50 000 0
2005
216 314
265 810
2006
第三章统计整理
20.27%
68.70% 11.03%
16.60%
70.14% 13.26%
工厂按产量分组
Â Ý Ô · 1 2 3 4 5 6 Ï Æ º ¼
ú ¿ ¨Ô ² Á £ ª þ © ¼ £ x
2 3 4 3 4 5 21
¥ » É ± µ Î ³ ¾ ¨Ô £ y £ ª © 73 72 71 73 69 68 426
•向下累计是将各组频数和频率由变量值大的组 向变量值小的组累计(是各组下限以上的累计频 数或累计频率)
向下累计 生活费 250 275 300 325 350 375 合计 频数 10 8 12 9 5 6 50 累计频数 50 40 32 20 11 6 累计频率 100% 80% 64% 40% 22% 12%
2. 统计表的内容构成:主词部分和宾词部分。
注:统计表的构成和内容构成见表3-2
总标题
表3-2
按考试成绩分组 (分)
某班统计学原理考试成绩分布表
频数 组中值 学生数 (人) 比重 (%) 向上累计 学生数 (人) 比重 (%) 向下累计 学生数 (人) 比重 (%)
纵 栏 标 题
90以上 80-90 横 行 标 题 70-80 60-70 60以下 合计
大型企业 中型企业 小型企业 大型企业 中型企业 小型企业 重工业
轻工业
按分组标志的性质分
学生按性别分组
男 女
学生按民族分组
学生按考试成绩分组
90分以上 80-90 70-80 60-70 60 分以下 19岁及以下 20岁 21岁 22岁 23岁 24岁及以上
汉族 回族 苗族 土家族 羌族 壮族 . . .
统计资料整理
第三章统计资料整理一、解释概念1. 统计整理是根据统计研究的目的要求,对统计调查所得的原始资料进行科学的分类、汇总,或对已初步加工的资料进行再加工,使之成为系统化、条理化的综合资料,以反映现象总体特征的工作过程。
2. 统计分组,就是根据统计研究的需要,按照一定的标志,将统计总体划分为若干个组成部分的一种统计方法。
3.分组标志就是将统计总体划分为几个性质不同部分的标准或依据。
4.复合分组是对被研究现象按两个或两个以上的标志结合起来所进行的分组。
5. 分布数列又称分配数列、次数分布,是在统计分组的基础上形成的,用来反映总体单位在各组中分布状况的统计数列。
6.统计表是把统计数据按照一定的结构和顺序,用表格显示出来的一种形式。
二、填充内容1. 统计调查、统计分析。
2.逐级汇总、综合汇总。
3. 及时性、准确性。
4. 简单分组、复合分组、分组体系。
5. 并列标志、分别。
6. 离散型、组距式。
7. 反比。
8. 组中值、一般水平。
9. 重合式、非重合式。
10. 总标题、纵标目。
11. 调查表、分析表、分组表、复合表。
12. 几何图形、具体形象。
三、选择答案1.( a b c d )2.( d )3.( a )4.( b c )5.( b )6.( b )7.( d )8.( a b )9.( a )10.( a c d )11.( b )12.( c d )13.( a )14.( a c )15.( c d )四、判断改错1.(√)2.(×)分布数列包括品质数列和变量数列。
3.(√)4.(√)5.(×)是一个品质数列。
6.(√)7.(×)通常是把该数值列人下限的所在组。
8.(√)9.(×)是离散变量数列。
10.(×)开口数列是指最大值只有下限没有上限,或者是最小值只有上限没有下限。
五、简答问题1.【回答要点】①统计整理是统计工作的中间环节,是统计调查的继续,又是统计分析的基础②实现由个体到全体、由特殊到一般、由现象到本质、由感性到理性的转化,从整体上反映出事物的数量特征。
《应用统计学》第三章:统计整理
三、次数分布数列的编制
根据变量的类型和变量值的多少确定是编 制单项数列还是编制组距数列
单项变量数列的编制方法
编制步骤
第一,将日产量按从小到大顺序排列 第二,将变量值分为若干组 第三,找出每组变量出现的次数 第四,按变量值的大小顺序编制出单项数列
【例】己知某车间有24名工人,他们的日产量(件) 资料,要求编制变量数列。
返回
第三节 统计数据分组与频数分布
一、统计数据分组的原则
穷尽原则:就是使总体中的每一个单位都 应有组可归,或者说各分组的空间足以容 纳总体所有的单位
互斥原则:就是在特定的分组标志下,总 体中的任何一个单位只能归属于某一组, 而不能同时或可能归属于几个组
二、统计数据分组的步骤和方法
统计分组一般经过三个步骤:即选择分组 标志、分组界限的划分、选用分组体系
组距式变量数列编制方法
第四,计算组限,指每组两端数值,分为上 限和下限 上限:每组的终点数值(最大值) 下限:每组的起点数值(最小值) 第五,计算次数和频数
组距式变量数列编制方法
第六,计算组中值,即各组中点位置所对应的变 量值。其计算公式为:
组中值= 或=
上组下限 本组下限 2
本组组距 2
(适用所有闭口组)
(2)从内容上来看,统计表是由主词栏和 宾词栏两个部分组成。 主词栏是统计表所要说明的总体及其组成 部分,一般都列在表的左半部分; 宾词栏是统计表用来说明总体数量特征的各 个统计指标及其数值,一般都列在统计表 的右半部分。 此外,统计表还有补充资料、注解、资料 来源、填表单位、填表人等附加内容。
2、统计表的分类ຫໍສະໝຸດ 三、统计分组的应用
划分社会现象的不同类型 揭示社会现象的内部结构 分析社会现象之间的依存关系
统计学c第三章统计整理
合计
经济、管理类 基础课程
统计学
第三节 分布数列—变量数列
第五、绘制频数直方图和折线图
我一眼就看出 来了,大多数 人的日加工零 件数在120~ 125之间!
直方图下的面 积之和等于1
频 15
数
12
(人) 9
6 3 105 110 115 120 125 130 135 140 日加工零件数(个) 某车间工人日加工零件数的直方图
统计学
第三节 分布数列—变量数列
第四步,编制变量数列 某车间50名工人日加工零件数分组表 按零件数分组(件)
105~110 110~115 115~120 120~125 125~130 130~135 135~140
频数(人)
3 5 8 14 10 6 4 50
频率(%)
6 10 16 28 20 12 8 100
目前我国有的地方性别比为120:100,这是不正常的现象
2.划分现象的类型:如我国经济成份划分为国有经济
和非国有经济,工业化分为轻、重工业。
经济、管理类 基础课程
统计学
第二节 统计分组
3 揭示现象的内部结构:如我国人员结构、产业结构。 新交通法中,正确处理机动车司机和过路行人之间的关系 体现以人为本的理念.
经济、管理类 基础课程
统计学
第三节 分布数列—变量数列
(1)组距数列的几个常用概念
A. 组限:各组的界限,有上限和下限之分。
B. 组距:上限与下限之差 。 C. 组中值:上、下限之和的半数,即:
D. 次数密度:单位组距分配的次数。即:
经济、管理类 基础课程
统计学
第三节 分布数列—变量数列
E. 开口组与开口数列:第一组无下限或最后一组无 上 限的组称开口组。含开口组的数列称开口数列。 注意:a. 开口组的组距按相邻组的组距推算; b. 分组时正好等于组限的数应按“归下限原则”处 理。 缺上限的组中值= 下限+相临组组距的一半 缺下限的组中值= 上限—相临组组距的一半
第三章 统计资料整理
31
简单表案例
某年某公司所属两企业自行车合格品数量表
厂别 甲厂 乙厂 合 计 合格品数量(辆) 5000 7000 12000
32
简单分组表案例
2005年某月某公司各企业劳动生产率统计表 分组 总产值 (万元) 职工人 数(人) 劳动生产率 (元/人)
大型
中型 小型 合计
33
复合分组表案例
某年某地区工业增加值和职工人数
26
第三步:确定组限和组中值。以区分事物质的差别。
对于离散变量,相邻组组限可以间断,也
可重叠;
对于连续变量,相邻组组限必须重叠; 符合“上组限不计入”原则; 首末两组可使用“××以下”及“××以
上”的开口组。
27
第四步:归类汇总,计算各组次数。
本着“不重复,不遗漏”的原则,按照各个总体单位的具体 标志值,将其划归某一具体组之中。 对于重叠设置的组距数列,要本着“上限不在内”的原则。
19
某地区人口分布状况
人口按年龄分组 1岁以下(婴儿组) 1-7岁(幼儿组) 7-17岁(学龄儿童组) 17-55岁(有劳动能力的人口组) 55岁以上(老年组) 合计
人口数(万人) 1 6 12 24.6 8.1 51.7
20
对于异距数列,为了消除各组组距大小对次数分布的影响,
需计算
次数密度=该组次数/该组组距
14-16
16-18 18-20
16
12 5
540
620 680
8
三、统计分组的种类和分组标志的选择
(一)统计分组的种类 1、按标志的性质不同分为:品质标志分组和数量标志分组: 2、按选择标志的多少不同,可分为: 简单分组:对统计总体仅按一个标志进行分组。特点:只能 反映现象在某一标志特征方面的差异情况,说明的问题比较 简单明了。 复合分组:对同一总体采用两个或两个以上的标志重叠起来 进行分组。特点:可从几个不同角度了解总体内部的差别和 关系,因此能更全面、更深入地研究问题;复合分组的组数 随着分组标志的增加而成倍地增加。
第三章统计整理
按照习惯,成绩一般分为不及格、及格、 按照习惯,成绩一般分为不及格、及格、中 良好、 等、良好、优秀
即 组限 60分以下 60~70 70~80 80~90 90分以上 65 75 85 组中值
上组限不在内
利用Excel Excel进行分组 ㈢ 利用Excel进行分组
数据分析” 直方图 直方图” 选“工具”-“数据分析”-“直方图” 工具” 数据分析 定义“输入区域” 数据 定义“输入区域”—数据 分组中每组上限, “接收区域”—分组中每组上限,包括在本组 接收区域” 分组中每组上限 内 “输出区域”—结果 输出区域” 结果
编制结果如下: 编制结果如下:
日产量(件)X 日产量(件)X 20 21 22 23 24 25 26 合计 工人数(人) 工人数(人) f 3 5 6 4 3 2 1 24
组距数列
指每个组的变量值用一个区间来表现 的变量数列
编制条件:
变量是连续变量; 变量是连续变量; 或:总体单位数较多,变量不同取值个数 总体单位数较多, 也较多的离散变量。 也较多的离散变量。
复合分组
按性别 分类
对教师 的分类
共计12组 共计 组 × × 男 2×3×2
女 高级 中级 初级 青年 中年
按职称 分类 按年龄 分类
第三节 次数分布 ★ 一、分布数列的概念及种类
二、组距数列的编制 三、累计次数与累计频率
将总体各单位按分组标志分组后, 将总体各单位按分组标志分组后, 次数分布 形成的各单位在各组的分布
地位
统计整理的步骤
拟定统计整理方案 统计资料的预处理 数据处理 制作统计表或统计图
第二节 统计分组
将总体中所有单位按一定的标志划 统计分组 分为类型或性质不同的若干部分的 过程 统计分组的作用: 划分现象的类型 反映现象内部结构 分析现象之间的依存关系
统计数据的整理.
统计数据的整理一、统计整理(一)定义:就是对搜集得到的初始数据进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的综合数据的工作过程。
对已整理过的资料(包括历史资料)进行再加工也属于统计整理。
(二)意义:1、通过统计调查可以取得第一手资料,但这种资料只能反映总体各单位的具体情况,是分散、零碎、表面的。
要说明总体情况,揭示出总体的内在特征,还需要对这些资料进行加工整理,使之系统化,以便通过综合指标对总体作出概括性的说明。
2、统计整理是整个统计工作和研究过程的中间环节,起着承前启后的作用。
统计整理是统计调查的继续,又是统计分析的基础。
统计调查所搜集到的资料,只有通过科学的审核、分类、汇总等整理工作,才能使统计在认识社会的过程中,实现由个别到全体、由特殊到一般、由现象到本质、由感性到理性的转化,才能从整体上反映出事物的数量特征。
否则统计调查所得的资料再丰富、再完备,其作用也发挥不出来,统计调查就将徒劳无益,统计分析也将无法进行。
3、统计整理还是积累历史资料的必要手段。
统计研究中经常要用动态分析,这就需要有长期累积的历史资料,而根据积累资料的要求,对已有的统计资料进行筛选,以及按历史的口径对现有的统计资料重新调整、分类和汇总等,都必须通过统计整理工作来完成。
(三)程序:1、设计整理方案: 分组和分组体系; 统计指标2、对搜集到的资料进行审核:对调查资料进行审核是统计整理的第一步,包括以下内容:(1)完整性和及时性完整性,就是看调查单位或填报单位是否齐全;规定的项目是否都有答案,应报资料的份数是否符合规定。
及时性,是看填报单位是否按时报送了有关资料。
对不报、漏报或迟报的现象都要及时查清。
(2)审核资料的正确性:审核资料的正确性,是检查所填报的资料是否准确可靠。
常用的审核方法有两种:①逻辑检查:首先,从理论上或常识上检查资料是否有悖常理、有无不切实际或不符合逻辑的地方。
例:一张调查表中,年龄是9岁,职业是教师,其中必有一个是错误的。
第三章 统计整理
开口组组中值的确定
缺下限开中组组中值=上限-邻组组距/2 缺下限开中组组中值=上限-邻组组距/2 缺上限开中组组中值=下限+邻组组距/2 缺上限开中组组中值=下限+邻组组距/2
19:18:05
31
把资料中各数值归到应属的组内
按照各个总体单位的具体标志值, 按照各个总体单位的具体标志值 , 将其划归某一 具体组之中, 在归类汇总时 , 要遵循 “ 具体组之中 , 在归类汇总时, 要遵循“ 不重复不 遗漏”的基本原则。 遗漏”的基本原则。 对于单项数列和不重叠设置的离散型组距数列来 说,上述原则容易做到。 上述原则容易做到。 对于重叠设置的连续型组距数列来说, 对于重叠设置的连续型组距数列来说 , 应处理好 恰好是组限的标志值的总体单位之归类问题, 恰好是组限的标志值的总体单位之归类问题 , 一 般应按“ 上组限不在内 ” 原则 , 般应按 “ 上组限不在内” 原则, 即本组下限的次 数属于本组, 本组上限的次数归于邻近的较大组 。 数属于本组 , 本组上限的次数归于邻近的较大组。
19:18:05
34
确定组数和组距
根据考试成绩性质的不同,在60分的基础上 根据考试成绩性质的不同,在60分的基础上 分为不及格、及格、中等、良好、优秀五 个类型。 令组距=10 令组距=10 则组数=43/10=4.3,因此组数取5 则组数=43/10=4.3,因此组数取5。
19:18:05
35
品质标志分组 数量标志分组
19:18:05
17
四、简单分组和复合分组
根据分组选择标志的多少不同,统计分组又可分 为: 简单分组
简单分组是指对统计总体仅按一个标志进行分组
统计基础知识项目三 统计整理电子教案
项目三统计整理教学要求学习目标:认识统计整理的意义、步骤和审核;认识统计分组的作用和标志;理解频数分布的概念和种类、定性数据和定量数据的频数分布;理解统计汇总的相关知识,掌握统计表和统计图的概念、结构与分类。
教学重点统计表和统计图的结构与分类。
教学难点统计分组、频数分布。
课时安排本章安排4课时。
教学内容模块一统计整理概述一、统计整理的概念及意义(一)统计整理的概念统计整理即统计数据整理,是根据统计研究的目的和任务,对收集到的多项原始资料进行科学的分类、汇总和加工,使之系统化、条理化的工作过程。
(二)统计整理的意义统计整理具有以下几方面的意义:(1)通过对统计资料的加工整理,使之系统化、条理化,可以利用综合指标对总体做出概括性说明,进而揭示总体的内在特征。
(2)在调查统计中获得的资料和数据,只有通过整理工作,经过科学的审核、分类、汇总等环节,才能使统计在认识社会的过程中实现由个例到整体、由现象到本质、由特殊到一般、由感性到理性的转化,才能从整体上反映出事物的数量特征。
(3)统计研究中经常要进行动态分析,这就需要有长期累积的历史资料。
二、统计整理的步骤(1)设计方案。
(2)资料审核。
(3)统计分组。
(4)统计汇总。
(5)编制统计表和绘制统计图。
三、统计数据的审核数据审核是统计整理的初始阶段,也是展开整个工作的基础。
1. 数据检查数据检查是指检查所收集数据的完整性和准确性。
数据检查主要包括以下步骤:(1)根据事先制订好的检查规则,对每一份问卷进行检查。
(2)按照检查规则将所有问卷分为三类:可以接受的、明显要作废的、有疑问的。
(3)对可以接受的问卷和有疑问的问卷进行进一步校订。
2. 数据校订数据校订是指根据研究目的和研究设计,对数据做进一步的补充和修正,以满足统计研究的要求。
以调查问卷为例,调查问卷的数据校订包括以下步骤:(1)查看每一份问卷,检查出不满意的答案。
(2)处理不满意答案。
处理不满意答案有两种方法:按缺失值处理、整个问卷作废。
第三章 统计整理
1.分组标志的选择原则 (1)应根据研究的目的与任务选择分组标志。 例如,同一个工人总体,有多种不同分组方法: ①如果研究学历对收入的影响时,应选择“文 化程度”作为分组标志。 ②如果研究资历对收入的影响时,则应选择 “工龄”作为分组标志。
(2)要选择能够反映事物本质或主要特征的标志。 例如,研究职工生活水平的高低情况时,可 以用“职工的工资水平”作为分组标志,也可以 用“职工家庭成员平均收入水平”作为分组标志。 应该选择后者作为分组标志。 (3)要根据现象的历史条件变化来选择分组标志。 例如,前面讲到研究职工生活水平问题,如 果要列出“职工生活贫困户”一组,则“贫困户” 的标准就随历史条件变化而变化,而且不同地区 标准也不相同。
第三节,变量数列(分配数列)
一、分配数列(次数分布)的概念
在统计分组的基础上,将总体中所有单位按组 归类整理,并按一定的顺序排列,形成总体中各单 位数在各组间的分布称为次数分布,又称分布数列 分布在各组的个体单位数叫次数,又称频数 (fi)。各组次数与总次数(Σfi)之比称为比 率,又称频率。 分配数列(次数分布)有两个构成要素:一 个是分组,另一个是次数。 统计分布的实质:把总体的全部单位按某标 志所分的组进行分配所形成的数列。
第二节 统计分组
一、统计分组的意义: • 统计分组的含义:是根据统计研究任务的 要求和现象总体的内在特点,把统计总体 按照某一标志划分为若干性质不同而又联 系的几个部分(或组)的一种统计方法。 统计分组的关键是分组标志的选择和 划分各组界限。而核心问题是正确地选择 分组标志。 (下)
• 在一个总体中,单位的品质标志或数量标志, 其标志表现可能是互不相同的,总体内部各 个单位间存在许多的变异标志又是人们把总 体进一步分为性质不同的几个部分的客观依 据。 • 统计分组是在总体内部进行的一种分类。兼 有“分”和“合”的双重含义:对总体而言 是“分”(分为范围更小的总体),而对总 体单位而言是“合”(合为性质相同的组); 对分组标志而言是“分”(按分组标志划分 总体成为标志表现不同的许多组),而对其 它标志来说又是“合”(其它标志表现的差 异消失了)。
统计基础知识--模块3统计整理内容和方法运用
1.统计分组同时具有两方面的含义: ①对总体而言是“分”, 即将总体区分为性质不 同的若干部分; ②对个体而言是“组”(合),即将性质相同的总 体单位组合起来。 2.统计分组的两项基本原则: ①保持组内同质性; ②显示组间差异性。 3.统计分组应遵循两个要求: ①互斥原则:一个单位只能分配到一个组内. ②穷举原则:使所有单位都有组可归。 。
3)统计汇总
㈠统计汇总的意义
统计汇总就是根据整理方案确定
X
的指标体系的要求,计算出各组 的和总体的各项指标数值的工作
过程。
统计汇总所取得的是反映总体及
其各组成部分绝对数量的总量指
标,这些总量指标是下一步进行
统计分析的基础。
统计汇总是统计整理出成果的阶
段,因而是整个统计整理工作的
中心内容。
X ㈡统计汇总的组织形式
Fighting
Every dream is worthy of respecting
㈢统计汇总的技术方法
1.手工汇总:是利用算盘或小型计算器等以手工操作方
式对调查资料进行汇总。
常用的手工汇总方法有五种:
年份 产业
第一产业
第二产业
第三产业
合计
我国三次产业从业人员构成情况
单位:%
2000 2001 2002 2003 2004 2005
50.0 50.0 50.0 49.1 46.9 44.8
22.5 22.3 21.4 21.6 22.5 23.8
27.5 27.7 28.6 29.3 30.6 31.4
执行。
组数和组限的确定
● 2.变量分组是指选择反映事物数量特征的数量标志(变量) 对总体进行的分组。
第四章 统 计 整 理
三、 统计表的种类
1. 按用途分类 统计表按用途不同,可分为调查表、整理表和分 析表 2. 按统计数列的性质分类 统计表按所反映统计数列的时空性质不同,分为 空间数列表、时间数列表和时空数列结合表 3. 按总体分组情况分类 统计表按对总体分组的情况不同,可分为简单表、 分组表和复合表
看管机器台数 (台) 2 3 4 5 6 工人数(人) 6 18 20 12 4 比重(%) 10 30 33.33 206.67
合 计
60
100.00
简单次数分布图
表4-9 某县城居民家庭人均月消费性支出分配数列
人均月消费性支出(元) 300~350 350~400 400~450 450~500 500~550 550~600 合 计 家庭数(户) 5 16 30 14 7 3 75 比重(%) 6.67 21.33 40.00 18.67 9.33 4.00 100.00
2. 组距式数列的编制
(1) 把变量值按由小到大的顺序排列 (2) 确定组数和组距 (3) 确定组限 (4) 汇总出各组的次数及比重,编制组距式 数列
四、 次数分布特征
1. 次数分布的表示方法 (1) 简单次数分布表与分布图 简单次数分布表 表4-8 某纺织厂工人看管机器台数分配数列
平行分组体系的特点:
每次分组固定一个分组标志,即只考 虑一个因素的差异对总体内部分布情况的 影响,而且各个简单分组之间彼此独立, 没有主次之分,不互相影响。
2. 复合分组和复合分组体系
复合分组:对同一总体选择两个或两个以 上分组标志层叠起来进行分组,叫作复合 分组。 复合分组体系:复合分组所形成的分组体 系叫做复合分组体系。
1. 简单分组和平行分组体系
统计知识整理
图3-6 某车间工人日加工零件数的折线图
分组数据的图示—圆形图
也称饼图,是用圆形及园内扇形的面积 来表示数值大小的图形
主要用于表示总体中各组成部分所占的 比例,对于研究结构性问题十分有用
在绘制圆形图时,总体中各部分所占的 百分比用园内的各个扇形面积表示,这 些扇形的中心角度,是按各部分百分比 占3600的相应比例确定的
横
第一产业
14883
2.9
数
标 第二产业
52982
9.9
字
题 第三产业
34522
7.3
资
合计
102398
8.0
料
主词
宾
词
(二)统计表的种类
按主词是否分组和分组的程度: 1、简单表—主词未经任何分组的统
计表
2、分组表—主词按某一标志进行分
组的统计表
3、复合表—主词按两个或两个以上
标志进行复合分组的统计表
125之间!
频 15 数 12 (人) 9
6
3
直方图下的面 积之和等于1
105 110 115 120 125 130 135 140
日加工零件数(个)
图3-5 某车间工人日加工零件数的直方图
分组数据—直方图(直方图与条形图的区别)
条形图是用条形的长度(横置时)表示各类别 频数的多少,其宽度(表示类别)则是固定的
¥
$
表3-11 1991~1998年城乡居民家庭人均收入
年份
城镇居民
农村居民
1991
1700.6
708.6
1992
2026.6
784.0
1993
2577.4
921.6
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计整理的概念
统计整理(Statistical Processing)
统计整理即“统计资料整理”,是根据统计研究的目的和任务的要求,对统计调查所得到的各项原始资料进行科学的分类和汇总,为统计分析提供准确、系统、条理清晰、能在一定程度上说明总体特征的综合资料的工作过程。
广义地说,统计整理也包括对次级资料进行的再加工。
统计整理是统计工作的中间环节,是统计调查的继续和发展,是统计分析的前提和条件,在整个统计工作过程中起承上启下的作用。
因为,统计调查所搜集到的原始资料是零碎的、分散的、不系统的,是反映个体特征的,不能反映总体的综合数量特征和事物的规律性。
只有通过统计整理,去伪存真,去粗存精,将分散零碎的个体资料进行归纳和概括,才能得到系统的、反映总体数量特征和规律性的统计资料,才能认识总体。
统计整理结果的一种重要表现形式是分配数列。
它说明总体单位数在各组分配的情况。
分配数列包括两个因素:组的名称和各组的单位数。
分配在各组的总体单位数叫次数(频数),各组次数与总次数之比叫比率(频率)。
分配数列可以按品质标志分组,也可以按数量标志分组。
前者称品质数列,后者称变量数列。
一般的统计调查都是大规模的,取得的统计资料数量庞大,汇总整理需要众多的人员参与,为保证统计整理的质量,在进行整理之前,要设计统计资料整理方案。
所谓整理方案就是对统计整理阶段各个方
面工作所作的全面考虑和安排,通常以文件的形式出现。
统计整理方案一般应包括以下内容:
1、确定汇总的统计指标和综合表。
2、确定分组方法。
有关统计分组的内容将在下一节专门论述。
3、确定汇总资料的形式。
4、确定资料的审查内容和审查方法。
(一)统计整理的形式
统计整理需要采取一定的组织形式。
其形式基本上有两种:
1、逐级整理。
即按照一定的统计管理体制,自下而上地对调查资料逐级进行整理。
2、集中整理。
即将全部调查资料集中到组织统计调查的最高一级机构一次进行整理。
也可以将两者结合,即一方面对一些最基本的统计指标实行集中汇总,另一方面又将全部原始资料实行逐级汇总。
(二)统计整理的技术
统计整理的技术主要有:
1、手工汇总。
用算盘或小型计算器进行。
2、电子计算机汇总。
包括编程序、编码、数据录入、逻辑检查、制表打印等过程。
事物的数量方面不是单一的,而是多方面的,它们之间有着多方面的联系。
每一方面的数字对于了解这一事物都有一定的作用,不能只顾一方面而忽视另一方面。
对统计资料进行整理,就要研究事物的
全貌,描绘事物的整个发展过程,揭示事物的总体特征和规律性。
对特定的事物来说,一般有一个方面或几个方面的数量是基本的,关键性的,能表现事物本质的;而其余一些数量可能只有辅助、补充的意义。
统计整理必须从事物的联系中找出这种基本的数量关系。
因此,在对所研究的社会经济现象进行深刻的政治经济分析的基础上,抓住最基本的、最能说明问题本质特征的统计分组和统计指标对统计资料进行加工整理,就成为进行统计整理必须遵循的基本原则。
统计整理是一项细致的工作,应当有组织有计划的进行,对统计资料进行整理的步骤如下:
1、设计和制订统计资料的汇总方案。
2、对原始资料进行审核和检查。
统计资料的审核包括完整性、正确性和可比性、及时性审核。
完整性审核是指,要求得到的资料是否都得到了,是否有缺页漏项的现象。
正确性审核是指,判断资料的真假和可靠程度。
可比性审核是指,资料的计算口径、包括范围、计算方法、计算价格等方面是否可比。
及时性审核,主要是检查调查单位是否按时上报统计资料,有无拖延。
对原始资料进行审核与检查的方法主要有逻辑审核法和验算审核法两种。
3、用一定的组织形式和方法,对原始资料进行分组、汇总和计算。
汇总组织方式有逐级汇总和超级汇总两种。
按照确定的汇总组织方式,根据汇总要求和具体方法,对原始资料进行分组汇总,并计算
各组指标和综合指标。
4、对整理好的资料再一次进行审核,以便及时发现和纠正汇总过程中的各种差错。
5、将汇总的结果表示出来。
表示统计资料的方法有统计表、统计图和统计报告等。
6、系统地积累统计资料。