第三章统计整理第一节统计整理的意义内容第二节统计分组
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章统计整理
第一节统计整理的意义和内容
一、统计整理的概念和意义
所谓统计整理,就是根据统计研究任务的要求,对统计调查所搜集到的原始资料进行科学的加工整理,使之条理化、系统化,把反映总体单位的大量原始资料,转化为反映总体的基本统计指标,统计工作的这一过程,叫统计资料的整理。
统计调查所取得的原始资料是反映总体各个单位的资料,这些属于有关标志的标志表现仅说明各个单位的具体情况,是不系统、分散的,还可能带有一定的片面性。
统计所需要的是反映总体特征的统计指标,都是以数字表示的,因此需要进行统计整理。
统计资料的整理,属于统计工作的第三阶段。
统计整理介于统计调查和统计分析之间,在统计工作中起到承上启下的作用,既是统计调查阶段的继续,又是统计分析的基础和前提,它实现从个别单位的标志值向说明总体数量特征的指标值过渡,是人们对社会经济现象从感性认识上升到理性认识的过渡阶段,是进一步进行统计分析的必要前提。
可见,统计整理决不是一个单纯的技术问题,而且是统计工作中一个极其重要的理论问题。
二、统计整理的内容和步骤
统计整理的内容通常包括:
(1) 根据研究任务的要求,选择应整理的指标,并根据分析的需要确定具体的分组;
(2) 对统计资料进行汇总、计算;
(3)通过统计表描述汇总的结果。
在统计整理中,抓住最基本的、最能说明问题本质特征的统计分组和统计指标对统计资料进行加工整理,这是进行统计整理必须遵循的原则。
统计整理的步骤由内容来决定,大体分为以下几个步骤:
(一)设计整理方案
整理方案与调查方案应紧密衔接。
整理方案中的指标体系与调查项目要一致,或者是其中的一部分,绝不能矛盾、脱节或超越调查项目的范围。
整理方案是否科学,对于统计整理乃至统计分析的质量都是至关重要的。
(二)对调查资料进行审核、订正
在汇总前,要对调查得来的原始资料进行审核,审核它们是否准确、及时、完整,发现问题,加以纠正。
统计资料的审核也包括对整理后次级资料的审核。
(三)进行科学的统计分组
用一定的组织形式和方法,对原始资料进行科学的分组,是统计整理的前提和基础。
(四)统计汇总
对分组后的资料,进行汇总和必要的计算,就使得反映总体单位特征的资料转化为反映总体数量特征的资料。
(五)编制统计表
统计表是统计资料整理的结果,也是表达统计资料的重要形式之一。
根据研究的目的可编制各种统计表。
第二节统计分组
一、统计分组的概念
统计分组就是根据统计研究的目的和被研究现象的本质特征,将统计总体按照一定的标志划分为若干性质不同的部分或组。
统计总体是由性质相同的许多单位所组成的,这就是统计总体的同质性特征。
但同质性又是相对的,总体各单位之间还存在着质或量上的差别。
因此,统计总体可进一步区分为性质不同的几个部分。
统计分组可以这样来理解:一是对总体而言是“分”,即将总体区分为性质不同的若干部分;二是对总体单位而言是“合”,即将性质相同或相近的单位组合在一起。
例如,把所有的工业企业组成一个总体,又可把这个总体按所有制形式不同,划分全民所有制企业、集体所有制企业、合资企业等组。
每一组内务企业的所有制性质相同,而组与组之间,各种所有制又存在着性质上的差别。
因此,统计分组是在统计总体内部进行的一种定性分类。
二、统计分组的作用
科学的统计分组是统计整理和分析的基础,是研究社会现象的重要方法。
其主要作用如下:
1.划分社会经济现象的类型
社会经济现象是错综复杂的,具有各种不同的类型。
通过统计分组,可以从数量方面说明不同类型现象的数量特征,表明不同类型现象的本质和发展规律。
例如,将某工业管理局所属企业按经济类型分组,可分为全民所有制、集体所有制和其他经济类型,通过各组的产值、职工人数、劳动生产率、成本降低率、资金利润率等指标,就可以揭示不同类型企业各自的特征,以便进一步研究其发展规律。
2.反映现象的内部结构及其比例关系
将所研究现象按某一标志进行分组,计算出各组在总体中的比重,用以说明总体内部的构成。
同时将总体各组之间进行对比,就可以反映各组之间的比例关系。
例如,将工业总产值分为轻工业总产值和重工业总产值,分别计算出它们的比重,并计算出轻工业总产值与重工业总产值的比值,便可揭示工业总产值内部结构及其比例关系。
3.分析现象之间的依存关系
现象不是孤立的,而是相互依存和相互联系的。
这种依存关系,常常表现为因果关系。
统计中把那些表现为事物发展变化原因的标志称为影响标志,而把表现为事物发展结果的标志称为结果标志。
利用统计分组分析现象之间的依存关系,首先用影响标志对总体进行分组,然后计算出结果标志的数值,从而分析两个标志的联系程度和方向。
例如,分析工时利用率与生产计划完成指标的依存关系,见表3-1。
表3-1 工时利用率与生产计划完成指标的关系
按工时利用率分组(%)班(组)个数各组
生产
计划
完成
(%)
80以下80~85 85~90 90以上3
12
16
5
85.0
92.5
105.3
110.0
合计36 103.4
表中资料表明:工时利用率越高,生产计划完成就越好;反之,工时利用率越低,生产计划完成就越差。
体现了生产计划完成指标对工时利用率的数量依存关系。
必须指出:统计分组的三个作用并不是完全孤立的,而常常是相互补充,可以结合起来运用。
例如,划分类型后即可表示结构,有了结构就可以进行依存关系的分析。
三、统计分组的方法
(一)分组标志的选择和组的划分
分组标志就是用来作为分组依据的标准。
统计分组的关键在于选择分组标志和划分各组界限,选择分组标志是统计分组的核心问题,因为分组标志与分组的目的有直接关系。
任何一个统计总体都可以采用许多分组标志分组。
分组时所采用的分组标志不同,其分组的结果及由此得出的结论也不会相同。
这是因为分组标志一经选定必然表现出总体在这个标志上的差异情况,但同时又掩盖了其它标志的差异。
如果分组标志选择不恰当,不但无法表现出总体的基本特征,甚至会把不同质的事物混在一起,从而掩盖和歪曲现象的本质特征。
划分各组界限,就是要在分组标志的变异范围内,划定各相邻组间的性质界限和数量界限。
那么如何正确选择分组标志呢?第一,要根据统计研究的目的选择分组标志。
第二,必须根据事物内部矛盾的分析,选择反映事物本质的分组标志。
第三,结合被研究事物所处的具体历史条件选择分组标志。
分组标志有品质标志和数量标志。
按品质标志分组就是按事物的质量属性分组。
例如,人口按民族、职业分组,工业企业按所有制分组等。
按品质标志分组,有些比较简单,例如人口按性别分组。
但有些比较复杂,例如,工业产品按种类分组。
按数量标志分组,即按事物的数量特征分组。
例如,工业企业按职工人数分组。
按数量标志分组时,根据每组数量标志值的具体表现,又分为单项式分组和组距式分组两种。
(二)统计分组的种类
统计分组按某一分组的标志的多少和组合情况分为简单分组和复合分组。
简单分组,就是对被研究现象只按一个标志进行的分组。
例如,将工业企业职工分别按年龄、工龄、文化程度等标志进行分组。
简单分组只能说明被研究现象某一方面的差别情况。
复合分组,是采用两个或两个以上的标志结合起来进行分组。
例如,将工业企业先按所有制这个标志进行分组,在此基础上,再按企业规模这个标志分组。
采用复合分组,可以对被研究的现象作更深入的分析。
但也不宜采用过多的标志进行复合分组,以免组数过多,反而难以显示出事物的本质特征。
由于客观事物是非常复杂的,有时需要从不同角度来分析研究,才能认识事物的本质,因此,常常要采用一系列相互联系、相互补充的分组来进行分析。
这一系列相互联系的分组,称为分组体系。
例如,对企业职工的分析,就常用按工作性质、年龄、文化程度等标志进行许多分组,组成分组体系,从各个方面反映企业职工的各种特征,就可对企业职工获得比较全面的认识。
四、对统计分组资料的再分组
统计资料的再分组就是把统计分组资料按某种要求,重新进行分组,以满足统计分析的要求。
再分组的方法有两种:一是按原来的分组标志重划新组,并将原分组资料根据新组组限按比例重新加以整理;一种是先划定新组,并确定新组单位数在总体中应占的比重,然后据以将原分组资料按比例重新加以整理。
例如,某工业部门各企业按劳动生产率不同的分组资料如表3-2。
表3-2 某工业部门劳动生产率分组表
按劳动生产率分组(上组限不在内) (元
/人)企业数比重(%)总产值比重
(%)
职工人数比重
(%)
14000以上13000~14000 12000~13000 11000~12000 10000~1l000 9000~10000 800~900 700~800 600~700
600以下3
2
4
12
9
20
15
10
14
11
2.93
1.84
3.82
9.04
10.98
19.12
16.78
13.00
12.83
9.66
4.72
2.69
5.40
11.54
12.93
20.00
16.26
10.78
9.48
6.20
合计100 100.00 100.00
上述分组表资料,由于各组之间的差异过小,难以看出其质的区别。
现根据统计分析的要求,仍然按劳动生产率标志重新分组,见表3-3。
表3-3 某工业部门劳动生产率分组表
按劳动生产率分组(上组限不在内) (元
/人)企业数比重
(%)
总产值比重(%)职工人数比重
(%)
12500以上10000~12500 7500~10000 7500以下7
23
40
30
6.683
21.93
42.40
28.99
10.11
27.17
41.65
21.07
合计100 100.00 100.00
再分组表3-3中,第1组是12500元/人以上,它包括表3—2中的第1、2组,第3组中有本组的一部分,这一部分有多大,只能估计而不能准确地确定下来。
以12500在12000~13000中的位置来估计,12000~13000中间距离为1000,12500与上下限的距离都是500,处于中,以50%的比例把第3组分开,一半在上半组,一半在下半组。
则第1组的各项数值为3%+2%+4%×0.5=7%,2.93%+1.84%+3.82×0.5=6.68%。
其他各组以此类推。
表3-3的方法是建立在假设原资料各组内的单位均匀分布的基础上。
实际并不如此,故再分组的结果通常具有一定程度的假定性。