统计数据整理的一般问题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
浅谈统计数据整理的一般问题
摘要通过各种渠道将统计数据搜集上来,首先应对这些数据进行加工整理,使之系统化、条理化,以符合统计分析的要求,
关键词:统计数据整理;概念;步骤
一、统计整理的一些基本概念
1 总体和总体单位
(1)总体和总体单位密切联系在一起,但两者不是固定不变的,随着研究目的和任务的改变,总体和总体单位就会发生变化。例如,调查全县各镇的工业生产情况,则全县的所有镇构成总体,每个镇是总体单位。如果任务是调查了解某个镇的工业生产情况,则该镇的每个工业企业是总体单位,该镇的所有工业企业构成总体,对这个镇来说,在前一个调查任务中,它是总体单位,而在后一个调查任务中,它是总体。
(2)总体的特征
①同质性。是指构成总体的各个单位必须在某一(些)方面是相同的。例如,调查了解某镇工业生产情况,那么构成总体的每个单位必须有共同性,即每个总体单位必须是工业企业并且是该镇所属。同质性是构成总体的首要条件。
②大量性。统计总体必须由足够多的单位组成,仅是个别单位或少数单位不能形成总体。因为统计研究的目的是为了从数量方面揭示社会经济现象的本质特征和规律性,只有从大量现象的普遍联系中才能表现出来,个别单位和少数单位的特征难以反映现象的本质
和规律性。
③变异性。构成总体的各个单位在某些方面是相同的,但在其他方面则各不相同,具有质的差别和量的差别,这种差别称为变异。
(3)总体的分类。统计总体按其包括的单位数的限度,可分为有限总体和无限总体。
一个统计总体中包括的单位数如果是有限的,称为有限总体。例如,某厂职工人数、某市工业企业个数、某市人口总数等都是有限总体。
一个统计总体中包括的单位数如果是无限的或者在一定的条件
下是无法确定的,则称为无限总体。例如,某种野生动物的数量是难以确定的,则可以称为无限总体。对无限总体无法进行全面调查了解。
2 标志和标志值
标志是说明总体单位特征的名称。标志的具体表现称为标志值。如职工的年龄有18岁、19岁、21岁……。那么“年龄”是标志,而“18、19、21”则是标志的具体表现,称为标志值。再如职工的性别有男和女,那么“性别”是标志,“男”和“女”则是标志值。标志可以按以下情形进行分类:
(1)标志按其具体表现的性质不同可以分为品质标志和数量标志。品质标志是表明现象质的特征,通常不能用数量表示,如职工的性别、民族、文化程度等。数量标志是表明现象量的特征,一般用数量表示,如职工的年龄、工龄、工资等。
(2)标志按其变异情况可以分为不变标志和可变标志。不变标志即标志的具体表现都是相同的或一致的。不变标志是统计总体同质性的体现,一个统计总体至少存在一个不变标志。可变标志即标志的具体表现不尽相同。如各个企业的职工人数、增加值、资产总值、利税额等都可能存在差异,这些标志便是可变标志。可变标志是统计总体变异性的体现。
二、统计整理的步骤
数据的预处理是数据整理先行步骤,它是在对数据分类或分组之前对原始数据和第二手数据所做的必要处理,包括对数据的审核、订正和排序。
1 数据的审核。在对统计数据进行汇总整理前,先要进行严格的审核,这是数据整理的重要一环,涉及整个汇总工作的质量,数据审核的内容包括数据的准确性、及时性、完整性和适用性等四个方面。
(1)数据准确性的审核。数据的准确性是审核的重点,审核方法有计算检查和逻辑检查两种。逻辑检查是审核调查数据的内容是否合理、有无相互矛盾和不符合实际的地方;计算检查,是通过计算来符合表中的各项数值有无差错,各项指标的计算方法是否恰当,计算单位是否正确,有关指标之间的平衡关系是否得以保持等。(2)数据及时性的审核。审核数据的及时性,就是审核数据是否符合调查时间,数据的报送是否及时,并找出未按时报送的原因。
(3)数据完整性的审核。审核数据的完整性,就是审查搜集的数
据是否达到规定的调查单位数目,调查资料中的各项目是否填写齐全,因为任何单位的数据不报、缺报,都会影响整个汇总工作的进行。
(4)数据适用性的审查。数据适用性的审查主要是针对第二手数据。因为第二手数据可以来自多种渠道,有些数据可能是为特定目的通过专门调查而得到的,或者是已经按特定目的是需要做了加工整理,因此,对于使用者来说,首先应弄清楚数据的来源、数据的计算口径和有关的背景资料,以便确定这些数据是否符合分析研究的需要,是否需要重新进行加工整理等。
2 数据的订正。对审核过程中发现的迟报、漏报及计算错误,应及时催报、补报、改正、并针对不同的错误做出不同的处理:
(1)对于可以肯定的一般错误,即代为更正,并向有关单位核对。
(2)对于可疑之处或无法代为更正的错误,应通知原报单位复查更正。
(3)对于在一个单位发现的有代表性的重大错误,除通知原单位更正外,还要将差错情况通报尚未报送资料的单位,以防止类似错误的发生。
(4)凡错误情节属于违反统计法规的,应查明责任,予以适当处理。
3 数据的排序。数据排序就是按照一定的顺序将数据排列,以便初步显示数据的一些明显特征和规律,为研究者找到解决问题的线索。此外,排序还有助于对数据的检查和纠错,为分组、汇总提
供依据。在某些场合,分析的目的就是排序,例如,将全国共有企业中上缴利税的前50名排序,了解我国上缴利税大户的情况;将全国轿车产量前10名的企业排序,经营者据此可以了解竞争对手的情况,从而有效地制定企业发展规划和战略目标。