统计学课件讲义 第4章 统计数据的整理与显示

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第4章统计数据的整理与显示

一、统计数据整理

1、概念:统计整理,就是指根据统计研究目的,将统计调查所得的原始资料进行科学的分

类汇总,或对已经加工的次级资料进行再加工,为统计分析准备系统化、条理化

的综合资料的工作过程。

2、作用:它是从对现象的感性认识过渡到理性认识的开始,是这个过程的连续点,并为这

个过程提供坚实的基础。在统计工作中起着承前启后的作用

3、整理汇总必须遵守的原则:在对所研究的社会经济现象进行深刻分析的基础上,抓住最

基本、最能说明问题本质特征的统计分组和统计指标对统计

数据加工整理。

4、数据整理的程序:

设计和编制统计资料的整理方案→对调查获得的资料进行审核{对原始资料进行审核对二手数据进行审核

数据筛选

→按照一定的组织方式和方法,对原始资料进行分组、编码、汇总和计算→对整理好的统计资料再次进行审核,改正在汇总过程中产生的各种差错→将汇总整理的结果编制成统计表或绘制统计图,简明扼要地表明现象的数量特征→积累、公布和管理统计数据

注:对原始资料的审核包括准确性审核、及时性审核和完整性审核

对二手数据的审核包括完整性审核、准确性审核、重审数据的适用性和时效性

5、统计汇总是整理的核心其组织形式基本有3种:集中汇总、逐级汇总和综合汇总,统计汇总的技术主要有手工汇总和电子计算机数据处理2种。

二、统计分组

1、概念:统计分组是指根据事物内在的特点和统计研究的需要,将统计总体按照一定的标

志区分为若干组成部分的一种统计方法。

2、原则:组内同质,组间差异原则、穷尽原则、互斥原则

3、作用:I.可以区分现象质的差别

II.可以分析总体内部结构和总体结构特征

III.可以揭示现象之间的依存关系

4、种类:

按分组标志的多少,统计分组可分为简单分组和复合分组

按分组的标志性质不同,统计分组可分为品质分组(属性分组)和数量分组(变量分组)。

品质分组:就是按品质标志进行分组。一般地,对于类别数据,采用品质分组。

数量分组:就是按数量标志分组。数量标志的变异性体现在它不断变动自身的数量上,故也称为变量分组。

品质分组所形成的数列成为品质数列,数量分组所形成的数列称为变量数列。

按分组的作用和任务不同,统计分组可分为类型分组、结构分组和分析分组

5、分组标志的选择:统计分组中关键的问题在于选择分组标志和各组界限的划分,而选择分组标志则是统计分组的核心问题。

I.根据统计研究的目的与任务选择分组标志

II.在若干个标志中,要抓住具有本质性的或主要的标志作为分组的依据

III.根据现象所处的历史条件或经济条件来选择标志

6、统计分组的方法 :品质分组的方法 、数量分组的方法

7、统计分组体系:平行分组体系 、复合分组体系

8、对分组资料的再分组:按原来的分组标志重划新组,并将原分组资料根据新组组限的比例重新加以整理划定新组,并确定新组的单位数在总体中所占的比重,然后据以将原分组资料按比例重新加以整理

三、频数分布

1、概念:在统计分组的基础上,将总体中所有单位按组归类整理,形成总体中各个单位数在各组间的分配,叫做频数分布。

2、分布数列:将各组别与频数按一定的次序排列所形成的数列称作频数分布数列,简称分

布数列。分布数列也是分组,是一种特殊形式的分组。(原因P84)

分布数列分为品质分布数列和变量分布数列

3、品质数列:按品质标志分组所编制的分布数列叫品质分布数列或属性分布数列,品质数

列由组的名称和各组的频数两个要素构成。

品质数列的编制程序:原始数据→分组归类→合计(形成次数分布)→制作

统计表

4、变量数列:按数量标志分组所编制的分布数列,变量数列由各组变量值和各组的频数两

个要素构成。

I .按数量标志分组应注意的问题:

①分组时各组数量界限必须能反映事物质的差别。

②应根据被研究的现象总体的数量特征,采用适当的分组形式,确定相宜的组距、组限。

II .单项式分组与组距式分组

III .间断组距式分组和连续组距式分组

·间断组距式分组 例:地震等级5.0-5.9级,6.0-6.9级,7.0级以上

·连续组距式分组 例:分数60分以下,60-70分,70-80分,80-90分,90-100分 在连续组距式分组中,遵守“上限不在内”原则 ,例:将70分归入70-80分组内 IV .等距分组与异距分组

V .组距、组数、组限与组中值的计算

·组距:各组上下线间的距离

组距的经验公式:斯特杰斯经验公式

N 为总体单位数,R 为全距

一般首组的组下限必须≤实际变量的最小值,

末组的组上限必须≥实际变量的最大值

·组中值:上下限之间的中点数值

·开口组中上下限的确定:首组假定下限=首组上限-邻组组距

末组假定上限=末组下限+邻组组距

首组组中值=首组假定下限+上限2=上限−邻组组距2

1 3.322lg n N

=+max

min 1 3.322lg x x R d n N

-==+

末组组中值=末组假定上限+下限

2

=下限+

邻组组距

2

VI.组距变量数列的编制程序

原始数据序列化→计算组距→分组归类→确定组数、组距→确定组限→合计(形成

次数分布)→制作统计表

5.频数分布的类型

I.钟形分布

II.U型分布

III.J型分布

四、数据显示

1、统计表

·概念:广义的统计表包括统计工作各阶段中所用的一切表格

狭义的统计表专指分析表和容纳各种统计资料的表格,也就是通常所说的统计表·构成:统计表从形式上看,由总标题、横行标题、纵栏标题和指标数值4部分组成统计表从其内容看,由主词栏和宾词栏两部分组成

必要时可在统计表的下方加上表外附加,主要包括:补充资料、注解、资料来源、

填表单位、填表人以及填表日期等。

·分类:按其作用不同,可分为调查表、整理表或汇总表和分析表

按主词的分组情况不同,分为简单表、简单分组表和复合分组表

按宾词设计不同可分为宾词简单排列表、分组平行排列表和分组层叠排列表·设计:总的要求是:科学、实用、简练、美观。

设计应注意的事项:A.表的行列比例

B.线条的绘制

C.合计栏的设置

D.栏数的编号

内容设计应注意事项: 标题设计指标数值(数据太小用。。。表示)计量单位

表外附加

2、统计图

相关文档
最新文档