统计学课件讲义 第4章 统计数据的整理与显示
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第4章统计数据的整理与显示
一、统计数据整理
1、概念:统计整理,就是指根据统计研究目的,将统计调查所得的原始资料进行科学的分
类汇总,或对已经加工的次级资料进行再加工,为统计分析准备系统化、条理化
的综合资料的工作过程。
2、作用:它是从对现象的感性认识过渡到理性认识的开始,是这个过程的连续点,并为这
个过程提供坚实的基础。在统计工作中起着承前启后的作用
3、整理汇总必须遵守的原则:在对所研究的社会经济现象进行深刻分析的基础上,抓住最
基本、最能说明问题本质特征的统计分组和统计指标对统计
数据加工整理。
4、数据整理的程序:
设计和编制统计资料的整理方案→对调查获得的资料进行审核{对原始资料进行审核对二手数据进行审核
数据筛选
→按照一定的组织方式和方法,对原始资料进行分组、编码、汇总和计算→对整理好的统计资料再次进行审核,改正在汇总过程中产生的各种差错→将汇总整理的结果编制成统计表或绘制统计图,简明扼要地表明现象的数量特征→积累、公布和管理统计数据
注:对原始资料的审核包括准确性审核、及时性审核和完整性审核
对二手数据的审核包括完整性审核、准确性审核、重审数据的适用性和时效性
5、统计汇总是整理的核心其组织形式基本有3种:集中汇总、逐级汇总和综合汇总,统计汇总的技术主要有手工汇总和电子计算机数据处理2种。
二、统计分组
1、概念:统计分组是指根据事物内在的特点和统计研究的需要,将统计总体按照一定的标
志区分为若干组成部分的一种统计方法。
2、原则:组内同质,组间差异原则、穷尽原则、互斥原则
3、作用:I.可以区分现象质的差别
II.可以分析总体内部结构和总体结构特征
III.可以揭示现象之间的依存关系
4、种类:
按分组标志的多少,统计分组可分为简单分组和复合分组
按分组的标志性质不同,统计分组可分为品质分组(属性分组)和数量分组(变量分组)。
品质分组:就是按品质标志进行分组。一般地,对于类别数据,采用品质分组。
数量分组:就是按数量标志分组。数量标志的变异性体现在它不断变动自身的数量上,故也称为变量分组。
品质分组所形成的数列成为品质数列,数量分组所形成的数列称为变量数列。
按分组的作用和任务不同,统计分组可分为类型分组、结构分组和分析分组
5、分组标志的选择:统计分组中关键的问题在于选择分组标志和各组界限的划分,而选择分组标志则是统计分组的核心问题。
I.根据统计研究的目的与任务选择分组标志
II.在若干个标志中,要抓住具有本质性的或主要的标志作为分组的依据
III.根据现象所处的历史条件或经济条件来选择标志
6、统计分组的方法 :品质分组的方法 、数量分组的方法
7、统计分组体系:平行分组体系 、复合分组体系
8、对分组资料的再分组:按原来的分组标志重划新组,并将原分组资料根据新组组限的比例重新加以整理划定新组,并确定新组的单位数在总体中所占的比重,然后据以将原分组资料按比例重新加以整理
三、频数分布
1、概念:在统计分组的基础上,将总体中所有单位按组归类整理,形成总体中各个单位数在各组间的分配,叫做频数分布。
2、分布数列:将各组别与频数按一定的次序排列所形成的数列称作频数分布数列,简称分
布数列。分布数列也是分组,是一种特殊形式的分组。(原因P84)
分布数列分为品质分布数列和变量分布数列
3、品质数列:按品质标志分组所编制的分布数列叫品质分布数列或属性分布数列,品质数
列由组的名称和各组的频数两个要素构成。
品质数列的编制程序:原始数据→分组归类→合计(形成次数分布)→制作
统计表
4、变量数列:按数量标志分组所编制的分布数列,变量数列由各组变量值和各组的频数两
个要素构成。
I .按数量标志分组应注意的问题:
①分组时各组数量界限必须能反映事物质的差别。
②应根据被研究的现象总体的数量特征,采用适当的分组形式,确定相宜的组距、组限。
II .单项式分组与组距式分组
III .间断组距式分组和连续组距式分组
·间断组距式分组 例:地震等级5.0-5.9级,6.0-6.9级,7.0级以上
·连续组距式分组 例:分数60分以下,60-70分,70-80分,80-90分,90-100分 在连续组距式分组中,遵守“上限不在内”原则 ,例:将70分归入70-80分组内 IV .等距分组与异距分组
V .组距、组数、组限与组中值的计算
·组距:各组上下线间的距离
组距的经验公式:斯特杰斯经验公式
N 为总体单位数,R 为全距
一般首组的组下限必须≤实际变量的最小值,
末组的组上限必须≥实际变量的最大值
·组中值:上下限之间的中点数值
·开口组中上下限的确定:首组假定下限=首组上限-邻组组距
末组假定上限=末组下限+邻组组距
首组组中值=首组假定下限+上限2=上限−邻组组距2
1 3.322lg n N
=+max
min 1 3.322lg x x R d n N
-==+
末组组中值=末组假定上限+下限
2
=下限+
邻组组距
2
VI.组距变量数列的编制程序
原始数据序列化→计算组距→分组归类→确定组数、组距→确定组限→合计(形成
次数分布)→制作统计表
5.频数分布的类型
I.钟形分布
II.U型分布
III.J型分布
四、数据显示
1、统计表
·概念:广义的统计表包括统计工作各阶段中所用的一切表格
狭义的统计表专指分析表和容纳各种统计资料的表格,也就是通常所说的统计表·构成:统计表从形式上看,由总标题、横行标题、纵栏标题和指标数值4部分组成统计表从其内容看,由主词栏和宾词栏两部分组成
必要时可在统计表的下方加上表外附加,主要包括:补充资料、注解、资料来源、
填表单位、填表人以及填表日期等。
·分类:按其作用不同,可分为调查表、整理表或汇总表和分析表
按主词的分组情况不同,分为简单表、简单分组表和复合分组表
按宾词设计不同可分为宾词简单排列表、分组平行排列表和分组层叠排列表·设计:总的要求是:科学、实用、简练、美观。
设计应注意的事项:A.表的行列比例
B.线条的绘制
C.合计栏的设置
D.栏数的编号
内容设计应注意事项: 标题设计指标数值(数据太小用。。。表示)计量单位
表外附加
2、统计图