统计整理——精选推荐

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第三章
统计整

本章内容提要
第一节 统计整理的概念和程序
一、统计整理的概念
统计整理就是根据统计研究的目的和任务,将调查取得的大量原始资料进行科学的分类(或分组)、汇总,为统计分析提供条理化、系统化的综合统计资料的工作过程。

二、统计整理的程序
统计整理按以下程序进行:
(1)对调查资料的审核。

主要包括:准确性审核、完整性审核、及时性审核、适用性审核。

(2)统计分组。

(3)统计汇总。

(4)
编制统计表。

第二节 统计分组
一、统计分组的意义和作用
统计分组就是根据统计研究的目的和任务,按照选定的变异标志将总体划分为若干部分或组别,使组与组之间具有差异性,而同一组内的单位保持相对的同质性。

统计分组在统计研究中的作用主要体现在以下三方面:
(1)区分社会经济现象的类型。

(2)研究总体内部结构。

(3)研究现象之间的依存关系。

二、分组标志的选择
正确选择分组标志是统计分组的核心问题。

分组标志就是将总体划分为若干部分或组别的标准或根据。

正确选择分组标志必须遵循以下三个基本原则:
(1)根据统计研究的具体任务和目的,选择与研究现象联系最密切的标志作为分组标志。

(2)在对被研究现象进行理论分析的基础上,从中选择具有本质性的重要标志作为分组标志。

(3)结合现象所处的具体历史条件或社会经济发展条件选择分组标志。

三、统计分组的种类
(一)按分组标志的性质可分为品质标志分组和数量标志分组
品质标志分组就是根据统计研究的目的,选择反映事物性质属性差异的品质标志作为分组标志,在品质标志变异的范围内划定各组的界限,将总体区分为若干个性质不同的部分或组别。

数量标志分组就是根据统计研究的目的,选择反映事物数量差异的数量标志作为分组标志,在数量标志变异范围内划定各组的数量界限,将总体划分为性质不同的若干部分或组别。

(二)按分组标志的多少可分为简单分组和复合分组
简单分组就是对总体只按一个标志进行分组。

复合分组就是对同一总体采用两个或两个以上标志结合起来进行分组。

对同一总体选择多个标志分别进行简单分组,这几个简单分组就形成平行分组体系。

复合
分组已将多个标志结合起来分组,包括多层错综重叠的组别,因而形成复合分组体系。

第三节 分布数列
一、分布数列的概念和类型
在统计分组的基础上,将总体的所有单位按组归类整理,形成总体中各个单位在各组间的分布,这种表明总体单位数在各组分配情况的分组资料称为次数(或频数)分布,又称分布数列。

根据分组标志类型的不同,分布数列可分为品质分布数列和数量分布数列。

品质分布数列是按品质标志分组编制的分布数列,简称品质数列。

数量分布数列是按数量标志分组编制的分布数列,简称变量数列。

变量数列由两部分构成:一是由变量值所形成的各个组;二是总体单位在各组中出现的次
数。

次数有两种表现形式:一是频数,用f i表示;二是频率(或比率),用
f i
钞f表示。

变量数列按各组表现形式不同可分为单项变量数列和组距数列两种。

单项变量数列是指数列中每组的数值只用一个变量值表示,即一个变量值就代表一组。

组距数列是指数列中每一个组由两个变量值所确定的一个数值范围来表示。

在组距数列中涉及如下一些概念:组数、组限、闭口组和开口组、组距、组中值。

二、变量数列的编制
变量数列的编制步骤:
(1)将原始资料按其数值大小重新排列。

(2)确定变量数列的形式。

对于连续变量,只能编制组距数列;对于离散变量,如果变量值较少,而且变异幅度较小,可编制单项变量数列;如果变量值较多,而且变异幅度较大,应编制组距数列。

在变量值分布均匀的情况下,应采用等距式;如果是为了便于分组比较,便于计算总体平均数和绘制统计图,一般也采用等距式。

(3)确定组距和组数。

(4)确定组限。

(5)计算各组单位数,
编制变量数列。

第四节 分布数列的表示方法
分布数列的表示方法有表示法和图示法:
(1)表示法即用统计表格形式表述分布数列的内容,这种表格叫做次数分布表。

(2)图示法即利用几何图形描述分布数列。

常用的图示法有以下几种:直方图、折线图、累计次数折线图、曲线图。

直方图的画法是首先建立直角坐标系,横轴表示分组变量,纵轴表示频数或频率。

以各组组距为宽、各组的频数或频率为高绘制代表各组的直方块,便形成直方图。

折线图是在直方图的基础上,将每个直方块的顶端中点以直线相连。

累计次数折线图的画法是根据累计次数分布表绘制的。

较小制累计次数折线图,以第一组下限为起点,各组上限为横坐标,累计次数为纵坐标;较大制累计次数折线图,以最末组上限为起点,以各组下限为横坐标,累计次数为纵坐标,相邻点用直线相连,即绘制出累计次数折线图。

曲线图的画法是以折线图为近似,当变量数列的组数无限增多时,折线近似地表现为曲线,作为次数分布折线图的极限描述,这样的图形称为次数分布曲线图,又称平滑图。

各种不同性质的社会经济现象有其特殊的次数分布,从而决定了反映其分布特征的曲线形
态也有各种不同的类型,主要有:①钟形分布曲线;②U形分布曲线;③J
形分布曲线。

第五节 统计汇总
一、统计汇总的概念
统计汇总是在统计分组的基础上,根据汇总方案中确定的分组标志和分组数目,将总体各单位分别归纳到各组中,计算各组和总体的单位数和标志总量,使原始统计资料转化为综合统计资料。

二、统计汇总的组织形式
统计汇总的组织形式有:逐级汇总、集中汇总、综合汇总。

逐级汇总就是按照一定的统计管理体制,自下而上逐级汇总调查资料;集中汇总就是将全部调查资料集中到组织调查的最高一级机
关进行一次汇总,直接得出汇总的结果;综合汇总就是将逐级汇总和集中汇总结合起来形成的汇总形式,一方面对一些最基本的统计指标实行逐级汇总,另一方面对全部原始资料实行集中汇总。

三、统计汇总的技术方法
统计汇总技术主要有手工汇总和电子计算机汇总。

手工汇总是以手工操作的方式对统计资料进行汇总,目前仍是普遍采用的一种方式。

常用的手工汇总方法有划记法、过录法、折叠法和卡片法。

(1)划记法又叫点线法,就是用点、线等记号计算各组和总体的单位数,最常用的是画
“正”字。

(2)过录法就是将需要汇总的调查资料先过录到事先设计好的汇总表(工作表)中,然后计算加总出各组及总体的单位数和标志总量,再将计算结果填入正式的统计汇总表。

(3)折叠法就是将所有调查表或报表中需要汇总的项目和数值全部折在边上,并一张接一张地叠放在一起,然后直接汇总同一纵栏或同一横行中的数字。

(4)卡片法就是将调查资料先摘录在特制的卡片上
,一张卡片为一个调查单位,然后利用卡
片进行分组归类、汇总计算。

第六节 统计表
一、统计表的概念和结构
广义的统计表包括统计工作各个阶段中所用的一切表格,如调查表、汇总表或整理表等。

狭义的统计表,即将汇总结果按一定顺序排列在由横行、纵列交叉结合而成的表格中。

统计表的结构如下表所示:2010年我国国内生产总值
(总标题)
按产业分组
国内生产总值
绝对数(亿元)
比重(%)第一产业
第二产业
第三产业
4049718648117100510畅246畅843畅0合计397983100畅0
简单分组表是指表的主词按某一标志进行简单分组的统计表。

复合分组表是指表的主词按两个以上的标志进行复合分组的统计表。

三、统计表的设计
统计表的设计主要是指对宾词的设计,亦即根据分析研究的需要,对宾词指标进行分组整理,通常称为宾词指标的设计。

有两种设计方法:
(1)简单设计就是按不同的分组标志对宾词指标进行简单分组,然后将几个不同的分组在表中平行排列。

(2)复合设计就是将宾词指标按两个或两个以上的分组标志进行复合分组,作层叠的排列。

四、编制统计表的原则
在编制统计表时应注意:
(1)统计表的格式要规范、统一,即“上、下粗线,中间细线,两边开口”。

(2)统计表的各项标题应简明确切,并按合乎逻辑的顺序依次排列。

若栏数较多时,则要加以编号,说明其相互关系。

(3)统计表的内容应力求简明扼要,主题突出,避免繁杂。

(4)指标数值应根据社会经济现象性质的不同和数值的大小采用不同的计量单位。

(5)表中同一栏数字应对准位数,要有统一的精确度。

如果缺少某项数字时,用符号“…”表示;当不存在某项数字时,用符号“—”表示。

(6)统计表的资料来源以及需要附加的说明,可以列在表的下端,
以备查考。

本章习题
一、填空题
1.统计整理的中心内容是,统计分组的关键是。

2.统计整理包括、、和四个方面内容。

3.统计分组同时具有两层含义:一是将总体划分为性质的若干组;二是将性质的单位合并在一起。

4.在分布数列中,各组单位数与总体单位数的比称为,也可称为比重或百分比;而各组标志总量与总体总量的比只能称为比重或百分比,而不能称为。

5.变量的最大值与最小值的差额称为。

在组距数列中,各组上限与下限的差额称为。

6.对组距数列的频数或频率进行较小制累计时,各组累计频数或频率是各组的频数或频率累计为多少。

7.在组距数列中,用来代表各组内变量值的一般水平,它是假设各组中变量值是分布的。

8.变量可以作单项式或组距式分组,而变量只能作组距式分组,且其组限只能采用。

9.统计汇总技术主要有和两种形式。

10.统计分组体系有和两种。

11.统计表从内容上看包括和两部分。

12.统计表按主词是否分组和分组程度可分为、和三种。

二、是非题
1.统计整理就是对统计调查所取得的原始资料进行加工、整理,提供综合统计资料的工作过程。

( )
2.按一个标志进行的分组是简单分组,按多个标志进行的分组是复合分组。

( )3.连续型变量只能作组距式分组,但其组限可采用重叠组限和不重叠组限两种表示方法。

( )
4.按两个或两个以上的标志进行的分组称为复合分组。

( )
5.手工汇总中的折叠法简便易行,省时省力,但一旦出错需从头返工。

( )6.手工汇总中的点线法只能汇总单位数,不能汇总标志值。

( )
7.复合设计可深入说明总体的特征,但如果分组标志过多,会造成宾词指标的栏数成倍增加。

( )
8.统计表中如果不存在某项数字时,应用符号“…”表示。

( )
9.统计表中各项标题应按合乎逻辑的顺序排列,主词栏通常用甲、乙等文字编号,宾词栏用1、2、3等数字编号。

( )
10.综合汇总就是将逐项汇总和集中汇总结合起来进行的汇总组织形式。

( )
三、单项选择题
1.统计分组的依据是( )。

A.标志B.指标C.标志值D.变量值
2.按某一标志分组的结果表现为( )。

A.组内同质性,组间同质性B.组内同质性,组间差异性
C.组内差异性,组间同质性D.组内差异性,组间差异性
3.统计分组的关键在于( )。

A.正确选择分组标志B.正确划分各组界限
C.正确确定组数与组限D.正确选择分布数列种类
4.在全距一定的情况下,组距的大小与组数的多少成( )。

A.正比B.反比C.无比例关系D.有时成正比有时成反比5.组距数列中每组上限是指( )。

A.每组的最小值B.每组的最大值
C.每组的中点数值D.每组的起点数值
6.简单分组与复合分组的区别在于( )。

A.总体的复杂程度不同B.组数多少不同
C.选择分组标志的性质不同D.选择分组标志的数量不同
7.简单表与分组表的区别在于( )。

A.宾词是否分组B.主词是否分组
C.分组标志的多少D.分组标志是否重叠
8.统计表的横行标题表示各组的名称,一般应写在统计表的( )。

A.上方B.左方C.右方D.均可以9.填写统计表时,当发生某项不应有数字时,应用( )符号表示。

A.0B.—C.×D.…
10.不等距分组适用于( )。

A.变量变动比较均匀的情况B.变量变动不均匀的情况
C.按一定比率变动的变量D.一切变量
11.手工汇总中只能用来汇总总体单位数的方法是( )。

A.划记法B.过录法C.折叠法D.卡片法
四、多项选择题
1.下列分组中( )是按品质标志分组的。

A.职工按工龄分组 B.企业按所有制性质分组 C.教师按职称分组D.人口按地区分组E.人口按文化程度分组
2.下列分组中( )是按数量标志分组的
A.工厂按利润计划完成百分比分组
B.学生按健康状况分组
C.工厂按产量分组
D.职工按工龄分组
E.企业按隶属关系分组
3.在组距数列中,组距大小与( )。

A.单位数的多少成正比B.单位数的多少成反比C.单位数的多少无关系D.组数多少成正比E.组数多少成反比
4.在组距数列中影响各组次数分布的要素是( )。

A.总体单位数多少B.变量值大小C.组数D.组限E.组距
5.在组距数列中,组中值( )。

A.是上限与下限的中点数
B.在开口组中可参照相邻组来确定
C.在开口组中无法计算
D.是用来代表各组标志值的一般水平
E.就是组平均数
6.对调查资料进行审核的内容包括( )。

A.准确性B.及时性C.系统性D.完整性E.逻辑性
7.变量数列中( )。

A.各组频率大于0
B.各组频率大于1
C.各组频率之和等于1
D.总次数一定时频数与频率成正比
E.频数越大该组标志值起的作用越大
8.统计汇总的组织形式有( )。

A.逐级汇总B.集中汇总C.手工汇总D.综合汇总E.电子计算机汇总
9.统计表从内容上看,由( )组成。

A.总标题B.横行标题C.纵栏标题D.主词E.宾词
10.组距式分组仅适合于( )。

A.连续变量
B.离散变量
C.离散变量且变动幅度较大
D.离散变量且变动幅度较小
E.连续变量且变动幅度较大
五、简答题
1.什么是统计整理?统计整理有哪几个程序?
2.什么是统计分组?如何进行统计分组?
3.举例说明什么是简单表、分组表和复合表?
六、综合题
1.班组20名工人的资料见下表:
工人序号性 别年 龄文化程度技术等级1男20高中22女20高中23男22初中24男23初中25女24初中36男26初中37女26初中38女26初中49男28中专410男29中专411女29中专412男33初中513女34初中514男36高中515男36高中616男36高中617男41高中618女43高中719男48初中720女59高中7
要求:
(1)按性别、文化程度和技术等级分别编制分布数列。

(2)按组距20~30岁、30~40岁、40~50岁、50岁以上分组,编制组距数列。

2.某班组20名工人看管机器台数资料如下(单位:台):
2、5、4、2、4、3、4、4、2、2、4、3、4、5、3、4、4、2、4、3要求:试根据上述资料编制变量数列。

3.车间50名职工工资如下(单位:元):
1380、1390、1400、1410、1420、1460、1470、1910、1600、1960
1560、1560、1570、1570、1580、1430、1480、1690、1590、1590
1560、1550、1550、1530、1520、1520、1490、1600、1620、1620
1860、1790、1780、1680、1700、1720、1650、1630、1640、1630
1830、1810、1750、1680、1680、1750、1650、1660、1660、1880
要求:(1)按组距50元编制变量数列。

(2)按组距100元编制变量数列。

(3)比较上述哪种分组更为合适。

4.设某企业1月份工人的计件工资如下(单位:元):
498、465、481、459、557、422、486、520、605、502
504、491、505、534、425、464、554、640、501、647
500、533、482、547、535、490、541、487、469、436
472、517、496、497、500、465、515、544、450、507
502、401、453、619、507、464、433、573、492、598
466、529、528、423、522、505、552、444、476、511
根据上述资料编制:
(1)阵列。

(2)变量数列(组距为50元)。

(3)绘制直方图和折线图。

5.某工厂同工种的50名工人完成个人生产定额百分数(%)的资料如下:
83、88、123、110、118、158、121、146、137、120
163、125、136、127、142、118、123、126、138、151
101、86、82、113、142、108、101、105、125、116
132、138、117、103、114、131、108、87、119、127
105、115、126、125、110、107、141、135、117、93
要求:根据上述资料编制累计频数和累计频率数列。

6.设甲、乙两个企业某年年末有关资料如下:
按工龄分组
(年)甲 企 业乙 企 业
人数(人)男女人数(人)男女1以下0820400421200360841~53351841512371041335以上438298140063042021合计855522333420182238要求:设计一张主词按甲、乙企业分组,宾词作复合设计的统计表,表明甲、乙企业的职工总数和不同工龄中男、女人数。

相关文档
最新文档