第3章 统计数据的整理与显示

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

通过累计频数分配数列可以反映累计到某一组出现的总次数 或总频率。 序 号 1 2 3 4 5 6 7 8 计划完成 工人数 比重 程度(%) (人) (%) 60 — 70 2 1.0 70 — 80 5 2.5 80 — 90 14 7.0 90 —100 31 15.5 100—110 65 32.5 110—120 52 26.0 120—130 23 11.5 130—140 8 4.0 合 计 200 100 向上累计 人数 比重 2 1.0 7 3.5 21 10.5 52 26.0 117 58.5 169 84.5 192 96.0 200 100 向下累计 人数 比重 200 100 198 99.0 193 96.5 179 89.5 148 74.0 83 41.5 31 15.5 8 4.0
三、统计分组的种类
• 按分组的作用或目的不同分为:类型分组、 结构分组和分析分组 • 按分组标志多少,分为:简单分组、复合分 组和并列分组。 • 按分组标志的性质分为品质分组和数量分组
四、分组标志的选择
1. 分组标志:是指将总体划分为性质不同 的组的标准或依据。 2. 分组标志选择的要求:
–要符合统计研究的目的和要求 –必须选择最主要的标志作为分组依据 –要考虑社会经济现象所处的具体历史条件
按次数分布特征
U形分布数列 J形分布数列 按分组形式 单项式数列 组距式数列

按分组标志不同分为品质数列和变量数列 • 1.品质分布数列例:
按性别分组 男性 女性 合计 人数 600 400 1000 所占% 60 40 100
各组名称
次数(频数)
频率
2.变量数列例:
按月工资收入分组 1000元以下 1000-1500 1500-2000 2000-2500 2500-3000 3000元以上 合计 各组名称 人数(人) 80 150 230 340 150 50 1000 所占(%) 8 15 23 34 15 5 100
2、不重合式



指前一组的上限与后一组的下限,两值紧密相连而不相重 复。 一般用于离散型变量。 组距=下组下限-本组下限=本组上限-前组上限 例:人口普查时,按照家庭人口数分组:1-2,3-4,5-6, 7和7以上
组 中 值
• 组中值:各组上下限的中点值,代表组内各标志值的一般水平。 • 重合式组限时: –组 距=上限-下限 –组中值=(上限+下限)÷2 =下限+组距/2=上限-组距/2 • 不重合式组限时: –组 距=下组下限-本组下限=本组上限-前组上限 –组中值=(本组下限+下一组下限) ÷2 =本组下限+组距/2=下组下限-组距/2 • 组距式分组中: –第一组开口(多少以下),组中值=上限-相邻组组距/2 –最后一组开口(多少以上),组中值=下限+相邻组组距/2
第四节
统计汇总
一、统计汇总:即在统计分组的基础上,将统计资料
归并到各组中去,并计算各组和总体的合计数(包 括单位总数和标志总量)的工作过程。
二、统计汇总的形式:
• • • • 1、逐级汇总 2、集中汇总 3、汇审汇编 4、综合汇总
三、统计汇总的技术
• 1、手工汇总 • 2、电子计算机汇总
第五节
分布数列
次数(频数)
频率
按照分组形式不同分为单项式数列和组距式数列
(1)单项式数列:各组由一个具体的变量值 (单项)来表示的数列。 • 单项式分组一般适用于离散型变量且变量 变动范围不大的场合。
单项分组举例
编制条件:
变量是离散变量 变量的不同取值个数较少
【例】己知某车间有24名工人,他们的日产量(件) 分别是:20,23,20,24,23,21,22,25,26,20, 21,21,22,22,23,22,22,24,25,21,22,21, 24,23.要求根据以上资料编制变量数列。
准确的资料是 进行正确统计 分析的关键。
(一)审查资料的完整性 和及时性
• 完整性: 检查应调查的 单位或个体是否有遗漏, 所有的调查项目或指标 是否填写齐全 及时性:检查填报单位 是否按时报送了有关

(三).历史资料的审核
• 应审查资料的可靠性程度 ,指标含义,所属时间,计算方法 等,对不能满足现在要求,有缺漏或有疑问的资料,要进 行有科学依据的推算,弥补和订正。
划分社会现象的依存关系
按商品销售额分组(万元) 100以下 100500 500 1000 1000 3000 3000 5000 5000 10000 10000以上
商店数(个) 25 70 130 75 40 18 10
流通费用率(%) 11.2 10.6 9.9 8.7 7.8 7.0 6.3
编制结果如下:
日产量(件)X
20 21 22 23 24 25 26 合计
工人数(人) f 3 5 6 4 3 2 1 24
(2)组距式分组:组距式分组是以变量值变动的一 定范围(区间)作为一组,区间的距离就是组距。 这样的分组所形成的变量分配数列叫组距式变量数 列,简称组距数列。 每一组变量值中,其最小值称为下限,最大值称为 上限。对于连续型变量或者变动范围较大的离散型 变量,适宜采用组距式分组。 – 等距数列 – 不等距数列
• 统计表是集中而有序地 表现统计资料的表格。 • 统计表的结构 • 1.从形式(组成因素): 横行、纵栏、标题、标 目、数字资料 • 2.从内容:主词、宾词 • 统计表的种类 • 1.按用途分:①调查表 ②汇总表③分析表 • 2.按主词的分组情况分 ①简单表②分组表③复 合表
• 分布数列——也称次数分布或次数分配,指反映 总体单位在各组分布状况的一系列数字。
• 分布数列组成要素:
• 1、组的名称 • 2、各组次数(也称频数)或频率
分布数列的分类
按分组标志 分 布 数 列 品质数列 变量数列 钟形分布数列 正态分布 偏态分布 左偏分布 右偏分布 J形 倒J形 等距数列 异距数列
五、组数、组距、组限、组中值
• 组数:即将总体分为几组。 • 组数的确定分下面两种情况: (一)品质分组的组数 由两个因素决定: • 1、事物本身的属性特征 • 2、统计研究的任务要求
(二)数量分组的组数和组距
1.组数由两个因素决定:
• 总体的全距R • 组距(class width)
全距R = 最大标志值-最小标志值 组距 = 各组最大标志值(上限)-各组最 小标志值(下限) 在等距分组的条件下,组数等于全距除以组距
一、统计分组的含义
• 统计分组:指根据社会经济现象的特点和统
计研究的任务,按某个标志(或几个标志)把 总体分成若干部分的科学分类。没有统计分组 就没有科学的统计
• 统计分组的关键:
1、选择分组标志:使组间差异大,组内差异小 2、划分各组界限。
二、统计分组的作用
• 划分社会经济现象的不同类型 • 揭示社会现象的内部结构 • 分析社会现象之间的依存关系
按次数分布不同分为钟型分布数列 U型分布数列、J型分布数列
钟型分布:
特征是“两头小,中间大”,即靠近中间的 变量值分布的次数多,靠近两端的变量值分 布的次数少,其形状宛如一口古钟。 特征是靠近中间的变量值分布的次数少, 靠近两端的变量值分布的次数多,其形状 宛如英文字母U。如:人口死亡率。 特征是次数随着变量值的增大而增多或随变 量值的增大而减少,其形状宛如英文大写字 母J
U型分布:
J型分布:
简单次数分布数列的编制
1、品质分布数列的编制:
方法:只需将品质标志的表现一一排列出来,然后汇总 出每一种标志表现出现的次数即可。如下例:
经济类型 国有企业 股份制企业 合资企业 独资企业 合 计 企业数(个) 100 80 50 20 250 比重(%) 40 32 20 8 100
2.组数、组距确定的斯特杰斯经验公式
n 1 3.3 lg N R X max X min d n 1 3.3 lg N n : 组数,N:总体单位数,d:组距,R:全距 X max :最大变量值,X min :最小变量值
N n
15-24 5
25-44 6
45-89 7
90-179 8
第五步:汇总出各组的单位数(注意:离散型变量各组单位 数的汇总方法),计算频率,并编制统计表。
简单次数分布图的编制
1、单项式数列次数分布图 以变量为横轴,以次数为纵轴,绘制曲线图。 2、组距式数列次数分布图 (1)等距数列 (2)不等距数列(换算成标准组距次数)
累计次数分布
• 累计次数分布表的编制 • 1、以下累计:即从低组到高组累计,表示该组上限 以下的次数(频率)有多少。(向上累计) • 2、以上累计:即从高组到低组累计,表示该组下限 以上的次数(频率)有多少。(向下累计) • 累计次数分布图的编制 • 编制方法:以变量为横轴,累计次数和累计频率 为纵轴,绘制累计次数分布表。
第六节
统计资料的显示
• • • • • • • 宾词指标设计 1.平行设计;2.层叠设计 制表规则 1.标题醒目准确 2.内容简明扼要 3.项目排列有序 4.字迹清楚规范(数字按个位 数上下对齐,无数填—号,缺报 填…号) • 5.各栏应加编号 • 6.规格合乎要求(上下粗线, 左右开口,栏间划线,行间空 白)
180-359 9
360-719 10
适用条件:
1.近似正态分布 2.现象特性适合等距分组


组限:指每组两端数值。分为上限和下限。 上限:每组的终点数值(最大值)。 下限:每组的起点数值(最小值)。 组限的形式:与变量的特点有关,重合式和不重合式
1、重合式:
• • • • • 指相邻两组中,前一组的上限和后一组的下限数值重合。 一般用于连续型变量。 组距=上限-下限 例如:身高1.60m~1.70m、1.70~1.80m、 1.80~1.90m……… 所谓重合只是形式上相重,实际上两组没重合,一般采用“含下 限不含上限”原则处理
统计整理最后的 结果就是形成各 种统计表格和统 计图。
统计整理的程序
对搜集到的资料进行全面的审核,确保符合研究 目的要求和准确无误 选择整理的指标,并进行划类分组 将分组资料进行汇总 编制统计表和统计图

第二节
统计资料的审核
(二)审查资料的正确 性
• 数据是否真实反映 客观实际情况 • 内容是否符合实际 • 数据是否有错误 • 计算是否正确等
(四)资料审核后的订正
• • • •
对可以肯定的一般错误,代为更正,并通知原报单位。 对可疑数据或无法代为更正的错误,要求原单位复查更正 如果所发现错误在其他上报单位也可能发生时,应通知其 他单位。 对严重错误,应发还重填,并查明错误原因。
第三节
统计分组
• • • • •
一、统计分组的含义 二、统计分组的作用 三、统计分组的种类 四、分组标志的选择 五、组数、组距、组限、组中值
2、变量分布数列的编制: 步骤为:
第一步:将原始资料按数值大小依次排列。
第二步:确定变量的类型和分组方法(单变量分组或组距分组)。
第三步:确定组数和组距。当组数确定后,组距可计算得到: 组距=全距/组数 全距=最大变量值—最小变量值。 第四步:确定组限。(第一组的下限要小于或等于最小变量值, 最后一组的上限要大于最大变量值。)
第三章
统计数据的整理与显示
第一节 统计整理的意义和Baidu Nhomakorabea序
一、统计整理的意义 二、统计整理的程序
统计整理是承 上启下的过程, 是统计调查的 继续也是统计 分析的基础。
统计整理:根据统计研究的目的,对调查 所得原始材料进行科学分组与汇总和对以 往的材料进行再加工。
统计整理的意义:是统计调查的继续, 是统计分析的基础。
划分社会不同类型
按商品分类分组 食品类 衣着类 家庭设备用品类 文化娱乐用品类 交通通讯类 医疗保健类 居住类 杂项商品类 合计 构成(%) 40.6 4.7 7.5 11.6 10.8 4.7 14.4 5.7 100
揭示社会经济现象的内部结构
我国出口商品构成(%)
年份 1950 1960 1970 1980 1985 1990 2000 2008 农副产品 57.5 31.0 36.7 18.7 17.5 13.0 4.9 2.3 农副产品加工品 33.2 42.3 37.7 29.5 26.9 29.2 19.2 19.3 工矿产品 9.3 26.7 25.6 51.8 55.6 57.8 75.9 78.4 合计 100 100 100 100 100 100 100 100
相关文档
最新文档