最新三章节统计数据整理与显示
统计数据的整理与显示
合计
100
揭示社会经济现象的内部结构
年份
农副产品
农副产品加工品
工矿产品
合计
1950 1960 1970 1980 1985 1990 1995 1999
57.5 31.0 36.7 18.7 17.5 13.0 7.3 5.2
33.2 42.3 37.7 29.5 26.9 29.2 26.2 25.1
9.3 26.7 25.6 51.8 55.6 57.8 66.5 69.7
100 100 100 100 100 100 100 100
我国出口商品构成(%)
划分社会现象的依存关系
按商品销售额分组(万元)
商店数(个)
流通费用率(%)
统计整理的意义:是统计调查的继续,是统计分析的基础。
编制统计表和统计图
04
将分组资料进行汇总
03
选择整理的指标,并进行划类分组
02
对搜集到的资料进行全面的审核,确保符合研究目的要求和准确无误
01
统计整理的程序
完整性: 检查应调查的单位或个体是否有遗漏, 所有的调查项目或指标是否填写齐全 及时性:检查填报单位是否按时报送了有关
02
按分组标志的性质分为品质分组和数量分组
03
三、统计分组的种类
分组标志:是指将总体划分为性质不同的组的标准或依据。
分组标志选择的要求: 要符合统计研究的目的和要求 必须选择最主要的标志作为分组依据 要考虑社会经济现象所处的具体历史条件
四、分组标志的选择
组数:即将总体分为几组。
事物本身的属性特征
钟型分布:
U型分布:
第3章 统计数据的整理与显示.ppt
统计整理
将统计调查得到的原始资料进行 科学的分类和汇总,使之成为系 统化、条理化的综合资料,以反 映研究总体特征的过程。
地位
是统计调查的继续,统计分析的前 提和基础,起着承前启后的作用。
统计数据整理的一般程序 数据的预处理 数据的分组 数据的汇总
分布数列(频数分布)
(一)数据的预处理
1. 数据的审核
0~15 15~65 65以上
合计
1953年
36.3 59.3 4.4
100
1964年
40.7 55.7 3.6
100
1982年
33.6 61.5 4.9
100
1990年
27.5 66.7 5.8
100
2000年
22.9 70.1 7.0
100
(3)分析现象之间的依存关系
中国农民家庭按收入分组的恩格尔系数
▪ 检查数据中的错误
2. 数据的排序
▪ 升序和降序 ▪ 寻找数据的基本特征
3. 数据的筛选
▪ 找出符合条件的数据
数据的审核
1. 完整性与及时性审核
– 检查应调查的单位或个体是否有遗漏 – 所有的调查项目或指标是否填写齐全 – 检查填报单位是否按时报送了有关数据
2. 准确性审核
– 检查数据是否真实反映客观实际情况,内 容是否符合实际
– 检查数据是否有错误,计算是否正确等
• 审核数据准确性的常用方法
1. 逻辑检查
– 从定性角度,审核数据是否符合逻辑,内容是否 合理,各项目或数字之间有无相互矛盾的现象
– 主要用于对分类和顺序数据的审核
2. 计算检查
– 检查调查表中的各项数据在计算结果和计算方法 上有无错误
统计数据的整理和显示
在编制组距数列中,要按照以下程序进行:
第一,使原始数据序列化( 编制由小到大的 单项式数列) 第二,计算出组距、组数等 第三,分组归类形成变量数列
整第 理3 和章 显统 示计
数 据
a、使原始数据序列化
现有某车间50名工人日加工零件的资料如下: 117,108,110,112,137,122,131,118, 134,114,124,125,123,127,120,129, 117,126,123,128,139,122,133,119, 124,107,133,134,113,115,117,126, 127,120,139,130,122,123,123,128, 122,118,118,127,124,125,108,112, 118,121
整第 理3 和章 显统 示计
数 据
区分标示组限与真实组限:组间是连续还是间断
连续:真实组限,如60-70,70-80,80-90;间断 :标示组限,如1-2,3-5,6-8;转换为0.5-2.5, 2.5-5.5,5.5-8.5)
组限
上限(大) 下限(小)
标示上限 真实上限= 标示上限+0.5 标示下限
组距 组 全数 距 最大 组 值 最 数小值
整第 理3 和章 显统 示计
数 据
组数与组距成反比关系,组数越多,组距越小, 反之,组数越少,组距越大。
确定组数可参照美国统计学家sturges(斯特古斯) 经验公式:
组数=1+3.322lgN, N为总体单位数。 组数=1+3.322lg50=6.64≈7,当然,这只是一个 经验结果,到底分多少组还取决于现象本身。
整第 理3 和章 显统 示计
数 据
采用单项式变量分组形成如下分布数列
第三章 统计数据的整理与显示 《统计学原理》PPT课件
(二)异距数列的编制
对于异距分组,由于次数的多少还要受到组距不同 的影响,各组的频数可能会随着组距的扩大而增加,随 着组距的缩小而减少。为了消除异距分组所造成的这种 影响必须计算频数密度。 其公式如下:
频数密度 = 频数 / 组距 频率密度 = 频率 / 组距 标准组距次数 =频数密度× 标准组组距(最小组的组距)
组中值 上限 下限 2
开口组与闭口组: 开口组:缺少上限或下限的组。
如:60分以下;60—70 ;…80—90; 90分以上。 闭口组:上、下限都齐备的组。
如:70—80分; 500—600公斤; 90—100岁
开口组如何计算组中值:
缺少上限:1、计算假定上限: 假定上限=下限+相邻组的组距 如:假定上限=90+10=100(分);
一、统计数据整理的概念
统计数据整理,是指根据统计研究 的目的,将统计调查所得的原始数据进 行科学的分组和汇总,使之系统化、条 理化的工作过程。
二、统计数据整理的步骤
(一)设计和编制统计数据整理汇总方案。 (二)对调查的统计数据进行审核。 (三)统计数据的分组和汇总。 (四)将汇总整理的结果编制成统计表或
(2)异距分组:
各组的组距不完全相同。适用: a、标志值分布很不均匀 b、标志值相等的量具有不同意义 c、标志值按一定比例发展变化
组距分组的组限确定:
• 间断组距分组
如:儿童按年龄分组:未满周岁,1~2岁, 3~4岁,5~9岁,10~14岁。
• 连续组距分组
如:工厂按完成任务的程度分组:100%以 下,100%~110%,110%~120%,120%以 上。
1、正态分布的特征:
两头小,中间大。
即靠近中间的变量值 8
第3章 统计数据的整理与显示
第3章统计数据的整理与显示【学习目标】本章主要介绍了统计整理是统计调查的继续,又是统计分析的前提。
介绍了统计整理的概念和内容,统计分组的方法,分配数列的概念、种类以及编制分配数列的基本步骤。
统计资料汇总的组织形式和具体方法。
【基本要求】学习本章内容,要求学习者注意统计资料整个工作过程的有关问题,掌握统计资料整理的程序、步骤和方法,绘制统计图,编制统计表。
通过各种渠道将统计数据搜集上来之后,首先应对这些数据进行加工整理,使之系统化、条理化,以符合分析的需要。
通过整理可以大大简化数据,使我们更容易理解和分析。
数据整理通常包括数据的预处理、分类或分组、汇总等几个方面的内容,它是统计分析之前的必要步骤。
【学习内容】3.1 数据的预处理数据的预处理是数据整理的先前步骤,是在对数据分类或分组之前所做的必要处理,包括数据的审核、筛选、排序等。
3.1.1数据的审核与筛选在对统计数据进行整理时,首先要进行审核,以保证数据的质量,为进一步的整理与分析打下基础。
从不同渠道取得的统计数据,其审核内容和方法有所不同,不同类型的统计数据在审核内容和方法上也有所差异。
对于通过直接调查取得的原始数据,应主要从完整性和准确性两个方面去审核。
完整性审核主要是检查应调查的单位或个体是否有遗漏,所有的调查项目或指标是否填写齐全等。
准确性审核主要包括两个方面:一是检查数据资料是否真实地反映了客观实际情况,内容是否符合实际;二是检查数据是否有错误,计算是否正确等。
审核数据准确性的方法主要有逻辑检查和计算检查。
逻辑检查主要是从定性角度审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相互矛盾的现象。
比如中学文化程度的人所填的职业是大学教师,对于这种违背逻辑的项目应予以纠正。
逻辑检查主要用于对定类数据和定序数据的审核。
计算检查是检查调查表中的各项数据在计算结果和计算方法上有无错误。
比如各分项数字之和是否等于相应的合计数,各结构比例之和是否等于1或100%,出现在不同表格上的同一指标数值是否相同,等等。
powerpoint第三章统计数据的整理与显示
2019/9/13
1
学习重点与难点:
品质数据的整理 数据的分组 统计表的构成与设计 用Excel作频数分布表和形图
2019/9/13
2
第一节
2019/9/13
数据的预处理
一、数据的审核、筛选与 排序
1. 数据的审核
发现数据中的错误
2. 数据的筛选
找出符合条件的数 据 3. 数据排序
100
2019/9/13
32
等距分组表(上下组限间断)
表3-6 某车间50名工人日加工零件数分组表
按零件数分组
频数(人)
频率(%)
105~109
3
6
110~114
5
10
115~119
8
16
120~124
14
– 确定这些数据是否符合自己分析研究的 需要
2>时效性审核 – 应尽可能使用最新的统计数据
3>确认是否必要做进一步的加工整理
2019/9/13
6
2、数据的筛选
1>对审核过程中发现的错误应尽可能予以纠正 2>当发现数据中的错误不能予以纠正,或者有些
数据不符合调查的要求而又无法弥补时,需 要对数据进行筛选 3>数据筛选的内容包括:
117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121
第三章统计数据的整理与显示
3 -2
经济、管理类
基础课程
统计学
统计数据为什么要进行整理?
2、经过整理的结果能反映总体总体分布分 布的数量特征
3、整理结果可用于研究变量之间的关系
3 -3
经济、管理类 基础课程
统计学
某电信公司通信电路等级分布
管理等级 国际及港澳台电路 一级电路 二级电路 市、县内长途电路 本地电话电路
1.商品广告;2.服务广 告;3.金融广告;4.房地 产广告;5.招生招聘广告 ;6.其他广告。
表3-1 某城市居民关注广告类型的频数分布
广告类型 人数(人) 比例 频率(%)
商品广告
112 0.560 56.0
服务广告
51
0.255 25.5
金融广告
9
0.045 4.5
房地产广告
16
0.080
8.0
3 - 15
经济、管理类 基础课程
统计学
数据的审核、筛选与排序
1. 数据的审核
▪ 发现数据中的错误
2. 数据的筛选
▪ 处理数据中的错误
3. 数据排序
▪ 发现数据的基本特征 ▪ 升序和降序
3 - 16
经济、管理类 基础课程
统计学
数据的审核
(原始数据)
审核的内容 1. 完整性审核
检查应调查的单位或个体是否有遗漏 所有的调查项目或指标是否填写齐全
36-40岁 8.2%
41-50岁 7.6%
51-60岁 60岁以上
3.2%
1.1%
18岁以下 15.3%
31-35岁 12.1%
3 -7
25-30岁 16.3%
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四节 统计汇总
一、统计汇总:即在统计分组的基础上,将统计资料
归并到各组中去,并计算各组和总体的合计数(包 括单位总数和标志总量)的工作过程。
二、统计汇总的形式:
• 1、逐级汇总 • 2、集中汇总 • 3、汇审汇编 • 4、综合汇总
三、统计汇总的技术
• 1、手工汇总 • 2、电子计算机汇总
第五节 分布数列
• 分布数列——也称次数分布或次数分配,指反映 总体单位在各组分布状况的一系列数字。
• 分布数列组成要素: • 1、组的名称 • 2、各组次数(也称频数)或频率
分布数列的分类
按分组标志 品质数列
变量数列
分
布
钟形分布数列 正态分布
按商品销售额分组(万元) 商店数(个)
100以下
25
100500
70
500 1000
130
1000 3000
75
3000 5000
40
5000 10000
18
10000以上
10
流通费用率(%)
11.2 10.6 9.9 8.7 7.8 7.0 6.3
三、统计分组的种类
• 按分组的作用或目的不同分为:类型分组、 结构分组和分析分组
2.变量数列例:
按月工资收入分组 1000元以下 1000-1500 1500-2000 2000-2500 2500-3000 3000元以上 合计
人数(人) 80 150 230 340 150 50
1000
所占(%) 8 15 23 34 15 5 100
各组名称
次数(频数)
频率
按照分组形式不同分为单项式数列和组距式数列
数
偏态分布 左偏分布
列 按次数分布特征
右偏分布
U形分布数列
J形分布数列 J形
倒J形
按分组形式 单项式数列
组距式数列 等距数列
异距数列
•
按分组标志不同分为品质数列和变量数列
• 1.品质分布数列例:
按性别分组 男性 女性
合计
人数 600 400
1000
所占% 60 40
100
各组名称 次数(频数)
频率
小标志值(下限) 在等距分组的条件下,组数等于全距除以组距
2.组数、组距确定的斯特杰斯经验公式
n13.3lgN dRXmaxXmin
n 13.3lgN n:组数N, :总体单位 d:数 组, 距 R: ,全距 Xma: x 最大变量 Xm值 i: n,最小变量值
N 15-24 25-44 45-89 90-179 180-359 360-719
五、组数、组距、组限、组中值
• 组数:即将总体分为几组。 • 组数的确定分下面两种情况: (一)品质分组的组数
由两个因素决定: • 1、事物本身的属性特征 • 2、统计研究的要求
(二)数量分组的组数和组距
1.组数由两个因素决定:
• 总体的全距R
• 组距(class width)
全距R = 最大标志值-最小标志值 组距 = 各组最大标志值(上限)-各组最
n5
6
7
8
9
10
适用条件:
1.近似正态分布
2.现象特性适合等距分组
组限
组限:指每组两端数值。分为上限和下限。 上限:每组的终点数值(最大值)。 下限:每组的起点数值(最小值)。 组限的形式:与变量的特点有关,重合式和不重合式
1、重合式:
• 指相邻两组中,前一组的上限和后一组的下限数值重合。 • 一般用于连续型变量。 • 组距=上限-下限 • 例如:身高1.60m~1.70m、1.70~1.80m、 1.80~
1.90m……… • 所谓重合只是形式上相重,实际上两组没重合,一般采用“含下
2、不重合式
指前一组的上限与后一组的下限,两值紧密相连而不相重 复。
一般用于离散型变量。 组距=下组下限-本组下限=本组上限-前组上限 例:人口普查时,按照家庭人口数分组:1-2,3-4,5-6,
7和7以上
组 中值
• 组中值:各组上下限的中点值,代表组内各标志值的一般水平。 • 重合式组限时:
–组 距=上限-下限 –组中值=(上限+下限)÷2
=下限+组距/2=上限-组距/2 • 不重合式组限时:
–组 距=下组下限-本组下限=本组上限-前组上限 –组中值=(本组下限+下一组下限) ÷2
=本组下限+组距/2=下组下限-组距/2 • 组距式分组中:
• 按分组标志多少,分为:简单分组、复合分 组和并列分组。
• 按分组标志的性质分为品质分组和数量分组
四、分组标志的选择
1. 分组标志:是指将总体划分为性质不同 的组的标准或依据。
2. 分组标志选择的要求:
–要符合统计研究的目的和要求 –必须选择最主要的标志作为分组依据 –要考虑社会经济现象所处的具体历史条件
三章节统计数据整理与显 示
第一节 统计整理的意义和程序
一、统计整理的意义
二、统计整理的程序
统计整理是承 上启下的过程, 是统计调查的 继续也是统计 分析的基础。
二、统计分组的作用
• 划分社会经济现象的不同类型 • 揭示社会现象的内部结构 • 分析社会现象之间的依存关系
划分社会不同类型
按商品分类分组 食品类 衣着类 家庭设备用品类 文化娱乐用品类 交通通讯类 医疗保健类 居住类 杂项商品类 合计
构成(%) 40.6 4.7 7.5 11.6 10.8 4.7 14.4 5.7 100
揭示社会经济现象的内部结构
我国出口商品构成(%)
年份
1950 1960 1970 1980 1985 1990 1995 1999
(1)单项式数列:各组由一个具体的变量值 (单项)来表示的数列。
• 单项式分组一般适用于离散型变量且变量 变动范围不大的场合。
单项分组举例
编制条件:
变量是离散变量 变量的不同取值个数较少
【例】己知某车间有24名工人,他们的日产量(件) 分别是:20,23,20,24,23,21,22,25,26,20, 21,21,22,22,23,22,22,24,25,21,22,21, 24,23.要求根据以上资料编制变量数列。
农副产品 农副产品加工品 工矿产品
57.5
33.2
9.3
31.0
42.3
26.7
36.7
37.7
25.6
18.7
29.5
51.8
17.5
26.9
55.6
13.0
29.2
57.8
7.3
26.2
66.5
5.2
25.1
69.7
合计
100 100 100 100 100 100 100 100
划分社会现象的依存关系