统计学课件讲义 第4章 统计数据的整理与显示

合集下载

统计数据的整理和显示(老教材)

统计数据的整理和显示(老教材)
环形图
与饼图类似,但中心部分被挖空,形成一个环形。环形图可以同时展示多个分类 数据的占比和分布情况,适用于需要比较多组数据的情况。通过不同颜色或图案 的环形区域,可以清晰地看出各组数据的相对大小和比例关系。
04
数值型数据整理与显示
集中趋势度量
算术平均数
所有数据之和除以数据个 数,反映数据集中趋势。
统计数据的整理和显 示老教材
目录
• 统计数据整理概述 • 数据预处理 • 统计图表显示方法 • 数值型数据整理与显示 • 分类数据整理与显示 • 时间序列数据整理与显示
01
统计数据整理概述
定义与目的
定义
统计数据整理是根据统计研究的任务与要求,对统计调查所搜集到的大量原始资料进行分组、汇总,使其条理化、 系统化,得出能够反映总体综合特征的统计资料的工作过程。
中位数
将数据按大小排列后,位 于中间位置的数,反映数 据中等水平。
众数
数据中出现次数最多的数, 反映数据集中情况。
离散程度度量
极差
最大值与最小值之差,反映数据 波动范围。
方差与标准差
衡量数据离散程度的常用指标, 方差是各数据与均值之差的平方 和的平均数,标准差是方差的平
方根。
四分位数间距
上四分位数与下四分位数之差, 反映中间50%数据的离散程度。
适用于分析两个或多个分类变 量之间的关系,如市场调查、 医学研究等领域。
06
时间序列数据整理与显示
时间序列构成要素
时间要素
反映时间变化的基本单位,如年、季、月、日等。
数据要素
与时间要素相对应的数据值,可以是数量、质量、 价格等。
频率要素
时间序列中数据观测或记录的次数,如年度数据、 季度数据、月度数据等。

统计数据的整理和显示

统计数据的整理和显示
数 据
在编制组距数列中,要按照以下程序进行:
第一,使原始数据序列化( 编制由小到大的 单项式数列) 第二,计算出组距、组数等 第三,分组归类形成变量数列
整第 理3 和章 显统 示计
数 据
a、使原始数据序列化
现有某车间50名工人日加工零件的资料如下: 117,108,110,112,137,122,131,118, 134,114,124,125,123,127,120,129, 117,126,123,128,139,122,133,119, 124,107,133,134,113,115,117,126, 127,120,139,130,122,123,123,128, 122,118,118,127,124,125,108,112, 118,121
整第 理3 和章 显统 示计
数 据
区分标示组限与真实组限:组间是连续还是间断
连续:真实组限,如60-70,70-80,80-90;间断 :标示组限,如1-2,3-5,6-8;转换为0.5-2.5, 2.5-5.5,5.5-8.5)
组限
上限(大) 下限(小)
标示上限 真实上限= 标示上限+0.5 标示下限
组距 组 全数 距 最大 组 值 最 数小值
整第 理3 和章 显统 示计
数 据
组数与组距成反比关系,组数越多,组距越小, 反之,组数越少,组距越大。
确定组数可参照美国统计学家sturges(斯特古斯) 经验公式:
组数=1+3.322lgN, N为总体单位数。 组数=1+3.322lg50=6.64≈7,当然,这只是一个 经验结果,到底分多少组还取决于现象本身。
整第 理3 和章 显统 示计
数 据
采用单项式变量分组形成如下分布数列

第四章 统计整理 《应用统计学——以Excel为分析工具》PPT课件

第四章  统计整理  《应用统计学——以Excel为分析工具》PPT课件
• (1) 递增排序:设一组数据为x1,x2,… ,xn,递增排序后可表示为: x(1)<x(2)<…<x(n)。
• (2)递减排序:可表示为: x(1)>x(2)>…>x(n)。
• 无论是定性数据还是定量数据,其排序均 可借助EXCEL完成。下面通过实例说明 EXCEL2007中进行数据排序的操作。
• 编制好的统计台账和加工整理后的统计资料,必须 妥善保管,不得损坏和遗失。
• 以上五个方面是相互衔接的,其中,统计分组是统 计整理的基础,统计汇总是统计整理的中心内容, 统计表和统计图是统计整理结果的表现形式。
第二节 统计调查资料的预处理
• 统 计 调 查 资 料 的 预 处 理 (Statistical data pretreatment) 是 数 据 分 组 整 理 的 先 前 步 骤 ,内容包括调查数据的审核与插补、筛选 (第三章已经介绍)、排序、分类汇总等 过程
一、统计分组的含义
• 统计分组是根据统计研究的目的和任务要 求,按照统计分组标志将总体划分成性质 不同的若干个部分或组别,使组和组之间 具有差异性,而同一组内具有同质性。
二、统计分组的作用
• 1、区分事物的性质 • 如企业按照经济性质分组,分为国有经济、集体
经济、私营经济、个体经济、外商投资经济、港 澳台经济。 • 2、研究事物内部结构 • 如将国民生产总值按照三次产业划分,计算出各 个产业所占比重,以便研究内部结构是否合理。 • 3、研究现象之间的关系 • 在统计分作的基础上,研究现象和现象之间的相 互依存关系。如施肥量和亩产量之间的关系;商 业企业规模和商品流通费用率之间的关系等。
三、统计调查资料的分类汇总
• 在对数据进行预处理时,有时需要对某些 字段按条件进行汇总,称为数据的分类汇 总。如果只是针对一个字段进行分类汇总 ,称为单字段分类汇总;如果同时对两个 及两个以上字段进行分类汇总称为多字段 分类汇总。

统计学4章ppt课件

统计学4章ppt课件
统计学
第四章 综合指标
(描述统计)
统计学
第一节 总量(Amounts)指标的度量
一、总量指标的意义
1. 总量指标的含义: 总量指标又称统计绝对数,它是反映
社会经济现象发展的总规模、总水平 和工作总量的综合指标。 总量指标的数值大小与统计范围的大 小成正比。 是最基本的统计指标。
2019/11/6
第四章 总量指标
31
统计学
注意点:
式中字母下标1表示报告期;下标 n 表示计划期。 该公式的分子与分母不能对换,且是同类指标,
其涵义、口径、计算方法应完全一致。 实际完成数与发展速度的报告期水平是同义的。 与发展速度相比是有区别的。 实际完成数和计划数可以采用绝对数,也可以采
用相对数和平均数。
第四章 总量指标
24
4.强度相对指标
不一定是同 一总体的
统计学
强度相对指标是两个性质不同但有一定联
系的总量指标对比计算的相对数,用来表
明一种现象在另一种现象中的发展强度、
密度和普遍程度。 计算公式:
注意与平均 数的区别
某一总量指标 强度相对指标=
另一不同类的但有联系的总量指标
2019/11/6
则:计划完成程度=(100%+16%) ÷(100%+10%) =105.5%
2019/11/6
第四章 总量指标
36
统计学
3、计划任务采用平均数形式表现
计算公式:
实际达到的平均水平 计划完成程度相对数=
5 000 1 250 1 340 1 280
102.4
52.4
4 000 1 000 1 030 1 215
121.5

统计学课件讲义 第4章 统计数据的整理与显示

统计学课件讲义 第4章    统计数据的整理与显示

第4章统计数据的整理与显示一、统计数据整理1、概念:统计整理,就是指根据统计研究目的,将统计调查所得的原始资料进行科学的分类汇总,或对已经加工的次级资料进行再加工,为统计分析准备系统化、条理化的综合资料的工作过程。

2、作用:它是从对现象的感性认识过渡到理性认识的开始,是这个过程的连续点,并为这个过程提供坚实的基础。

在统计工作中起着承前启后的作用3、整理汇总必须遵守的原则:在对所研究的社会经济现象进行深刻分析的基础上,抓住最基本、最能说明问题本质特征的统计分组和统计指标对统计数据加工整理。

4、数据整理的程序:设计和编制统计资料的整理方案→对调查获得的资料进行审核{对原始资料进行审核对二手数据进行审核数据筛选→按照一定的组织方式和方法,对原始资料进行分组、编码、汇总和计算→对整理好的统计资料再次进行审核,改正在汇总过程中产生的各种差错→将汇总整理的结果编制成统计表或绘制统计图,简明扼要地表明现象的数量特征→积累、公布和管理统计数据注:对原始资料的审核包括准确性审核、及时性审核和完整性审核对二手数据的审核包括完整性审核、准确性审核、重审数据的适用性和时效性5、统计汇总是整理的核心其组织形式基本有3种:集中汇总、逐级汇总和综合汇总,统计汇总的技术主要有手工汇总和电子计算机数据处理2种。

二、统计分组1、概念:统计分组是指根据事物内在的特点和统计研究的需要,将统计总体按照一定的标志区分为若干组成部分的一种统计方法。

2、原则:组内同质,组间差异原则、穷尽原则、互斥原则3、作用:I.可以区分现象质的差别II.可以分析总体内部结构和总体结构特征III.可以揭示现象之间的依存关系4、种类:按分组标志的多少,统计分组可分为简单分组和复合分组按分组的标志性质不同,统计分组可分为品质分组(属性分组)和数量分组(变量分组)。

品质分组:就是按品质标志进行分组。

一般地,对于类别数据,采用品质分组。

数量分组:就是按数量标志分组。

第四章--统计整理PPT教学课件

第四章--统计整理PPT教学课件

总,再加工、再汇总,使其条理化、系统化的工作过程。
例如:过调查取得100个商业企业 某月销售通额资料(单位:万元)20,60, 45,90,105,56,250,89,130,30,98, … 300.将这些数据资料按“销售额”的 多少进行整理,得到下列整理结果
借助统计方法,可进行统计分析,以 掌握202这0/121/1200个商业企业的经营状况.
变量 分组 方法
单项式 以一个变量值为一组或以变量的一个值为 分 组 一组.适用于离散性变量,且变量值的个数少
以变量变动的一个区间或以变量的一定变 组距式 动范围为一组,区间或范围的 距离称为组距. 分 组 适用于连续型变量和离散型变量的变量值较
多的情况
无论是品质分组,还是变量分组,都会遇到相同的问
值分布的次数少,其形状宛如一口古钟。
特征是靠近中间的变量值分布的次数少 U型分布 靠近两端的变量值分布的次数多,其形状
宛如英文字母U
J型分布
特征是次数随着变量值的增大而增多或 随变量值的增大而减少,其形状宛如英文 大写字母J
洛20伦20/茨12/1分2 布 专门用以测定社会收入分配的平等程度11
变量分配数列
组距分配数列
2020/12/12
等距数列
不等距数列
9
第四章 统计整理 累计频数或频率分配数列的编制方法
序 计划完成 工人数 比重 向上累计 向下累计 号 程度(%(人) (%) 人数 比重 人数 比重 1 60 — 70 2 1.0 2 1.0 200 100 2 70 — 80 5 2.5 7 3.5 198 99.0 3 80 — 90 14 7.0 21 10.5 193 96.5 4 90 —100 31 15.5 52 26.0 179 89.5 5 100—110 65 32.5 117 58.5 148 74.0 6 110—120 52 26.0 169 84.5 83 41.5 7 120—130 23 11.5 192 96.0 31 15.5 8 130—140 8 4.0 200 100.0 8 4.0

第4章 统计数据的整理和显示 65页PPT文档

第4章 统计数据的整理和显示 65页PPT文档

117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121
定类数据的图示—圆形图
(圆形图的制作)
1. 也称饼图,是用圆形及园内扇形的面积来表示数值大小 的图形
2. 主要用于表示总体中各组成部分所占的比例,对于研究 结构性问题十分有用
3. 在绘制圆形图时,总体中各部分所占的百分比用园内的 各个扇形面积表示,这些扇形的中心角度,是按各部分 百分比占3600的相应比例确定的
定类数据整理—频数分布表 (实例)
【 例 4.1】 为 研 究广告市场 的状况,一家广告公司在某 城 市 随 机 抽 取 200 人 就 广 告 问题做了邮寄问卷调查,其 中的一个问题是“您比较关 心下列哪一类广告?”
1.商品广告;2.服务广 告;3.金融广告;4.房地 产广告;5.招生招聘广告 ;6.其他广告。
(由 Excel 绘制的累计频数分布图)
400 累 积 300 户 数 200
(户1)00
400 累
225 270 300
积 300 户 300
数 200
276 168
132
(户) 100
75
0 24
0
30
非常 不满意 一般 满意 非常
非常 不满意 一般 满意 非常
不满意 (a)向下累积
满意
不满意 (b)向上累积

统计数据的整理及其显示(ppt-107页)(共106张PPT)全篇

统计数据的整理及其显示(ppt-107页)(共106张PPT)全篇
2、统计分组的原则
穷尽原则
互斥原则
注意:统计分组是对总体认识深化的手段,它是一切统计研究的基 础,应用于统计工作的全过程,是统计研究的基本方法。
⑴ 类型分组
揭露社会经济现象的类型,反映各类型的特点。

单位:亿元
类 型 1999年 2000年 2001年 2002年
农业 14 106.2 13 873.6 14 462.8 14 931.5
审核
对第二手数据: 完整性: 准确性: 适用性:数据的来源、口径以及
有关背景资料; 时效性:尽可能使用最新的数据。
(2)数据筛选
当数据中的错误不能予以纠正,或者有些数据不符合 调查的要求而又无法弥补时,需要对数据进行筛选。
数据筛选的内容:
▪ 将某些不符合要求的数据或有明显错误的数
据予以剔除;
例如:企业按人数分组
499及以下
500 ~ 999
1000 ~ 2999 3000及以上
工人按工资分组
600 ~ 700 700 ~ 800 800 ~ 1200
1200 ~ 1500
适用条件: 它适用于变量值变化范围较大、不同变量值个数
较多的离散型变量及连续型变量的场合。
注意:连续型变量的数值不能一一列举,故
例如:按以五分制计分的成绩对全班100名学生进行分组,宜单 变量数列;按以百分制计分的成绩对全班100名学生进行分组 ,宜组距式数列;
1. 定类数据的排序
▪ 字母型数据,排序有升序降序之分,但习惯
上用升序
▪ 汉字型数据,可按汉字的首位拼音字母排列
,也可按笔画排序,其中也有笔画多少的升 序降序之分
2. 定距和定比数据的排序
递递增增排排序序:后设可一表组示数为据:为X(1X)1<,X(X2)2<,……<X,(NX) N, 递减排序可表示为:X(1)>X(2)>…>X(N)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第4章统计数据的整理与显示
一、统计数据整理
1、概念:统计整理,就是指根据统计研究目的,将统计调查所得的原始资料进行科学的分
类汇总,或对已经加工的次级资料进行再加工,为统计分析准备系统化、条理化
的综合资料的工作过程。

2、作用:它是从对现象的感性认识过渡到理性认识的开始,是这个过程的连续点,并为这
个过程提供坚实的基础。

在统计工作中起着承前启后的作用
3、整理汇总必须遵守的原则:在对所研究的社会经济现象进行深刻分析的基础上,抓住最
基本、最能说明问题本质特征的统计分组和统计指标对统计
数据加工整理。

4、数据整理的程序:
设计和编制统计资料的整理方案→对调查获得的资料进行审核{对原始资料进行审核对二手数据进行审核
数据筛选
→按照一定的组织方式和方法,对原始资料进行分组、编码、汇总和计算→对整理好的统计资料再次进行审核,改正在汇总过程中产生的各种差错→将汇总整理的结果编制成统计表或绘制统计图,简明扼要地表明现象的数量特征→积累、公布和管理统计数据
注:对原始资料的审核包括准确性审核、及时性审核和完整性审核
对二手数据的审核包括完整性审核、准确性审核、重审数据的适用性和时效性
5、统计汇总是整理的核心其组织形式基本有3种:集中汇总、逐级汇总和综合汇总,统计汇总的技术主要有手工汇总和电子计算机数据处理2种。

二、统计分组
1、概念:统计分组是指根据事物内在的特点和统计研究的需要,将统计总体按照一定的标
志区分为若干组成部分的一种统计方法。

2、原则:组内同质,组间差异原则、穷尽原则、互斥原则
3、作用:I.可以区分现象质的差别
II.可以分析总体内部结构和总体结构特征
III.可以揭示现象之间的依存关系
4、种类:
按分组标志的多少,统计分组可分为简单分组和复合分组
按分组的标志性质不同,统计分组可分为品质分组(属性分组)和数量分组(变量分组)。

品质分组:就是按品质标志进行分组。

一般地,对于类别数据,采用品质分组。

数量分组:就是按数量标志分组。

数量标志的变异性体现在它不断变动自身的数量上,故也称为变量分组。

品质分组所形成的数列成为品质数列,数量分组所形成的数列称为变量数列。

按分组的作用和任务不同,统计分组可分为类型分组、结构分组和分析分组
5、分组标志的选择:统计分组中关键的问题在于选择分组标志和各组界限的划分,而选择分组标志则是统计分组的核心问题。

I.根据统计研究的目的与任务选择分组标志
II.在若干个标志中,要抓住具有本质性的或主要的标志作为分组的依据
III.根据现象所处的历史条件或经济条件来选择标志
6、统计分组的方法 :品质分组的方法 、数量分组的方法
7、统计分组体系:平行分组体系 、复合分组体系
8、对分组资料的再分组:按原来的分组标志重划新组,并将原分组资料根据新组组限的比例重新加以整理划定新组,并确定新组的单位数在总体中所占的比重,然后据以将原分组资料按比例重新加以整理
三、频数分布
1、概念:在统计分组的基础上,将总体中所有单位按组归类整理,形成总体中各个单位数在各组间的分配,叫做频数分布。

2、分布数列:将各组别与频数按一定的次序排列所形成的数列称作频数分布数列,简称分
布数列。

分布数列也是分组,是一种特殊形式的分组。

(原因P84)
分布数列分为品质分布数列和变量分布数列
3、品质数列:按品质标志分组所编制的分布数列叫品质分布数列或属性分布数列,品质数
列由组的名称和各组的频数两个要素构成。

品质数列的编制程序:原始数据→分组归类→合计(形成次数分布)→制作
统计表
4、变量数列:按数量标志分组所编制的分布数列,变量数列由各组变量值和各组的频数两
个要素构成。

I .按数量标志分组应注意的问题:
①分组时各组数量界限必须能反映事物质的差别。

②应根据被研究的现象总体的数量特征,采用适当的分组形式,确定相宜的组距、组限。

II .单项式分组与组距式分组
III .间断组距式分组和连续组距式分组
·间断组距式分组 例:地震等级5.0-5.9级,6.0-6.9级,7.0级以上
·连续组距式分组 例:分数60分以下,60-70分,70-80分,80-90分,90-100分 在连续组距式分组中,遵守“上限不在内”原则 ,例:将70分归入70-80分组内 IV .等距分组与异距分组
V .组距、组数、组限与组中值的计算
·组距:各组上下线间的距离
组距的经验公式:斯特杰斯经验公式
N 为总体单位数,R 为全距
一般首组的组下限必须≤实际变量的最小值,
末组的组上限必须≥实际变量的最大值
·组中值:上下限之间的中点数值
·开口组中上下限的确定:首组假定下限=首组上限-邻组组距
末组假定上限=末组下限+邻组组距
首组组中值=首组假定下限+上限2=上限−邻组组距2
1 3.322lg n N
=+max
min 1 3.322lg x x R d n N
-==+
末组组中值=末组假定上限+下限
2
=下限+
邻组组距
2
VI.组距变量数列的编制程序
原始数据序列化→计算组距→分组归类→确定组数、组距→确定组限→合计(形成
次数分布)→制作统计表
5.频数分布的类型
I.钟形分布
II.U型分布
III.J型分布
四、数据显示
1、统计表
·概念:广义的统计表包括统计工作各阶段中所用的一切表格
狭义的统计表专指分析表和容纳各种统计资料的表格,也就是通常所说的统计表·构成:统计表从形式上看,由总标题、横行标题、纵栏标题和指标数值4部分组成统计表从其内容看,由主词栏和宾词栏两部分组成
必要时可在统计表的下方加上表外附加,主要包括:补充资料、注解、资料来源、
填表单位、填表人以及填表日期等。

·分类:按其作用不同,可分为调查表、整理表或汇总表和分析表
按主词的分组情况不同,分为简单表、简单分组表和复合分组表
按宾词设计不同可分为宾词简单排列表、分组平行排列表和分组层叠排列表·设计:总的要求是:科学、实用、简练、美观。

设计应注意的事项:A.表的行列比例
B.线条的绘制
C.合计栏的设置
D.栏数的编号
内容设计应注意事项: 标题设计指标数值(数据太小用。

表示)计量单位
表外附加
2、统计图
·概念:统计图是应用点、线、面、体、色彩等绘制的表示统计资料数量关系的几何图形或形象图形,具有简明、直观、生动和具体的特点。

·种类:按形式可分为几何图、象形图和统计地图
按图尺的数字性质可分为整数图、实数图、百分数图、对数图和指数图
·构成:图题图域图目图尺图形图注
·绘制原则:A.统计图应能反映客观实际情况
B.统计图要简明扼要,主题突出,通俗易懂
C.要根据不同的统计资料和不同的目的绘制不同的图形,尽量做到内容与形
式的协调
·统计图的绘制步骤
1.确定绘制统计图的目的
2.搜集统计资料
3.决定绘制的图式
4.绘制图形。

相关文档
最新文档