统计资料的整理与显示培训教程

合集下载

第3章 统计数据的整理与显示.ppt

第3章 统计数据的整理与显示.ppt

统计整理
将统计调查得到的原始资料进行 科学的分类和汇总,使之成为系 统化、条理化的综合资料,以反 映研究总体特征的过程。
地位
是统计调查的继续,统计分析的前 提和基础,起着承前启后的作用。
统计数据整理的一般程序 数据的预处理 数据的分组 数据的汇总
分布数列(频数分布)
(一)数据的预处理
1. 数据的审核
0~15 15~65 65以上
合计
1953年
36.3 59.3 4.4
100
1964年
40.7 55.7 3.6
100
1982年
33.6 61.5 4.9
100
1990年
27.5 66.7 5.8
100
2000年
22.9 70.1 7.0
100
(3)分析现象之间的依存关系
中国农民家庭按收入分组的恩格尔系数
▪ 检查数据中的错误
2. 数据的排序
▪ 升序和降序 ▪ 寻找数据的基本特征
3. 数据的筛选
▪ 找出符合条件的数据
数据的审核
1. 完整性与及时性审核
– 检查应调查的单位或个体是否有遗漏 – 所有的调查项目或指标是否填写齐全 – 检查填报单位是否按时报送了有关数据
2. 准确性审核
– 检查数据是否真实反映客观实际情况,内 容是否符合实际
– 检查数据是否有错误,计算是否正确等
• 审核数据准确性的常用方法
1. 逻辑检查
– 从定性角度,审核数据是否符合逻辑,内容是否 合理,各项目或数字之间有无相互矛盾的现象
– 主要用于对分类和顺序数据的审核
2. 计算检查
– 检查调查表中的各项数据在计算结果和计算方法 上有无错误

统计学课件讲义 第4章 统计数据的整理与显示

统计学课件讲义 第4章    统计数据的整理与显示

第4章统计数据的整理与显示一、统计数据整理1、概念:统计整理,就是指根据统计研究目的,将统计调查所得的原始资料进行科学的分类汇总,或对已经加工的次级资料进行再加工,为统计分析准备系统化、条理化的综合资料的工作过程。

2、作用:它是从对现象的感性认识过渡到理性认识的开始,是这个过程的连续点,并为这个过程提供坚实的基础。

在统计工作中起着承前启后的作用3、整理汇总必须遵守的原则:在对所研究的社会经济现象进行深刻分析的基础上,抓住最基本、最能说明问题本质特征的统计分组和统计指标对统计数据加工整理。

4、数据整理的程序:设计和编制统计资料的整理方案→对调查获得的资料进行审核{对原始资料进行审核对二手数据进行审核数据筛选→按照一定的组织方式和方法,对原始资料进行分组、编码、汇总和计算→对整理好的统计资料再次进行审核,改正在汇总过程中产生的各种差错→将汇总整理的结果编制成统计表或绘制统计图,简明扼要地表明现象的数量特征→积累、公布和管理统计数据注:对原始资料的审核包括准确性审核、及时性审核和完整性审核对二手数据的审核包括完整性审核、准确性审核、重审数据的适用性和时效性5、统计汇总是整理的核心其组织形式基本有3种:集中汇总、逐级汇总和综合汇总,统计汇总的技术主要有手工汇总和电子计算机数据处理2种。

二、统计分组1、概念:统计分组是指根据事物内在的特点和统计研究的需要,将统计总体按照一定的标志区分为若干组成部分的一种统计方法。

2、原则:组内同质,组间差异原则、穷尽原则、互斥原则3、作用:I.可以区分现象质的差别II.可以分析总体内部结构和总体结构特征III.可以揭示现象之间的依存关系4、种类:按分组标志的多少,统计分组可分为简单分组和复合分组按分组的标志性质不同,统计分组可分为品质分组(属性分组)和数量分组(变量分组)。

品质分组:就是按品质标志进行分组。

一般地,对于类别数据,采用品质分组。

数量分组:就是按数量标志分组。

第三章统计数据的整理与显示

第三章统计数据的整理与显示
单从原始数据中无法 得到总体特征和数量规律
3 -2
经济、管理类
基础课程
统计学
统计数据为什么要进行整理?
2、经过整理的结果能反映总体总体分布分 布的数量特征
3、整理结果可用于研究变量之间的关系
3 -3
经济、管理类 基础课程
统计学
某电信公司通信电路等级分布
管理等级 国际及港澳台电路 一级电路 二级电路 市、县内长途电路 本地电话电路
1.商品广告;2.服务广 告;3.金融广告;4.房地 产广告;5.招生招聘广告 ;6.其他广告。
表3-1 某城市居民关注广告类型的频数分布
广告类型 人数(人) 比例 频率(%)
商品广告
112 0.560 56.0
服务广告
51
0.255 25.5
金融广告
9
0.045 4.5
房地产广告
16
0.080
8.0
3 - 15
经济、管理类 基础课程
统计学
数据的审核、筛选与排序
1. 数据的审核
▪ 发现数据中的错误
2. 数据的筛选
▪ 处理数据中的错误
3. 数据排序
▪ 发现数据的基本特征 ▪ 升序和降序
3 - 16
经济、管理类 基础课程
统计学
数据的审核
(原始数据)
审核的内容 1. 完整性审核
检查应调查的单位或个体是否有遗漏 所有的调查项目或指标是否填写齐全
36-40岁 8.2%
41-50岁 7.6%
51-60岁 60岁以上
3.2%
1.1%
18岁以下 15.3%
31-35岁 12.1%
3 -7
25-30岁 16.3%

第二章 统计资料的收集整理与显示PPT课件

第二章 统计资料的收集整理与显示PPT课件
组。
18/60
统计学
第二章 统计资料的收集、整理与显示
例:
复合分组
标志
不及格 性别 男

及格
性别
男 女
层叠
人数
简单分组 不层叠
分组标志
人数
性别 男 女
成绩 及格 不及格
19/60
统计学
第二章 统计资料的收集、整理与显示
二、统计分组
❖ (二)统计分组的方法
▪ 在进行统计分组时,要遵循两个原则:穷尽原则 和互斥原则。
n13.3lgN
(2.4)
d R xmaxxmin n 13.3lgN
(2.5)
▪ 式中,n为组数;N为总体单位数;d为组距;R为全
距,即最大变量值与最小变量值之差。
表2-1
N
n
15~24 5
25~44 6
分组组数参考表
45~89 90~179
7
8
180~359 9
23/60
统计学
第二章 统计资料的收集、整理与显示
9/60
统计学
第二章 统计资料的收集、整理与显示
二、统计调查方式与统计调查体系
❖ (一)统计调查方式
▪ 1.普查
普查是一种专门组织的全面调查,它主要是用以收 集某些不能或不宜用定期报表收集的统计资料。对 国情国力的调查一般采用普查。
▪ 2.统计报表制度
统计报表制度是依照国家有关法规,自上而下地统 一布置,以原始记录为依据,按照统一的表式、统 一的指标项目、统一的报送时间和报送程序,自下 而上逐级地定期提供统计资料的一种调查方式。
2/60
统计学
第二章 统计资料的收集、整理与显示
美国的一位管理学家曾做过这样的实验,他向一些 高层的企业管理者提出这样三个问题:

第4章 统计数据的整理和显示 65页PPT文档

第4章 统计数据的整理和显示 65页PPT文档

117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121
定类数据的图示—圆形图
(圆形图的制作)
1. 也称饼图,是用圆形及园内扇形的面积来表示数值大小 的图形
2. 主要用于表示总体中各组成部分所占的比例,对于研究 结构性问题十分有用
3. 在绘制圆形图时,总体中各部分所占的百分比用园内的 各个扇形面积表示,这些扇形的中心角度,是按各部分 百分比占3600的相应比例确定的
定类数据整理—频数分布表 (实例)
【 例 4.1】 为 研 究广告市场 的状况,一家广告公司在某 城 市 随 机 抽 取 200 人 就 广 告 问题做了邮寄问卷调查,其 中的一个问题是“您比较关 心下列哪一类广告?”
1.商品广告;2.服务广 告;3.金融广告;4.房地 产广告;5.招生招聘广告 ;6.其他广告。
(由 Excel 绘制的累计频数分布图)
400 累 积 300 户 数 200
(户1)00
400 累
225 270 300
积 300 户 300
数 200
276 168
132
(户) 100
75
0 24
0
30
非常 不满意 一般 满意 非常
非常 不满意 一般 满意 非常
不满意 (a)向下累积
满意
不满意 (b)向上累积

统计学统计数据的整理和显示演示文稿

统计学统计数据的整理和显示演示文稿

二、统计分组的原则
1 穷尽性原则 2 互斥性原则。
现在是14页\一共有86页\编辑于星期日
➢ 三、统计分组的作用
统计分组的主要作用具体表现在以下几个方面。 (一)区分现象的不同类型
各种现象千差万别,多种多样,并在其发展中表现出不 同的性质和特征。通过统计分组,就可以将不同类型现 象的性质和特征区分开来,并且经过比较和研究,揭示 其发展变化的规律,达到深刻认识总体的目的。
中国 2001 26.4 25.2 26.4
美国 1999 36.5 43.0 37.1
19.6 56.1
23.5 32.8
35.4 49.5 29.6 36.7
日本 1997 36.6 36.1 39.8
49.0
24.5
36.6 44.4
英国 1998 37.7 36.4 33.4
42.0
26.0
统计分组就是根据统计研究的需要,将统计总 体按照一定的标志分为若干个组成部分的一种 统计方法。 统计分组具有两个方面的含义:对总体而言, 是“分”,即将同质总体区分为性质有别的不 同组成部分;对总体单位而言,它是“组”, 即将性质相同或相近的不同总体单位组合在一 起,构成一个组。
现在是13页\一共有86页\编辑于星期日
审核资料的及时性,是看填报单位是否按时报送 了有关资料。对不报、漏报或迟报的现象都要及时 查清。
现在是7页\一共有86页\编辑于星期日
2.审核资料的正确性: 审核资料的正确性,是检查所填报的资料是否 准确可靠。常用的审核方法有两种:
(1)逻辑检查 首先,从理论上或常识上检查资料是否有悖常 理、有无不切实际或不符合逻辑的地方。 其次,是检查各项目之间有无相互矛盾的地方。
➢ 介绍上限、下限、组距、组限。 ➢ 组距式变量数列中,每组区间两端的极值称组限。

统计数据整理与展示

统计数据整理与展示
Fundamentals of Statistics
第三章 统计数据的整理与展示
(3)绘制线形图旳基本规则: 1) 纵轴上尺度要由零开始; 2) 横轴上假如用来表达时间,其排
列顺序必须是由左到右,而且其间隔 与其 时间长短相适应;
3) 要合适选择纵、横轴上旳比度; 4) 曲线要画得粗某些,以便明显地显现现 象旳变动。
80
70
60
50
40
30
20
10
0
第一季度 第二季度 第三季度 第四季度
东部 西部 北部
Fundamentals of Statistics
(第2三)章线统形计数图据旳的整绘理制与展示
例如 技能训练时间和成绩有关资料
训练时间
(个月) 2
4
6
8 10 12
平均成绩
(分)
50 62 66 75 80 92
现形式。 4.学会统计表旳编制并能熟练利用
Fundamentals of Statistics
统计学原理(第三讲)
第三章 统计数据的整理与展示
第一节 统计数据旳整顿 一、统计数据整顿旳概念
根据统计研究旳任务与要求,对统计调 查阶段所搜集到旳原始资料进行加工与汇 总,使其条理化、系统化旳工作过程称统 计整顿。统计整顿涉及对原始资料和次级 资料旳整顿。
表3-15 1997~1998年城乡居民家庭抽样调查资料
项目
单位
1997年
1998年
一、调查户数
二、平均每户家庭人口数
三、平均每户就业人口数
行 四、平均每人全部收入
标 五、平均每人实际支出

#消费性支出
非消费性支出
六、平均每人居住面积

统计数据的整理和显示(老教材)

统计数据的整理和显示(老教材)
环形图
与饼图类似,但中心部分被挖空,形成一个环形。环形图可以同时展示多个分类 数据的占比和分布情况,适用于需要比较多组数据的情况。通过不同颜色或图案 的环形区域,可以清晰地看出各组数据的相对大小和比例关系。
04
数值型数据整理与显示
集中趋势度量
算术平均数
所有数据之和除以数据个 数,反映数据集中趋势。
统计数据的整理和显 示老教材
目录
• 统计数据整理概述 • 数据预处理 • 统计图表显示方法 • 数值型数据整理与显示 • 分类数据整理与显示 • 时间序列数据整理与显示
01
统计数据整理概述
定义与目的
定义
统计数据整理是根据统计研究的任务与要求,对统计调查所搜集到的大量原始资料进行分组、汇总,使其条理化、 系统化,得出能够反映总体综合特征的统计资料的工作过程。
中位数
将数据按大小排列后,位 于中间位置的数,反映数 据中等水平。
众数
数据中出现次数最多的数, 反映数据集中情况。
离散程度度量
极差
最大值与最小值之差,反映数据 波动范围。
方差与标准差
衡量数据离散程度的常用指标, 方差是各数据与均值之差的平方 和的平均数,标准差是方差的平
方根。
四分位数间距
上四分位数与下四分位数之差, 反映中间50%数据的离散程度。
适用于分析两个或多个分类变 量之间的关系,如市场调查、 医学研究等领域。
06
时间序列数据整理与显示
时间序列构成要素
时间要素
反映时间变化的基本单位,如年、季、月、日等。
数据要素
与时间要素相对应的数据值,可以是数量、质量、 价格等。
频率要素
时间序列中数据观测或记录的次数,如年度数据、 季度数据、月度数据等。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(3)确定组数和组距。组数越多,组距越小。 注意 考虑组内的同质性。
要能反映总体分布的规律,即要体现原始数据分布 的集中趋势或离中趋势。
组距不能太大或太小。一般在5-15组内。组距最好 是5的整数倍。
在等距数列情况下,如果总体单位数不是很多,变 量变动范围不是很大时,可用斯特吉斯经验公式计 算出一个参考组距。
折叠法——折叠留记号,汇总计算。避免过 录,省时省力,需细心。
卡片法——准备摘录卡片,根据卡片分组汇 总。适合于总体单位多,复合分组多的情况。
(二)电子计算机汇总——最主流的
编程序:按计算机语言对统计资料处理工作 进行得全面系统地流程排列。统计软件包: 关于统计资料输入、检查、修改、追加等数 据文件构成的程序。方便,节约,效率高。
一、统计资料汇总的方案设计及组织形式
(二)统计资料汇总的组织形式 逐级汇报:按照一定的统计管理制度,自下而上地
对调查资料逐级进行汇总。优点:能满足各地区、 各部门对统计资料的需要,便于审核和订正。缺点: 费时较长,出错几率大。 超级汇报:将全部调查资料集中到组织调查的最高 一级机关一次汇总。优点:缩短汇总时间,减少汇 总差错。缺点:整理结果不能及时满足各地区部门 需要。 两者共用,2000年第五次人口普查。
提纲
统 计 资 料 论
统计资料的性质和作用(第六周) 统计资料的汇总(第六周)
统计资料的分组(第六、八周) 统计图表的表现形式(第八周6年师资结构
教授 12%
助教 38%
副教授 19%
讲师 31%
教授 副教授 讲师 助教
1、按性质分类。
一次统计资料:统计调查取得调查资料。(普 查、重点调查、典型调查、抽样调查等。)
二、统计数据分组的类型
(一)属性分组和变量分组 属性分组(Attributive grouping)是按照反映
事物的属性和品质标志来进行的分组,例: 按性别、民族、文化程度、职业分组。 变量分组(Variable grouping)是指按照数量 标志进行的分组。组限是指各种不等的变量 值。
组。各组组距相等叫等距数列,不等叫异距数列。 组距=上限-下限 组中值=(上限+下限)/2 缺下限组的组中值=上限-相邻组的组距/2 缺上限组的组中值=下限+相邻组的组距/2
频数分布表实例
Frequency Distribution Table Example
原始数据: 24, 26, 24, 21, 27, 27, 30, 41, 32, 38
位复查更正。 对于在一个单位发现的有代表性的重大差错,除通知
原报单位更正外,还要将差错情况通报尚未报送资料 的单位,以防止类似错误发生。 错误情节属于违反统计法规的,应查明责任,予以适 当处理。
(一)手工汇总——最原始
划记法——划“正”号。简单,易出错,单 位少
过录法——分组统计,过渡预填表,再汇总。 便于校对,工作量大费时。
一、统计资料汇总的方案设计及组织形式
一、统计资料汇总的方案设计及组织形式
一、统计资料汇总的方案设计及组织形式
(四)统计资料的订正 审核中发现迟报、漏报及计算错误,应及时催报、补
报、改正。 针对不同的错误作出不同的处理: 对于可以肯定地一般错误,即代为更正,并向有关单
位核对。 对于可疑之处或无法代为更正的错误,应通知原报单
编码:把调查表中的汉字信息代码化。用“1, 2,3 “或”A,B,C”。
(二)电子计算机汇总——编码
预定代码
预定代码
后定代码
数据录入:编码后的数据记载到存储介 质上。
错误信息的检查和修正:逻辑检查,分 析比较筛选整理
运行程序:按程序运行规则进行信息处 理。
提供统计资料:最后环节,把经过运行 处理后的统计资料,以汇总表的形式输 出,提供运行结果。
第三节 频数分布
一、频数分布及其种类
Frequency distribution:在分组的基础上,把所有
数据或总体单位按组归并、排列、形成所有数据
或总体各单位在各组间的分布,又称分布数列。
频数分布两部分组成:组别、频数f和频率
f
f
性质:
0 f 1
f
f
f
1
一、频数分布及其种类
(一)品质分布 经过属性分组、组别表现为一系列的概念和范畴。 (二)变量分布 经过变量分组,组别表现为不同的数值或数域。 单项数列:以一个变量值为一组。 组距数列:以表示一定变动范围的两个变量构成的
二、三次资料注意其基础资料的正确性, 口径范围以及法令制度的偏差。
某职校毕业生就业人数统计表
某工厂工人基本情况表
一、统计资料汇总的方案设计及组织形 式
(一)统计资料汇总方案的设计 1、对总体资料的处理方法 总体单位的简单排列。 将所有总体单位资料加以合计。 对总体进行各种分组。 2、确定用哪些具体的统计指标来说明总体。 所有调查项目全部汇总,做汇总表格。 根据分析研究目的有选择的汇总。
组别
组中值 频数
15 且< 25
20
3
组距 25 且< 35
30
5
35 且< 45
40
2
组界
(上界+下界)/ 2
三、频数分布的编制
(二)变量频数分布的编制 1单项数列的编制 对于离散型变量,如果变量值的种类较少且变量的变动
范围不大时,可编制单项数列。 首先应将各种变量值按大小顺序排列,然后计算各变量
二次统计资料:行政管理需要的业务记录、申 报资料等业务统计资料。
三次统计资料:根据一次、二次或其他统计资 料组合、加工计算的加工统计资料。(代表性 的如:各种统计指数和国民经济核算资料。)
一次资料获得需要注意:
设计调查方案的原则是指标尽量少,信 息量尽量大。
减少登记误差和抽样误差 充分运用资料信息量,进行各种分析。
值的频数和频率,最后将上述结果以表格的形式表现。 2组距数列的编制 离散变量,若变动幅度不大,变量值的种类较多,则
宜编成组距数列。 连续变量,可取值难以一一列出,只能编制组距数列。 (1)将原始数据大小顺序排列,并确定最大值、最小值
和全距R (2)确定组距数列的类型。等距or异距。
2组距数列的编制
相关文档
最新文档