第三章 统计数据的整理和显示(老教材)
《统计学》第3章统计数据的整理和显示
• 组限
• 1、组数的多少与组距的大小有关。在全距一定时,组距 大,组数就少;组距小,组数就多。 • 2、组距的确定要根据事物的数量特征来确定。组距如果
过大,就会使性质不同的单位归并到了同一组里(破坏了
组内的同质性);组距过小,就会使同一性质的单位分到 了不同的组里(破坏了组与组之间的差异性)。
指标名称和数值)。
例
2006年某月某公司各企业劳动生产率统计表 (单位)
分组 P 总产值( 万元) 1 职工人数( 人) 2 劳动生产率 (元/人) 3
总标题
纵栏标题
横 行 标 题
大型 中型 小型 合计
数据资料 (指标数值)
主词
宾词
(1)、调查表 1、按用途分类: (2)、整理表或汇总表
(3)、分析表
或变异范围较大的离散变量。
例:学生按学习成绩分组:
按成绩分组 60分以下 人 2 数
60—70
70—80 80—90 90分以上 合 计
9
15 11 3 40
(1)、等距分组:各组的组距都相等。适用于标志值的
变动比较均匀的情况下。
(2)、异距分组:各组的组距不完全相同。适用:
a、标志值分布很不均匀
b、标志值相等的量具有不同意义
• 向上累计:由标志值小的方向向标志值大的方 向累计。 表示的意义是:该组上限以下所包含的总体单位 是多少。 • 向下累计:由标志值大的方向向标志值小的方 向累计。 表示的意义是:该组下限以上所包含的总体单位是 多少。
某班50名学生“统计学”考试成绩累计次数分布统计表
按考试 成绩分 组 60以下 60-70 70-80 80-90 90以上 合计 人数 频率( %) 4 20 24 32 20 100 向上累计 人数 2 12 24 40 50 频率 4 24 48 80 100 人数 50 48 38 26 10 向下累计 频率 100 96 76 52 20 -
统计数据的整理和显示(老教材)
与饼图类似,但中心部分被挖空,形成一个环形。环形图可以同时展示多个分类 数据的占比和分布情况,适用于需要比较多组数据的情况。通过不同颜色或图案 的环形区域,可以清晰地看出各组数据的相对大小和比例关系。
04
数值型数据整理与显示
集中趋势度量
算术平均数
所有数据之和除以数据个 数,反映数据集中趋势。
统计数据的整理和显 示老教材
目录
• 统计数据整理概述 • 数据预处理 • 统计图表显示方法 • 数值型数据整理与显示 • 分类数据整理与显示 • 时间序列数据整理与显示
01
统计数据整理概述
定义与目的
定义
统计数据整理是根据统计研究的任务与要求,对统计调查所搜集到的大量原始资料进行分组、汇总,使其条理化、 系统化,得出能够反映总体综合特征的统计资料的工作过程。
中位数
将数据按大小排列后,位 于中间位置的数,反映数 据中等水平。
众数
数据中出现次数最多的数, 反映数据集中情况。
离散程度度量
极差
最大值与最小值之差,反映数据 波动范围。
方差与标准差
衡量数据离散程度的常用指标, 方差是各数据与均值之差的平方 和的平均数,标准差是方差的平
方根。
四分位数间距
上四分位数与下四分位数之差, 反映中间50%数据的离散程度。
适用于分析两个或多个分类变 量之间的关系,如市场调查、 医学研究等领域。
06
时间序列数据整理与显示
时间序列构成要素
时间要素
反映时间变化的基本单位,如年、季、月、日等。
数据要素
与时间要素相对应的数据值,可以是数量、质量、 价格等。
频率要素
时间序列中数据观测或记录的次数,如年度数据、 季度数据、月度数据等。
统计数据的整理和显示
在编制组距数列中,要按照以下程序进行:
第一,使原始数据序列化( 编制由小到大的 单项式数列) 第二,计算出组距、组数等 第三,分组归类形成变量数列
整第 理3 和章 显统 示计
数 据
a、使原始数据序列化
现有某车间50名工人日加工零件的资料如下: 117,108,110,112,137,122,131,118, 134,114,124,125,123,127,120,129, 117,126,123,128,139,122,133,119, 124,107,133,134,113,115,117,126, 127,120,139,130,122,123,123,128, 122,118,118,127,124,125,108,112, 118,121
整第 理3 和章 显统 示计
数 据
区分标示组限与真实组限:组间是连续还是间断
连续:真实组限,如60-70,70-80,80-90;间断 :标示组限,如1-2,3-5,6-8;转换为0.5-2.5, 2.5-5.5,5.5-8.5)
组限
上限(大) 下限(小)
标示上限 真实上限= 标示上限+0.5 标示下限
组距 组 全数 距 最大 组 值 最 数小值
整第 理3 和章 显统 示计
数 据
组数与组距成反比关系,组数越多,组距越小, 反之,组数越少,组距越大。
确定组数可参照美国统计学家sturges(斯特古斯) 经验公式:
组数=1+3.322lgN, N为总体单位数。 组数=1+3.322lg50=6.64≈7,当然,这只是一个 经验结果,到底分多少组还取决于现象本身。
整第 理3 和章 显统 示计
数 据
采用单项式变量分组形成如下分布数列
统计学第三章统计数据的整理与显示
对第二手资料(获取他人的资料): 审核其完整性、准确性、适用性、时效性 2、筛选:
筛选包括: 剔除不符合要求的数据或有明显错误的数据; 将符合特定条件的数据筛选出来。
§3.1
统计整理与统计分组
★ 一、统计整理的意义和步骤 ★ 二、统计整理的基本方法
——统计分组
《统计学》第三章 统计数据的整理与显示
将总体中所有单位按一定的标志分 统计分组 为性质不同但又有联系的若干部分 的过程
统计分组的作用:
划分社会经济现象的类型
反映社会经济现象的内部结构和比例关系 揭示社会经济现象之间的相互依存关系
总体经过分组,能够突出组与组之间的差异 而抽象掉组内各单位之间的差异,使数据变 得条理化,便于进一步分析研究。
Percent
有效 数据
频数
频率
有效 频率
累计 频率
约2/3的人身高不超过165cm 频数表 (用SPSS制作)
洛伦茨曲线
累计频数(频率)分布曲线,可用于分析 社会财富、土地和工资收入等的分配是否 公平的问题。该曲线图是由美国洛伦茨博 士提出,故称为洛伦茨曲线。
二、统计整理的基本方法
——统计分组
《统计学》第三章 统计数据的整理与显示
统计整理
将统计调查得到的原始资料进行 科学的分组和汇总形成综合统计 资料的工作过程(对调查资料去伪
地位
是统计调查的继续,统计分析的 前提和基础
存真、去粗取精、科学分类、浓缩简 化)
统计数据的处理:
内 容 统计资料的分组、汇总及制表
《统计学》第三章 统计数据的整理与显示
统计整理的步骤
制定统计整理方案 对原始资料进行审核 数据处理 制作统计表或统计图
(一)数据的审核与筛选 1、审核: 对 第一手资料(直接调查或试验取得):审 核其完整性与准确性 完整性审核:应调查的单位或个体是否有遗 漏;所调查的项目是否填齐全。 准确性审核:内容是否符合实际;计算是否 正确。 如:文化程度:小学 职业:大学教师
第三章统计数据的整理与展示
编制结果
组中值: 5-(10-5)/2=S2T.A5T
根据“上限不包括在内”原则,所以在
5的销~1数0售之值额间值,有(不:百应5.万0该5把元.81)06包.0括组6在.4内中6.,8值这7.里0 商店数
7.4 8.3 8.5 9.5
5以下
2.5
4
5~10 10~15 15~20
172.5.5组25中+值(:211006-25)/2=27.5 17.5 13
储蓄存款
品
活期
质 标 志
定期 财政性存款
复合 分组
分 组
活期 定期
STAT
例2 :企业职工按工龄分组
5年以下
5~10年
10~15年
数量标志分组
15~20年
20年以上
统计分组的程序与原则
选择分 组标志
确定分 组体系
总体单 位归类
科学性: 组间差异 大,组内 差异小。
完备性和互斥性: 每个单位均能且 只能归到某个组 中。
2. 时效性审核 – 应尽可能使用最新的统计数据
3. 确认是否必要做进一步的加工整理
数据的筛选
STAT
1. 对审核过程中发现的错误应尽可能予以纠正 2. 当发现数据中的错误不能予以纠正,或者有些
数据不符合调查的要求而又无法弥补时,需要 对数据进行筛选 3. 数据筛选的内容包括:
▪ 将某些不符合要求的数据或有明显错误的数
志作为分组标志 • 要结合现象所处的具体历史条件或经济条
件来选择分组标志
例 1 : 为了了解某地区银行存款的构成,可以选 用存款性质、期限两个标志分别进行分组
STAT
按存款性质分组 企业存款 储蓄存款 财政性存款
第三章统计数据的整理与显示
统计整理方案 1、 确定汇总的统计指标和
综合表; 2、 确定分组方法; 3、 确定汇总资料的形式; 4、 确定资料的审查内容和
审查方法。
第三章 统计数据整理与显示
§2 统计分组 一、统计分组意义和作用 1、概念:它是根据统计研究的需要,将
统计总体按照一定的标志分成若干 个不同的组别。 对总体而言是“分”,对个体而言是“合”。 2、统计分组的原则
第三章 统计数据的整理 与显示
➢ 数量分组的方法 ➢ 分配数列的编制
§1 统计数据整理
一、统计整理的意义和内容 统计整理在统计工作中处于中间阶段,
起着承前启后的作用。通过数据整理,可 以使混乱、缺乏条理性的资料变成有条理 性、在某种程度上能够说明总体特征的有 用的资料。
它是根据统计研究的任务,对调查阶 段所搜集到的大量的原始资料进行加工汇 总,使其系统化、条理化、科学化,以反 映总体综合特征的资料的工作过程。
试将工人分成5组
其基本步骤为: 第一步:将原始资料按数值大小依次排列。 全距(Range)=最大变量值—最小变量值。
=576-432=144
第二步:确定变量的类型和分组方法(单 变量分组或组距分组)。
第三步:确定组数和组距(interval)。当 组数确定后,组距可计算得到: 组距=全距/组数
原则: 应将总体单位分别的特点显示出来 要考虑到原始资料的集中程度 要考虑到所研究对象的实际情况,考
例:重庆市按GDP计算的三次产业结构(%)
1980年
GDP
100
第一产业 38.4
第二产业 44.6
第三产业 17
1990年 100 33.4 39.7 26.9
2000年 100 17.8 41.4 40.8
【统计学 精品课件】第3章 统计数据的整理与显示
• 1.单项式分组与组距式分组
• 单项式分组就是用一个变量值作为一组,形成单项式变量 数列。
• 单项式分组一般适用于离散型变量且变量变动范围不大的 场合。
• 3.统计表的分类 • (1)按主词的结构分类,根据主词是否分组和 分组的程度,分为简单表、分组表和复合表
• (2)按宾词的设计分类,可分为宾词简单排列、 分组平行排列和分组层叠排列三种
• 3.统计表的设计 • (1)标题设计 • (2)线条的绘制 • (3)合计栏的设置 • (4)指标数值 • (5)计量单位 • (6)注解或资料来源
•
(3k-2)1 3.22lg N
•
d R xmax xmin
• (3-3)
k 1 3.22 lg N
• 式中:k为组数;N为总体单位数;d为组距;R为全距, 即最大变量值xmax与最小变量值xmin之差。
• 上下限之间的中点数值称为组中值,组中值的计算公式
为: •
组中值 上限+下限 2
• 当研究目的在于探讨总体在某一标志上的构成,而将总体 划分为若干组成部分以显示所研究标志的结构时,这种分 组称为结构分组。
• (3)可以揭示现象之间的依存关系
• 当研究目的在于探讨同一总体范围内两个可变标志的依存 关系时,可以将其中一个可变标志(自变量)作为分组标 志,以观察另一标志(因变量)相应的变动情况。这种分 组称为分析分组,它可以揭示现象之间的依存关系。
• 按品质标志分组编制的分布数列叫做品质分布数列或属 性分布数列,简称为品质数列。
第三章统计数据的整理和显示
第三章 统计数据的整理与显示
3.历史资料的审核: 在利用历史资料(或其他间接资料)时,
应审核资料的可靠程度、指标含义、所属 时间与空间范围、计算方法和分组条件与 规定的要求是否一致。 一般可以从调查 资料的历史背景、调查者搜集资料的目的 以及资料来源等,来判断资料的可靠程度, 也可以从指标间的相互关系以及指标的变 动趋势来检查它的正确性。
第三章 统计数据的整理与显示
• 复合分组实例:
男生 文科 女生
• 学生
男生
理科 女生
第三章 统计数据的整理与显示
2、按分组标志性质
品质分组
数量分组
第三章 统计数据的整理与显示
• 1 品质分组 是按品质标志进行的分组,即按实 物的某种属性分组。 • 如 企业按经济类型、行业分组;人口按性别、 民族分组;大学生按专业分组等。 • 这种分组可以反映总体的构成和不同属性事物 在总体中的地位和作用。
第三章 统计数据的整理与显示
(二)统计数据整理的意义:
1、统计数据整理能够对总体做出概括性的 说明。 2、统计整理是整个统计工作和研究过程 的中间环节,起着承前启后的作用。统计 整理是统计调查的继续,又是统计分析的 基础。 3、统计整理还是积累历史资料的必要手 段。
第三章 统计数据的整理与显示
(3)如果所发现的差错在其他单位也可能发 生时,应将错误情况通报所有单位,以免 发生类似错误。 (4)对于严重的错误,应发还重新填报,并 查明发生错误的原因,若属于违法行为, 则应依法严肃处理。
第三章 统计数据的整理与显示
(三)数据的排序
数据排序就是按照一定的顺序将数据排列,
以便初步显示数据的一些明显特征和规律, 为研究者找到解决问题的线索。
统计数据的整理及其显示(ppt-107页)(共106张PPT)全篇
穷尽原则
互斥原则
注意:统计分组是对总体认识深化的手段,它是一切统计研究的基 础,应用于统计工作的全过程,是统计研究的基本方法。
⑴ 类型分组
揭露社会经济现象的类型,反映各类型的特点。
例
单位:亿元
类 型 1999年 2000年 2001年 2002年
农业 14 106.2 13 873.6 14 462.8 14 931.5
审核
对第二手数据: 完整性: 准确性: 适用性:数据的来源、口径以及
有关背景资料; 时效性:尽可能使用最新的数据。
(2)数据筛选
当数据中的错误不能予以纠正,或者有些数据不符合 调查的要求而又无法弥补时,需要对数据进行筛选。
数据筛选的内容:
▪ 将某些不符合要求的数据或有明显错误的数
据予以剔除;
例如:企业按人数分组
499及以下
500 ~ 999
1000 ~ 2999 3000及以上
工人按工资分组
600 ~ 700 700 ~ 800 800 ~ 1200
1200 ~ 1500
适用条件: 它适用于变量值变化范围较大、不同变量值个数
较多的离散型变量及连续型变量的场合。
注意:连续型变量的数值不能一一列举,故
例如:按以五分制计分的成绩对全班100名学生进行分组,宜单 变量数列;按以百分制计分的成绩对全班100名学生进行分组 ,宜组距式数列;
1. 定类数据的排序
▪ 字母型数据,排序有升序降序之分,但习惯
上用升序
▪ 汉字型数据,可按汉字的首位拼音字母排列
,也可按笔画排序,其中也有笔画多少的升 序降序之分
2. 定距和定比数据的排序
递递增增排排序序:后设可一表组示数为据:为X(1X)1<,X(X2)2<,……<X,(NX) N, 递减排序可表示为:X(1)>X(2)>…>X(N)
第3章 统计数据的整理与显示
第3章统计数据的整理与显示【学习目标】本章主要介绍了统计整理是统计调查的继续,又是统计分析的前提。
介绍了统计整理的概念和内容,统计分组的方法,分配数列的概念、种类以及编制分配数列的基本步骤。
统计资料汇总的组织形式和具体方法。
【基本要求】学习本章内容,要求学习者注意统计资料整个工作过程的有关问题,掌握统计资料整理的程序、步骤和方法,绘制统计图,编制统计表。
通过各种渠道将统计数据搜集上来之后,首先应对这些数据进行加工整理,使之系统化、条理化,以符合分析的需要。
通过整理可以大大简化数据,使我们更容易理解和分析。
数据整理通常包括数据的预处理、分类或分组、汇总等几个方面的内容,它是统计分析之前的必要步骤。
【学习内容】3.1 数据的预处理数据的预处理是数据整理的先前步骤,是在对数据分类或分组之前所做的必要处理,包括数据的审核、筛选、排序等。
3.1.1数据的审核与筛选在对统计数据进行整理时,首先要进行审核,以保证数据的质量,为进一步的整理与分析打下基础。
从不同渠道取得的统计数据,其审核内容和方法有所不同,不同类型的统计数据在审核内容和方法上也有所差异。
对于通过直接调查取得的原始数据,应主要从完整性和准确性两个方面去审核。
完整性审核主要是检查应调查的单位或个体是否有遗漏,所有的调查项目或指标是否填写齐全等。
准确性审核主要包括两个方面:一是检查数据资料是否真实地反映了客观实际情况,内容是否符合实际;二是检查数据是否有错误,计算是否正确等。
审核数据准确性的方法主要有逻辑检查和计算检查。
逻辑检查主要是从定性角度审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相互矛盾的现象。
比如中学文化程度的人所填的职业是大学教师,对于这种违背逻辑的项目应予以纠正。
逻辑检查主要用于对定类数据和定序数据的审核。
计算检查是检查调查表中的各项数据在计算结果和计算方法上有无错误。
比如各分项数字之和是否等于相应的合计数,各结构比例之和是否等于1或100%,出现在不同表格上的同一指标数值是否相同,等等。
统计学课件第三章统计数据的整理与显示
统计学概论
绿色
健康饮品
用Excel制作频数分布表
课件
22
中南大学
分类数据的图示—条形图
统计学概论
1. 用宽度相同的条形的高度或长短来表示各类别 数据的图形
2. 有单式条形图、复式条形图等形式
3. 主要用于反映分类数据的频数分布
4. 绘制时,各类别可以放在纵轴,称为条形图, 也可以放在横轴,称为柱形图
不满意 (a)向上累积
满意
不满意 (b)向上累积
满意
甲城市家庭对住房状况评价的累积频数分布
课件
31
中南大学
环形图
统计学概论
1. 环形图中间有一个“空洞”,总体中的每一部 分数据用环中的一段表示
2. 环形图与圆形图类似,但又有区别
– 圆形图只能显示一个总体各部分所占的比 例
– 环形图则可以同时绘制多个总体的数据系 列,每一个总体的数据系列为一个环
课件
3
中南大学
数据整理的目的
统计学概论
数据整理的目的在于将个别单位的标志值转化 为说明总体数量特征的指标值,使统计资料系统化, 从而得出反映现象总体性和规律性的综合资料,为统 计分析提供基础和前提条件。数据根据其标志的类型, 将数据分为分类数据、定序数据和数值型数据.
课件
4
中南大学
数据整理与显示的基本问题 统 计 学 概 论
一般
93 31 225 75.0 168 56
满意
45
15 270 90.0 75
25
非常满意 30
10 300 100.0 30
10
合计
300 100.0 —
—
—
—
课件
29
第三章统计数据的整理与显示
3 -2
经济、管理类
基础课程
统计学
统计数据为什么要进行整理?
2、经过整理的结果能反映总体总体分布分 布的数量特征
3、整理结果可用于研究变量之间的关系
3 -3
经济、管理类 基础课程
统计学
某电信公司通信电路等级分布
管理等级 国际及港澳台电路 一级电路 二级电路 市、县内长途电路 本地电话电路
1.商品广告;2.服务广 告;3.金融广告;4.房地 产广告;5.招生招聘广告 ;6.其他广告。
表3-1 某城市居民关注广告类型的频数分布
广告类型 人数(人) 比例 频率(%)
商品广告
112 0.560 56.0
服务广告
51
0.255 25.5
金融广告
9
0.045 4.5
房地产广告
16
0.080
8.0
3 - 15
经济、管理类 基础课程
统计学
数据的审核、筛选与排序
1. 数据的审核
▪ 发现数据中的错误
2. 数据的筛选
▪ 处理数据中的错误
3. 数据排序
▪ 发现数据的基本特征 ▪ 升序和降序
3 - 16
经济、管理类 基础课程
统计学
数据的审核
(原始数据)
审核的内容 1. 完整性审核
检查应调查的单位或个体是否有遗漏 所有的调查项目或指标是否填写齐全
36-40岁 8.2%
41-50岁 7.6%
51-60岁 60岁以上
3.2%
1.1%
18岁以下 15.3%
31-35岁 12.1%
3 -7
25-30岁 16.3%
03统计数据的整理与显示1
月工资(元) 800- 900 900-1000 1000-1100 1100-1200 1200-1300
23
职工人数 3 7 13 5 2
30
比重(%) 10.0 23.3 43.3 16.7 6.7
100.0
组中值 850 950 1050 1150 1250
-
合计
(四)指标
– 频数、频率、组中值
850 950 1050 1150 1250
合计
25
30
100.0
-
-
-
-
-
(五)频数分布图
1、直方图
– 用直方形的宽度和高度来表示次数分布的图形。绘制直方图时, 横轴表示各组组限,纵轴表示次数(一般标在左方)和比率(或 频率,一般标在右方)。
2、折线图
– 折线图可以在直方图的基础上,用折线将各组次数高度的坐标连 接而成,也可以用组中值与次数求坐标点连接而成
以上累计
32 28 24 20 16 12 8 4 800
31
以下累计
900
1000
1100
1200
1300
工资(元)
累计次数曲线的应用——洛伦兹曲线
洛伦茨曲线:是20世纪初美国经济学家、统计学
家洛伦兹根据意大利经济学家帕累托提出的收入 分配公式绘制的描述收入和财富分配性质的一种 累计次数曲线图。 原理:设有10名学生,各持有现金100元。画累 计现金分布图。
要尽量能反映总体单位的分布情况及总体单位的集 中趋势。 要尽可能区分出组与组性质上的差异。
– 经验公式:m=1+3.3Lg N
17
第三节
(一)频数分布的概念
频数分布
– 在统计分组的基础上,将总体所有的单位按某一标志进行归类排 列,称为频数分布,或次数分布。 – 品质分布数列、变量分布数列
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
频数分布表实例
Frequency Distribution Table Example
原始数据: 24, 26, 24, 21, 27, 27, 30, 41, 32, 38 组别 ≥ 15 且< 25 组距 ≥ 25 且< 35 ≥ 35 且< 45 组界 组中值 20 30 40 频数 3 5 2
第三节 频数分布
一,频数分布及其种类 Frequency distribution:在分组的基础上,把所有 数据或总体单位按组归并,排列,形成所有数据 或总体各单位在各组间的分布,又称分布数列. f 频数分布两部分组成:组别,频数f和频率 ∑ f 性质: f f 0≤ ≤1 ∑ f =1 f ∑
∑
二,统计图
统计图用来表现数据的几何图形. 遵守如实反映,便于比较,通俗易懂,鲜明醒目,灵 活机动的原则. (一)直方图和条形图 1Histogram:用矩形的宽度和高度表示频数分布,横 轴表示数据分组,纵轴表示频数或频率. 2 Bar chart:用宽度相同的条形的高度或长度来表示数 据的变动.可横置或纵置.纵置也叫柱形图. 区别: 条形图用条形的长度表示各类别数量的多少,其宽 度是固定的,直方图是用面积表示数量的多少. 直方图各矩形通常是连续排列,而条形图则是分开 排列.
四,国民经济统计中的常用分类
(一)经济成分:公有,非公有 (二)登记注册类型:内资,港澳台,外商投 资 (三)国民经济行业:A---P (四)三次产业:农林牧渔,工业建筑,流通 服务 (五)机构部门:非金融,金融,政府,住户
五,统计数据分组应用
应用数据分组划分现象类型——研究不同类 型现象的特征. 反映现象内部结构——计算各组比重,反映 —— 总体内部结构. 研究现象之间的依存关系——有助于人们全 面,深刻地认识事物.先按一个标志分组, 再计算另一个标志在各组的数值,据以观察 它们之间的相互依存关系.
一,统计表
(二)统计表的种类 按用途分:调查表,整理表,分析表. 按主词是否分组和分组的情况,分为简单表,分组 表,复合表 (三)统计表的设计原则和方法 科学,实用,简练,醒目,美观 1设计表式 纵横交叉线条组成的长方形表格. 线条的绘制,表左右两端不封口,尽量少横竖线. 合计栏. 栏数编号.
(三)统计表的设计原则和方法
一,频数分布及其种类
(一)品质分布 经过属性分组,组别表现为一系列的概念和范畴. (二)变量分布 经过变量分组,组别表现为不同的数值或数域. 单项数列:以一个变量值为一组. 组距数列:以表示一定变动范围的两个变量构成的 组.各组组距相等叫等距数列,不等叫异距数列. 组距=上限-下限 组中值=(上限+下限)/2 缺下限的组的组中值=上限-相邻组的组距/2 缺上限的组的组中值=下限+相邻组的组距/2
三,数据的预处理
(二)数据的订正 审核中发现迟报,漏报及计算错误,应及时催报,补 报,改正. 针对不同的错误作出不同的处理: 对于可以肯定地一般错误,即代为更正,并向有关单 位核对. 对于可疑之处或无法代为更正的错误,应通知原报单 位复查更正. 对于在一个单位发现的有代表性的重大差错,除通知 原报单位更正外,还要将差错情况通报尚未报送资料 的单位,以防止类似错误发生. 错误情节属于违反统计法规的,应查明责任,予以适 当处理.
四,频数分布的类型
1对称分布型 正态分布:中间多,两边少,对称. 2偏态分布型 非对称,右偏(正偏),左偏(负偏). ( ) 3U型分布 中间少,两边多,人口死亡率分布. 4丁型分布 正丁(供给曲线),反丁(需求曲线)
第四节 数据的显示
数据的表现形式主要有统计表和统计图. 一,统计表 (一)统计表的结构 统计表(Statistical table)是以纵横交叉的线条组成 的表格来表现统计数据的一种形式,或者说统计表是 用来反映统计数据的一种表格,例如调查表,整理表, 数据积累表,分析表等. 总标题,横行标题,纵栏标题,数字资料 主词:要说明的对象,总体,总体的各个组,总体单 位的名称和时间. 宾词:用来说明主词的各个统计指标,包括指标名称 和数值.
三,频数分布的编制
(二)变量频数分布的编制 1单项数列的编制 对于离散型变量,如果变量值的种类较少且变量的变动 范围不大时,可编制单项数列. 首先应将各种变量值按大小顺序排列,然后计算各变量 值的频数和频率,最后将上述结果以表格的形式表现. 2组距数列的编制 离散变量,若变动幅度不大,变量值的种类较多,则 宜编成组距数列. 连续变量,可取值难以一一列出,只能编制组距数列. (1)将原始数据大小顺序排列,并确定最大值,最小值 和全距R (2)确定组距数列的类型.等距or异距.
(上界+下界)/ 2
二,累积频数和累计频率
Cumulative frequency和cumulative absolute frequency:将变量频数分布中各组频数或频率 依次累加而得到的各组频数或频率. 向上累计:变量值低组——高组 向下累计:变量值高组——低组
三,频数分布的编制
数列的编制过程实质上是分组与汇总的过程. (一)品质频数分布的编制 首先按品质数列对总体作属性分组,划分各 组界限,属性分组比较简单,分组标志一经 确定,组名称和组数也就确定,不存在组与 组之间界限划分的困难. 分组确定后,再汇总各组单位数,并编成统 计表,即得品质数列.
2组距数列的编制
(4)确定组限和组限的表示法 最小组下限低于或等于最小变量值,最大组上限应 大于最大变量值. 如果有极端值,可用开口组. 组限应有利于表现总体单位分布规律. 对于等距数列,如果组距是5的倍数,则每组下限 也最好是5的倍数.还应确定组限的表示法是用同 限,还是用异限. (5)从最小组依次排列,并分别计算各组频数和其 他有关指标,形成分组的统计表.
二,统计数据分组的类型
(一)属性分组和变量分组 属性分组(Attributive grouping)是按照反映 事物的属性和品质标志来进行的分组,例: 按性别,民族,文化程度,职业分组. 变量分组(Variable grouping)是指按照数量 标志进行的分组.组限是指各种不等的变量 值.
二,统计数据分组的类型
5统计调查方案的主要内容包括下列哪些方面 () A确定调查的目的和任务 B确定调查对象和调查单位 C确定调查项目,拟定调查表式或调查问卷 D确定调查时间和方法 E确定调查人员
课前练习
判断 统计调查中的调查单位与填报单位是一致的. () 统计是研究事物的数量特征,而不去研究其 质的规定性.() 典型调查时专门组织的一次性的全面调查. ()
2内容设计 标题设计:简明扼要,内容,数据的空间时间范围. 指标数值的填写:数字数位对齐,0补齐,缺数用 "…",不该有数用"—",数字栏没有空格. 计量单位栏的设计:一个单位写于纵栏标题,小写 入括号.全表一个单位写在表的右上方.横行的计 量单位可以专设一栏. 注解与资料来源:表下方注明资料来源,添加注解 或说明. 画图举例说明.
一,数据整理及其类型
统计数据整理(Statistical data arrangement)就是对 搜集得到的初始数据进行审核,分组,汇总,使之条 理化,系统化,变成能反映总体特征的综合数据的工 作过程. 根据数据搜集的方式和研究任务不同,统计数据的整理 可以分为下列三种: 定期统计报表数据的整理 统计台帐:为整理统计数据和进行统计分析而专 门设置的一种系统积累统计资料的表册. 专题性统计数据的整理.——根据专题研究的目的确 定整理的内容和题目,注意资料的时效性,广泛性, 政策性. 历史统计数据的整理.——对本部门,本单位的历史 统计数据按照研究目的的要求,进行系统的加工和处 理.
(二)简单分组,复合分组和分组体系 简单分组(Simple grouping):就是将总体按一个 标志进行的分组. 复合分组(Composite grouping):按照两个或两 个以上的标志对总体加以重叠的分组,所谓重叠的 分组,是指在前一次分组结果的内部再进行下一次 分组. 分组体系(Grouping system):是按照两个或两 个以上的标志对总体加以平行的分组,从不同的侧 面分别说明总体的特征.
2组距数列的编制
(3)确定组数和组距.组数越多,组距越小. 注意 考虑组内的同质性. 要能反映总体分布的规律,即要体现原始数据分布 的集中趋势或离中趋势. 组距不能太大或太小.一般在5-15组内.组距最好 是5的整数倍. 在等距数列情况下,如果总体单位数不是很多,变 量变动范围不是很大时,可用斯特吉斯经验公式计 算出一个参考组距.
三,统计数据分组的原则和方法
(一)原则 穷尽原则:分组时每一个总体单位都应有组可归, 各个组要有足够的空间容纳总体的所有单位. 互斥原则:组与组之间在涵义上和口径上不能发生 重叠. 反映事物本质的原则:使分组的结果尽量反映事物 的本质特征,突出各组之间质的差异.
三,统计数据分组的原则和方法
(二)分组标志的选择 Classification characteristic:统计数据分组时 所依据的标志. (三)分组界限的划分 Grouping ambit: 组限分明:例如性别,党派 属性有过渡,复杂,依据分类目录
3将统计总体按某一标志分组的结果表现为() A组内同质性,组间差异性 B组内差异性,组间差异性 C组内同质性,组间同质性 D组内差异性,组间同质性
课前练习
4某连续变量,其末组的组限为"500"以上,又 知其邻组的组中值为460,则末组的组中值应 为多少() A520 B540 C560 D580
课前练习
二,数据整理的原则和内容
(一)原则 目的性原则——按目的整理综合指标 联系性——指标之间有联系,有逻辑关系 简明性——同一资料有不同整理方法,选简明方法 (二)内容 根据目的和要求,确定应该整理的指标,并根据分 析的需要确定具体的分组. 对大量原始数据进行预处理. 对各指标进行汇总,计算出各组单位数,总体单位 数以及各组,总体的有关标志值之和. 将汇总整理的数据编制成统计表. 对统计数据分门别类地系统积累.