应用统计学(第四版)第2章 数据与数据收集
合集下载
应用统计学-数据搜集

2 20
统计学
STATISTICS
非概率抽样
(nonprobability sampling)
1. 相对于概率抽样而言
2. 抽取样本时不是依据随机原则,而是根据研 究目的对数据的要求,采用某种方式从总体 中抽出部分单位对其实施调查
3. 有方便抽样、判断抽样、自愿样本、滚雪球 抽样、配额抽样等方式
2. 优点
n 保证样本的结构与总体的结构比较相近,从 而提高估计的精度
n n
2 17
组织实施调查方便
既可以对总体参数进行估计,也可以对各层 的目标量进行估计
统计学
STATISTICS
整群抽样
(cluster sampling)
1. 将总体中若干个单位合并为组(群),抽样时 直接抽取群,然后对中选群中的所有单位 全部实施调查
法代表有明确定义的总体,调查结果不宜推 断总体
2 22
统计学
STATISTICS
判断抽样
1. 研究人员根据经验、判断和对研究对象的了 解,有目的选择一些单位作为样本
n 有重点抽样,典型抽样等方式
2. 判断抽样是主观的,样本选择的好坏取决于 调研者的判断、经验、专业程度和创造性
3. 抽样成本比较低,容易操作 4. 样本是人为确定的,没有依据随机的原则,
2 24
统计学
STATISTICS
滚雪球抽样
1. 先选择一组调查单位,对其实施调查之后, 再请他们提供另外一些属于研究总体的调查 对象,调查人员根据所提供的线索,进行此 后的调查。这个过程持续下去,就会形成滚 雪球效应
2. 适合于对稀少群体和特定群体研究
3. 优点:容易找到那些属于特定群体的被调查 者,调查的成本也比较低
统计学
STATISTICS
非概率抽样
(nonprobability sampling)
1. 相对于概率抽样而言
2. 抽取样本时不是依据随机原则,而是根据研 究目的对数据的要求,采用某种方式从总体 中抽出部分单位对其实施调查
3. 有方便抽样、判断抽样、自愿样本、滚雪球 抽样、配额抽样等方式
2. 优点
n 保证样本的结构与总体的结构比较相近,从 而提高估计的精度
n n
2 17
组织实施调查方便
既可以对总体参数进行估计,也可以对各层 的目标量进行估计
统计学
STATISTICS
整群抽样
(cluster sampling)
1. 将总体中若干个单位合并为组(群),抽样时 直接抽取群,然后对中选群中的所有单位 全部实施调查
法代表有明确定义的总体,调查结果不宜推 断总体
2 22
统计学
STATISTICS
判断抽样
1. 研究人员根据经验、判断和对研究对象的了 解,有目的选择一些单位作为样本
n 有重点抽样,典型抽样等方式
2. 判断抽样是主观的,样本选择的好坏取决于 调研者的判断、经验、专业程度和创造性
3. 抽样成本比较低,容易操作 4. 样本是人为确定的,没有依据随机的原则,
2 24
统计学
STATISTICS
滚雪球抽样
1. 先选择一组调查单位,对其实施调查之后, 再请他们提供另外一些属于研究总体的调查 对象,调查人员根据所提供的线索,进行此 后的调查。这个过程持续下去,就会形成滚 雪球效应
2. 适合于对稀少群体和特定群体研究
3. 优点:容易找到那些属于特定群体的被调查 者,调查的成本也比较低
应用统计学2数据的搜集

概率抽பைடு நூலகம்与非概率抽样的比较
1. 概率抽样 – 依据随机原则抽选样本 – 样本统计量的理论分布存在 – 可根据调查的结果推断总体
2. 非概率抽样 – 不是依据随机原则抽选样本 – 样本统计量的分布是不确定的 – 无法使用样本的结果推断总体
搜集数据的基本方法
自填式问卷调查
1. 没有调查员协助的情况下由被调查者自己完成调查问 卷
学业有成 世界和平 为社会做贡献
22.7 15.4 13.8 8.5 7.9 5.9 4.9 4.2 3.9
41.6 38.8
0
10
20
30
40
50
城市居民快乐感的来源(%)
60.7 55.7
60
70
• 此次调查采用多阶段随机抽样方式于2008年5月针对北 京、上海、广州、武汉、沈阳、西安、成都7个城市共 1883名18~60岁居民的入户访问,数据结果已根据各 地实际人口规模予以加权处理,在95%置信度下本次调 查抽样误差为±2.76%。
1. 将总体中的所有单位(抽样单位)按一定顺序排列,在 规定的范围内随机地抽取一个单位作为初始单位,然 后按事先规定好的规则确定其它样本单位
– 先从数字1到k之间随机抽取一个数字r作为初始单 位,以后依次取r+k,r+2k…等单位
ik
k
i
k
i+k
i+2k
i+(n-1)k
2. 优点:操作简便,可提高估计的精度
4. 在大规模的抽样调查中,经常被采用的方法
非概率抽样(non-probability sampling)
1. 相对于概率抽样而言 2. 抽取样本时不是依据随机原则,而是根据研究目的对
统计学第2章 统计数据的搜集、整理和显示

第二节 数据整理
三、统计指标
(二)统计指标的分类
1. 数量(总量)指标
作用:反映现象的总规模、总水平或工作总量 以绝对数表示(国内生产总值、人口总数、工资总额等) 分类 总体单位数、总体标志总量 时期指标、时点指标 实物指标、价值指标和劳动量指标
第二节 数据整理
三、统计指标
搜集数据的两条途径:统计调查 + 实验 统计调查 —— 调查数据;实验 —— 实验数据 1. 确定调查目的 2. 确定调查对象和调查单位 3. 确定调查项目 4. 调查表格和问卷设计(一览表、单一表,要求简明扼要) 5. 确定调查时间(调查时间、调查期限) 6. 确定调查的组织实施计划
(三)统计调查的方案设计
上限不在内
等距分组与异距分组
等距分组
各组的标志值变动都限于相同的范围 优点:便于计算、绘制统计图 适用场合
异距分组
第一,标志值分布很不均匀的场合 第二,标志值相等的量具有不同意义的场合 第三,标志值按一定比例发展变化的场合
品质分组 单项式分组 间断组距式分组 数量分组 组限 连续组距式分组 组距式分组 等距式分组
6组:530 530 530 540 620 620 620 620 720 720 7组:720 720 630 630 630 630 620 620 620 620
8组:650 650 650 650 650 650 650 650 650 650
提问:从上述资料中,同学们能否直接看出该车间总的生产完成
类型分组
“日产量”分组
500以下 500 500以上 合计
应用统计学教学资料-统计学 第二章 数据的收集

27
电话式问卷调查
定义:
通过电话向被调查者实施调查
优点:
• 速度快,能在短时间内完成调查 • 适合于样本单位十分分散的情况
弱点:
• 如果被调查者没有电话,调查将无法实施 • 访问的时间不能太长 • 使用的问卷需要简单 • 被访者不愿意接受调查时,难以说服
28
观察式调查
就调查对象的行动和意识,调查人员边观 察边记录以收集所需信息 调查人员不是强行介入 能够在被调查者不察觉的情况下获得资料 如交通流量的调查
抽样框误差
回答误差
无回答误差 36
调查员误差
抽样误差(Sampling Error)
定义 由于抽样的随机性所带来的误差
样本与真值的差异 所有样本可能的结果与总体真 值之间的平均性差异
影响误差的因素 样本量的大小 总体的变异性
37
误差的控制(Non-sampling Error)
可控性 抽样误差可计算和控制
多阶段抽样(multi-stage sampling)
第二部抽样:(整体抽 样,系统性抽样等)
定义 先抽取群,但并不是调查群内的所有单位,而是再进行 一步抽样,从选中的群中抽取出若干个单位进行调查 二阶抽样中群是初级抽样单位,第二阶段抽取的是最终 抽样单位。将该方法推广,使抽样的阶段数增多,就称 为多阶段抽样
29
数据搜集方法的选择
在数据搜集使用方法的选择中要根据调查所需信息的性质、调查对象的特点、对数据 质量和回答率的要求,和预算。
调查时间 调查费用 问卷难度 有形辅助物的使用 调查过程控制 调查员作用的发挥 问卷率
自填式 慢 低
要求容易 中等利用
简单 无法发挥
最低
面访式 中等 高 可以复杂 充分利用 复杂 充分发挥 较高
电话式问卷调查
定义:
通过电话向被调查者实施调查
优点:
• 速度快,能在短时间内完成调查 • 适合于样本单位十分分散的情况
弱点:
• 如果被调查者没有电话,调查将无法实施 • 访问的时间不能太长 • 使用的问卷需要简单 • 被访者不愿意接受调查时,难以说服
28
观察式调查
就调查对象的行动和意识,调查人员边观 察边记录以收集所需信息 调查人员不是强行介入 能够在被调查者不察觉的情况下获得资料 如交通流量的调查
抽样框误差
回答误差
无回答误差 36
调查员误差
抽样误差(Sampling Error)
定义 由于抽样的随机性所带来的误差
样本与真值的差异 所有样本可能的结果与总体真 值之间的平均性差异
影响误差的因素 样本量的大小 总体的变异性
37
误差的控制(Non-sampling Error)
可控性 抽样误差可计算和控制
多阶段抽样(multi-stage sampling)
第二部抽样:(整体抽 样,系统性抽样等)
定义 先抽取群,但并不是调查群内的所有单位,而是再进行 一步抽样,从选中的群中抽取出若干个单位进行调查 二阶抽样中群是初级抽样单位,第二阶段抽取的是最终 抽样单位。将该方法推广,使抽样的阶段数增多,就称 为多阶段抽样
29
数据搜集方法的选择
在数据搜集使用方法的选择中要根据调查所需信息的性质、调查对象的特点、对数据 质量和回答率的要求,和预算。
调查时间 调查费用 问卷难度 有形辅助物的使用 调查过程控制 调查员作用的发挥 问卷率
自填式 慢 低
要求容易 中等利用
简单 无法发挥
最低
面访式 中等 高 可以复杂 充分利用 复杂 充分发挥 较高
统计学 第二章 统计数据的搜集、整理和显示

(二)实验方式
所谓实验方式,就是运用自然科学的试验 法,通过观测人为安排条件下试验产生的各种 结果并加以记录的方式来获取数据,或通过人 为安排条件下的试验来探求某个或某些因素对 所研究事物的数量影响程度和作用方式,凭借 实验结果来揭示所考察因素与所研究事物之间 的数量因果关系。
1、实验的原则
运用实验方式需要遵循下列两个原则:均衡分散
1、普查
普查是根据特定的统计研究目的而专门组织的 一次性的全面调查,用以收集所研究现象总体的全 面资料(即总体中的所有个体都是观测单位)。 普查的组织方式一般有两种:一是建立专门的 普查机构,配备一定数量的普查人员,对观测单位 直接进行登记。如我国历次的人口普查等。二是利 用观测单位的原始记录和核算资料,颁发调查表, 由观测单位按要求填报。如物资库存普查等。
重点调查的单位可以是一些企业、行业、 也可以是一些地区、城市。此种调查方式的优点是, 所投入的人力、物力少,而又较快地搜集到统计 信息资料。一般来讲,在调查任务只要求掌握基 本情况,而部分单位又能比较集中反映研究项目 和指标时,就可以采用重点调查。
在下列问题中为了得到数据,采用什么调查? • 为了买校服,了解每个学生衣服的尺寸。 • 商检人员在某超市检查出售的饮料的合格率。 • 对占全市工业总产值五分之一的六个大型企 业进行调查,以了解全市工业总产值的基本 情况。
观测性误差
数 据 收 集 误 差
也叫登记性误差或调查性误差,它 是在调查观测的各个环节因工作粗 心或被观测者不愿很好配合而造成 的所收集数据与实际情况不符的误 差,包括计量错误、记录错误、计 算错误、抄写错误、汇总错误、计 算机输入误差等工作误差,以及被 调查者不愿或难以提供真实情况的 误差,有时还存在调查人员弄虚作 假的误差和各种人为因素干扰的误 差。 这部分误差通常是人为造成的,通 过对统计调查资料的严密审核,是 可以发现并加以更正的。观测性误 差则可能存在于任何统计调查。 因样本不能完全代表总体而产生 的估计结果与总体真实数量特征 不符的误差。根据样本不能完全 代表总体的原因不同,代表性误 差又分为系统性代表性误差和偶 然性代表性误差两种。
应用统计学(第四版)第1章 绪论

劳动 作用于 劳动
资料
对象
管理费用
生产出
工业 产品
产量 质量 品种
销售 销 售 量
销售费用
价值形 成过程
工资 福利
V
折旧
+
费等
+
C2
产品制造成本 C1+C2+V
材料 费用
C1
利润 税金
M
工业总产值 C1+C2+V+M 实
现 M
财务费用
ቤተ መጻሕፍቲ ባይዱ
资金周转 过程
流动资产、长期投资、固定资产、无形资产、递延资产及其他资产 流动负债、长期负债、所有者权益、利润
统计研究 对象的特点
数量性
总体性
具体性
变异性 10
数量性:客观事物的数量方面的特征。 包括:(1) 数量多少;
(2) 现象之间的数量关系; (3) 质量互变的数量界限。
总体性:由许多各不相同的个别事物组成的具有某 一共同特征的整体。
具体性:客观存在的数量。即具体事物在一定时间、 地点、条件下的数量表现,是具体的、实实在在的, 有具体实物内容或计量单位的数据,不是抽象的量。
15
1.4.1 统计学的基本概念 1.总体、单位与样本 2.变量与统计标志 3.指标与指标体系
16
1. 总体、单位与样本
总体(统计总体的简称) :
是由客观存在的、具有某种共同性质的许多个别 事物构成的整体。
单位(总体单位的简称):
是指构成统计总体的每一个个别事物。也称为个体。
样本 : 是从总体中抽取的一部分总体单位(个体)的集合 。
17
总体的特性
同质性
变异性
大量性
统计学第二章数据搜集整理

普查的规定
• • • • 规定统一的调查项目 规定统一的标准时点 规定统一的普查周期 例如:第六次人口普查,调查表,性别、年龄、 民族、受教育程度、行业、职业、迁移流动、社 会保障、婚姻生育、死亡、住房情况等 • 截止时间,标准时点是2010年11月1日零时 • 人口普查的周期是10年,2000年,2010年
频率
fi
fi
fi :第i组频数
32
(2)频率的性质 (A )
0
fi
1 fi
(B ) (3)频数密度与频率密度(消除异距分组对频数影响) (A) (2.7) 频数密度=频数/组距 (B) (2.8) 频率密度=频率/组距 各组频数密度与各组组距乘积之和等于总体单位数,各 组频率密度与各组组距乘积之和等于1.
29
组数的确定(H.A.Struges经验公 式)
•
n = 1 + 3.3logN
N – 24 – 44 – 89 – 170 – 359 n 5 6 7 8 9
(斯特杰斯)
• • 15 • 25 • 45 • 90 • 180 • 组距=
30
四、频数(次数)分布
1.频数分布的基本理论
(1)频数分布的定义 在统计分组的基础上,将总体所有单位按某一标志 归类排列,并计算其相应出现的次数。 频数分布是统计整理的重要形式,通过对零乱的、 分散的原始资料进行有次序的整理,形成一系列反映 总体各组之间单位分布状况的数列,即分布数列。
10
• 概率抽样的特点: 1、样本单位按随机原则抽取,排除了主观因素对 选样的影响。 2、根据部分调查的实际资料对调查对象总体的数 量特征作出估计。 3、抽样误差可以事先计算并加以控制。 • 抽样调查的适用场合
应用统计学2统计数据的收集

【本章要点】 1.学习统计数据预处理内容,重点掌握统计数据的排序、 筛选和插补;
2.学习统计数据的分组,明确分组依据、组限、组距以及
组中值等概念; 3.重点掌握累计频数分布的概念; 4.学习统计表的分类以及设计原则; 5.了解统计图的常用分类,掌握如何利用电子表格软件绘
制各类统计图。
第一节 统计数据的来源
第二节 统计数据的类型
第三节
调查方案设计
第四节 调查问卷设计
• 一、间接来源 • 二、直接来源
• 一、分类数据、顺序数 据和数值型数据 • 二、截面数据、时间序 列数据和面板数据
• 一、调查目的 • 二、调查对象 • 三、调查单位 • 四、调查表
• 一、问卷及问卷设计标准
• 二、问卷的开发程序
• 三、问卷措辞应注意的问题 • 四、回答项目的设计
人口普查:我国分别于1953年、 1964年、1982年、1990年、2000年 2010年进行了六次人口普查。
抽样调查
普查的概念
普查的组织方式
经济普查:每5年进行一次,每逢
“3”和“8”的年份进行。 农业普查:农业普查,每10年进 行一次,每逢“6”的年份进行。
进行普查的要求
我国的普查实践
重点调查
专门调查 典型调查 抽样调查
普
查
专 门 调 查
重点调查 典型调查
抽样调查
普
查
专 门 调 查
重点调查 典型调查
抽样调查
普查的概念
普查的组织方式 进行普查的要求 我国的普查实践
普
查
专 门 调 查
重点调查 典型调查
专门组织的一次性的全面调查,用
来调查属于一定时点上的社会经济
现象总量。主要用于搜集一些不能
2.学习统计数据的分组,明确分组依据、组限、组距以及
组中值等概念; 3.重点掌握累计频数分布的概念; 4.学习统计表的分类以及设计原则; 5.了解统计图的常用分类,掌握如何利用电子表格软件绘
制各类统计图。
第一节 统计数据的来源
第二节 统计数据的类型
第三节
调查方案设计
第四节 调查问卷设计
• 一、间接来源 • 二、直接来源
• 一、分类数据、顺序数 据和数值型数据 • 二、截面数据、时间序 列数据和面板数据
• 一、调查目的 • 二、调查对象 • 三、调查单位 • 四、调查表
• 一、问卷及问卷设计标准
• 二、问卷的开发程序
• 三、问卷措辞应注意的问题 • 四、回答项目的设计
人口普查:我国分别于1953年、 1964年、1982年、1990年、2000年 2010年进行了六次人口普查。
抽样调查
普查的概念
普查的组织方式
经济普查:每5年进行一次,每逢
“3”和“8”的年份进行。 农业普查:农业普查,每10年进 行一次,每逢“6”的年份进行。
进行普查的要求
我国的普查实践
重点调查
专门调查 典型调查 抽样调查
普
查
专 门 调 查
重点调查 典型调查
抽样调查
普
查
专 门 调 查
重点调查 典型调查
抽样调查
普查的概念
普查的组织方式 进行普查的要求 我国的普查实践
普
查
专 门 调 查
重点调查 典型调查
专门组织的一次性的全面调查,用
来调查属于一定时点上的社会经济
现象总量。主要用于搜集一些不能
应用统计学 第二章 统计数据的收集与整理

21世纪高等学校经济管理类规划教材
应用统计学
CONTENTS
目
录
01
02
03
04
绪论
统计数据的收集与整理
数据分布特征描述
抽样推断
2
CONTENTS
目
录
05
06
07
08
假设检验与方差分析
相关与回归分析
时间序列分析
统计指数
3
统计数据的收集与整理
2.1 统计调查的基本问题
2.2 统计调查的方式和方法
了素材和依据。
① 公司数据库
② 公开出版物
③ 互联网
④ 实地调查
26
2.2.2 统计调查的方法
1. 初级资料的收集方法
– 初级资料是未做任何加工整理的原始资料。
访问法
报告法
观测法
27
访问法\面访调查
• 面访调查 也称采访法,是通过指派调查员根据调查提纲向被调查者访问,提
出问题,由被调查者答复以取得资料的一种方法。具体可分为自由交谈、调查
5. 统计报表制度
• 概念:根据国家有关统计法的规定,依据自上而下统一规定的表格形式、项目及其指
标、报送时间与程序布置调查要求和任务,自下而上逐级汇总上报的统计报表制度。
• 特点:统一性、全面性、定期性
• 国家统计报表、部门统计报表、地方统计报表
25
2.2.2 统计调查的方法
数据收集是按照确定的数据分析框架,收集相关数据的过程,它为数据分析提供
察表面现象,不能反映真实思想。
• 报告法:由报告单位根据原始记录和核算资料,按照统计机关颁发的统一的表格和要求,
按一定的报送程序提供资料的方法。
应用统计学
CONTENTS
目
录
01
02
03
04
绪论
统计数据的收集与整理
数据分布特征描述
抽样推断
2
CONTENTS
目
录
05
06
07
08
假设检验与方差分析
相关与回归分析
时间序列分析
统计指数
3
统计数据的收集与整理
2.1 统计调查的基本问题
2.2 统计调查的方式和方法
了素材和依据。
① 公司数据库
② 公开出版物
③ 互联网
④ 实地调查
26
2.2.2 统计调查的方法
1. 初级资料的收集方法
– 初级资料是未做任何加工整理的原始资料。
访问法
报告法
观测法
27
访问法\面访调查
• 面访调查 也称采访法,是通过指派调查员根据调查提纲向被调查者访问,提
出问题,由被调查者答复以取得资料的一种方法。具体可分为自由交谈、调查
5. 统计报表制度
• 概念:根据国家有关统计法的规定,依据自上而下统一规定的表格形式、项目及其指
标、报送时间与程序布置调查要求和任务,自下而上逐级汇总上报的统计报表制度。
• 特点:统一性、全面性、定期性
• 国家统计报表、部门统计报表、地方统计报表
25
2.2.2 统计调查的方法
数据收集是按照确定的数据分析框架,收集相关数据的过程,它为数据分析提供
察表面现象,不能反映真实思想。
• 报告法:由报告单位根据原始记录和核算资料,按照统计机关颁发的统一的表格和要求,
按一定的报送程序提供资料的方法。
【统计学 精】第二章 统计数据的搜集和整理

• 无限总体的调查。 • 破坏性的产品质量检验。 • 总体单位数过大。 • 没必要全面调查,如城乡居民家计调查、民意测 验等。 • 特殊情况,如战备物资调查、矿产调查等
(2)对普查资料进行必要的修正。
4、典型调查
• 这是一种专门组织的非全面调查。它根据调查的目的,在对所研 究的对象进行初步分析的基础上,有意识地选取若干(一个或少 数几个)具有代表性的单位进行调查和研究,借以认识事物发展 变化的规律。
• 重点调查适用的条件:
•
当统计调查的任务只要求了解调查对象的基本情况,而
调查对象中确实存在重点单位时,比较适宜进行重点调查。
• 例如,为了掌握全国钢铁生产的基本情况,可以选出鞍钢、宝钢、首钢、 马钢、武钢等几个大型钢铁企业调查,以便对钢铁产量有个大致的了解。
3、抽样调查
•抽样调查是一种非全面调查,是实际中应用最广 。 泛的一种调查方式
(3) 是运用概率的估计方法 。
• 例如:通过抽样推断得出,厦大学生的平均 月支出在(420,470)元上的可靠性为90%。
(4)抽样推断的误差可以事先计算,并加以控制。
• 抽样调查的优越性: 第一,经济性强。 第二,时效性高。 第三,适应面广。 第四,准确性大。
抽样调查的适用范围 (1)一些不可能或不必要进行全面检查的社会 现象。
性和时效性。
三、统计分组
(一)统计分组的概念和种类
• 1、定义:统计分组根据统计研究的目的和客 观现象的内在特点,按照某个标志或几个标 志把研究的总体划分为若干性质不同的部分 (或组)的一种统计方法。
统计分组
• 2.兼有“分”和“合”的双重含义: •对于现象总体,是 “分”;对于单位, 是“合”。 • 对于分组标志,是“分”,对于其他标 志,是“合”。
(2)对普查资料进行必要的修正。
4、典型调查
• 这是一种专门组织的非全面调查。它根据调查的目的,在对所研 究的对象进行初步分析的基础上,有意识地选取若干(一个或少 数几个)具有代表性的单位进行调查和研究,借以认识事物发展 变化的规律。
• 重点调查适用的条件:
•
当统计调查的任务只要求了解调查对象的基本情况,而
调查对象中确实存在重点单位时,比较适宜进行重点调查。
• 例如,为了掌握全国钢铁生产的基本情况,可以选出鞍钢、宝钢、首钢、 马钢、武钢等几个大型钢铁企业调查,以便对钢铁产量有个大致的了解。
3、抽样调查
•抽样调查是一种非全面调查,是实际中应用最广 。 泛的一种调查方式
(3) 是运用概率的估计方法 。
• 例如:通过抽样推断得出,厦大学生的平均 月支出在(420,470)元上的可靠性为90%。
(4)抽样推断的误差可以事先计算,并加以控制。
• 抽样调查的优越性: 第一,经济性强。 第二,时效性高。 第三,适应面广。 第四,准确性大。
抽样调查的适用范围 (1)一些不可能或不必要进行全面检查的社会 现象。
性和时效性。
三、统计分组
(一)统计分组的概念和种类
• 1、定义:统计分组根据统计研究的目的和客 观现象的内在特点,按照某个标志或几个标 志把研究的总体划分为若干性质不同的部分 (或组)的一种统计方法。
统计分组
• 2.兼有“分”和“合”的双重含义: •对于现象总体,是 “分”;对于单位, 是“合”。 • 对于分组标志,是“分”,对于其他标 志,是“合”。
应用统计学第2章 数据的搜集与整理

第2章
掌握数掌握数据的测量尺度及常用类型; 了解统计数据搜集的意义; 掌握统计分组、分配数列的编制方法; 掌握数据图表展示方法。
本章教学目的
第2章 数据的搜集与整理
第2章
统计分组、分配数列的编制方法数据图表展示方法
本章重点和难点
第2章 数据的搜集与整理
第2章
2.4 分配数列
第2章
1.列表法
2.4 分配数列
2.4.3 品质分配数列的表示方法
第2章
2.图示法(1)条形图。条形图是指用宽度相同、高度不同的条形来表示数据变化的图形。条形图可以横向展示,也可以纵向展示,纵向展示时又称柱形图。
2.4.3 品质分配数列的表示方法
2.4 分配数列
第2章
2.图示法(2)饼图。饼图是用圆形及圆形面积的大小来表示数据数值大小的图形。饼图通常用来表示研究总体中各个组成部分的比例分布,对于结构性的研究问题非常实用。
2.5.2 统计表的分类
2.5 统计表
第2章
2.分组表 统计表的主词按照某种标志进行分组后所形成的表称为分组表,利用分组表可以展示统计总体不同现象的特征,说明各个分组之间的内部结构和相互关系,如表2-13所示。
2.5.2 统计表的分类
2.5 统计表
第2章
3.复合表统计表的主词按照两个或两个以上的标志进行分组的表称为复合表,如表2-14所示。
2.1.1 数据的测量尺度
第2章
2.1 数据的测量尺度与常用类型
第2章
1.绝对数、相对数和平均数绝对数是数据最基本的表现形式,是其他数据指标形成的基础。相对数反映了研究对象的相对水平,由两个相互联系的绝对数的对比而得到。平均数反映了研究对象的总体表现水平,是一个抽象了的研究对象总体各单位在某一数量标志下的表现差异,表示研究对象的总体各单位的一般水平,而不是某个单位的具体水平。
掌握数掌握数据的测量尺度及常用类型; 了解统计数据搜集的意义; 掌握统计分组、分配数列的编制方法; 掌握数据图表展示方法。
本章教学目的
第2章 数据的搜集与整理
第2章
统计分组、分配数列的编制方法数据图表展示方法
本章重点和难点
第2章 数据的搜集与整理
第2章
2.4 分配数列
第2章
1.列表法
2.4 分配数列
2.4.3 品质分配数列的表示方法
第2章
2.图示法(1)条形图。条形图是指用宽度相同、高度不同的条形来表示数据变化的图形。条形图可以横向展示,也可以纵向展示,纵向展示时又称柱形图。
2.4.3 品质分配数列的表示方法
2.4 分配数列
第2章
2.图示法(2)饼图。饼图是用圆形及圆形面积的大小来表示数据数值大小的图形。饼图通常用来表示研究总体中各个组成部分的比例分布,对于结构性的研究问题非常实用。
2.5.2 统计表的分类
2.5 统计表
第2章
2.分组表 统计表的主词按照某种标志进行分组后所形成的表称为分组表,利用分组表可以展示统计总体不同现象的特征,说明各个分组之间的内部结构和相互关系,如表2-13所示。
2.5.2 统计表的分类
2.5 统计表
第2章
3.复合表统计表的主词按照两个或两个以上的标志进行分组的表称为复合表,如表2-14所示。
2.1.1 数据的测量尺度
第2章
2.1 数据的测量尺度与常用类型
第2章
1.绝对数、相对数和平均数绝对数是数据最基本的表现形式,是其他数据指标形成的基础。相对数反映了研究对象的相对水平,由两个相互联系的绝对数的对比而得到。平均数反映了研究对象的总体表现水平,是一个抽象了的研究对象总体各单位在某一数量标志下的表现差异,表示研究对象的总体各单位的一般水平,而不是某个单位的具体水平。
贾俊平_统计学_第四版——第2章 数据的搜集

3 -6
一位睿智的统计学家说过,世上有两种数 据:好数据和坏数据。当然还有其它划 分数据类型的方法。不过这样开始也挺 好。好数据是指根据合理、正确的统计 原理收集到的数据。坏数据是指通过其 它方法收集到的数据。
3 -7
3 -8
统计数据搜集的意义
统计调查在整个工作中,负担着提供基础 资料的任务。所有的统计计算和统计研 究,都是在原始资料搜集的基础上建立 起来的。只有搞好统计调查,才能保证 统计工作达到对于客观事物规律性的认 识,并从而预测未来。
普查的规模大,任务重,质量要求高,需要由政府动 员、组织各方面的力量配合进行,普查的一个最主要的优 点是它比任何其他调查方式所取得的资料都更全面、更系 统、更详尽。
3 -5
但是,现在开始有问题了:谁去问——是你, 我,大学生,还是退休职员?应该问谁?我 们有足够的钱去问涉及到该问题的每一个人 吗?对第一个例子来说,那可是要问遍北京 所有的人!然而,如果不是问所有的人,可 以只问某周六下午路过购物中心的人吗?或 者只问在某个网球馆买啤酒的人?或者你可 以想一个相对来说更好的方法?
去年在北京市有多少垃圾被回收了? 是什么导致19世纪的水手在长期的海上航行中患
了坏血病? 中小学班级的大小影响学生们的成绩吗?
3 -4
为回答这些以及其它的许多问题,必须收 集相关的信息。在这些例子中,我们需 要知道很多事情,一眼看去,好像得到 这些信息很容易,只需走出去询问一下 或做一做实验即可。
中 国中 人国 口市 统场 计统 年计 鉴年
鉴
3 - 15
二手数据的特点
1. 搜集容易,采集成本低 2. 作用广泛
分析所要研究的问题 提供研究问题的背景 帮助研究者更好地定义问题 检验和回答某些疑问和假设 寻找研究问题的思路和途径
一位睿智的统计学家说过,世上有两种数 据:好数据和坏数据。当然还有其它划 分数据类型的方法。不过这样开始也挺 好。好数据是指根据合理、正确的统计 原理收集到的数据。坏数据是指通过其 它方法收集到的数据。
3 -7
3 -8
统计数据搜集的意义
统计调查在整个工作中,负担着提供基础 资料的任务。所有的统计计算和统计研 究,都是在原始资料搜集的基础上建立 起来的。只有搞好统计调查,才能保证 统计工作达到对于客观事物规律性的认 识,并从而预测未来。
普查的规模大,任务重,质量要求高,需要由政府动 员、组织各方面的力量配合进行,普查的一个最主要的优 点是它比任何其他调查方式所取得的资料都更全面、更系 统、更详尽。
3 -5
但是,现在开始有问题了:谁去问——是你, 我,大学生,还是退休职员?应该问谁?我 们有足够的钱去问涉及到该问题的每一个人 吗?对第一个例子来说,那可是要问遍北京 所有的人!然而,如果不是问所有的人,可 以只问某周六下午路过购物中心的人吗?或 者只问在某个网球馆买啤酒的人?或者你可 以想一个相对来说更好的方法?
去年在北京市有多少垃圾被回收了? 是什么导致19世纪的水手在长期的海上航行中患
了坏血病? 中小学班级的大小影响学生们的成绩吗?
3 -4
为回答这些以及其它的许多问题,必须收 集相关的信息。在这些例子中,我们需 要知道很多事情,一眼看去,好像得到 这些信息很容易,只需走出去询问一下 或做一做实验即可。
中 国中 人国 口市 统场 计统 年计 鉴年
鉴
3 - 15
二手数据的特点
1. 搜集容易,采集成本低 2. 作用广泛
分析所要研究的问题 提供研究问题的背景 帮助研究者更好地定义问题 检验和回答某些疑问和假设 寻找研究问题的思路和途径
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
类型:解剖麻雀式和划类选典式 特点:属于非概率型抽样调查
具有所研究问 题的本质属性 或特征的单位
目的:为了描述或揭示事物的本质或规律
26
调查方式小结
调查方式
全面调查
非全面调查 (抽样调查)
定期统计报表制度——制度化的经常性调查
普查 (概率)抽样调查
判断调查
非概率抽样
重点调查 典型调查
方便调查
专门组织的一次性调查
• 调查方式:对法人单位和产业活动单位在全面清查的基础上进
行普查登记。对个体经营户在全面清查的基础上,按照《第四次 全国经济普查个体经营户抽样调查方案》进行抽样调查。
• 调查方法:在单位清查阶段,普查员使用PAD(手持移动终端)采
集清查对象数据; • 在普查登记阶段,采取网上直报、PAD采集、部门报送及其他方
第2章 数据与数据搜集
1
主要内容和学习目标
2.1 数据(理解) 2.2 数据的收集(掌握)
2
2.1 数据
2.1.1数据的测量尺度 2.1.2统计数据的常用类型
3
何为数据? 统计数据简称数据。数据是 所收集、分析、汇总的,用以描 述和解释的事实与数字。
统计数据的研究,首先涉及的是数据的测度。 在统计数据的收集、处理和分析中,不同特点的 统计数据,形成不同的类型,需要采用不同的统计 方法将数据转为有意义的而且易于理解的统计信息。
36
调查表的形式:单一 一览表
单一表每份只登记一个调查单位的资料。在调查项目 较多时使用单一表,便于分类和整理。
一览表的样式——表2—1
一览表每份可登记多个调查单位的资料,却不能容纳 较多的调查内容。适用于调查项目不多的调查,便于 资料的对比和汇总。
单一表的样式——表2—2
37
调查问卷的设计 问卷设计的一般问题 问题的设计 问卷整体的设计
31
辅助性活动。
为保证统计单位的不重不漏,普查对包括农业、林业、畜 牧业和渔业在内的全部法人单位和产业活动单位进行全面清查。
调查单位:每一个企事业单位、产业活动单位和个体经营户。
调查项目(内容):普查的主要内容包括单位基本情况、
组织结构、人员工资、财务状况、能源生产与消费、生产能力、
生产经营和服务活动、固定资产投资情况、研发活动、信息化和 电子商务交易情况等。根据不同的普查对象,其普查内容也有所
特点:是一次性或周期性的 需要规定统一的标准时间 普查数据全面、系统、准确、可靠 该方法适用面比较窄
22
普查的特点:
①普查通常是一次性的或周期性的。
②普查一般需要规定统一的标准调查时间,以保证普查 结果的准确性,避免调查数据的重复与遗漏。
③普查的数据一般比较准确,标准化程序也较高。因此, 它可以为其他调查方式提供基本的参照依据。特别是与抽 样调查的数据资料相互验证,以提高调查质量,保证调查 精度在合理的范畴之内。
式相结合的方式获取普查对象数据。
33请与前三次经济普查方案作比较 分析异同变化。并谈谈你的认识。
34
4、统计调查工具 调查表 调查问卷
35
调查表的设计
调查表在结构上一般由表头、表体、表外附加组成
表头是调查表的名称,用来说明调查的内容、被调查 单位的名称和经济性质等。 表体是调查表的主要部分,列示调查的具体项目。 表外附加通常由填表人签名、填报日期、填表说明等 内容组成。
24
重点调查
概念:从全部总体单位中选择少数重点单位进行调查
特点:属于非概率型抽样调查 目的: 为了了解总体的基本情况
在所要调查的数量 特征上占有很大比重 的单位。 所要调查单
位标志的标志值占总 体标志值总和有很大 比重的单位 。
25
典型调查
概念:从全部总体单位中选择一个或几个有代表性 的单位(典型单位)进行深入细致调查
不同。具体分为四类普查表。
1、一套表单位普查表;
2、非一套表单位普查表;
3、个体经营户普查表;
4、部门普查表。
32
• 调查时间: • 标准时点为2018年12月31日;时期资料为2018年度
• 调查期限:
• 2017年筹备阶段,主要是研究普查的总体方案和开展专项试点; 2018年准备阶段,主要是组建各级普查机构,开展宣传动员,制 订和部署普查方案,完成人员选调与培训等; 2019年是普查登记、数据审核处理和普查结果发布阶段; 2020年为普查资料出版和利用普查结果开展课题研究阶段。
7
4.定比尺度
定比尺度又称比率尺度或比较水平,它是对事物之 间比值的一种测度,可用于参数与非参数统计推断。虽 然它与定距尺度同属于一个等级的计量尺度,但其功能 要比定距尺度强一些,其主要特征体现为: (1)除能区分类别、排序、比较大小、求出大小差异、 可采用加减运算以外,还可以进行乘除运算。 (2)具有绝对零点,即“0”表示“没有”或“不存在”。 可见,定比尺度中的“0”是个没有意义的数值。 (3)所有统计量均可对其进行分析。
统计数据有哪些类型? 如何测度?
4
2.1.1 数据的测量尺度
统计研究的任务之一就是要对数据进行 处理和分析,而对数据进行处理与分析的前 提就是要对数量进行计量,而要对数据进行 计量,就要确定数据的计量尺度。按照对客 观事物测度的程度或精确水平来划分,可将 计量尺度从低级到高级、由粗略到精确分为 定类尺度、定序尺度、定距尺度、定比尺度 四种。
38
问卷设计的一般问题
设计的问卷要求: ①主题突出,问题相互关联; ②用语准确规范,易于被调查者接受; ③问题形式多样,易懂易答; ④易于设计整理和分析。
12
品质型数据、数值型数据与数据的测量尺度 之间的关系:
统计标志
数量标志 (数值型数据)
差距尺度
定比尺度
品质标志 (品质型数据)
定序尺度
定类尺度
13
截面数据与时序数据
截面数据搜集的是在同一时间对同一总体内 不同单位的数量进行观测而获得的数据。
时序数据是时间序列数据的简称,是指在不 同的时间对同一总体的数量进行观察而获得 的数据。
定距尺度又称间隔尺度或间隔水平,它是对事物类别或次 序之间间距进行的一种测度。它是一种较定类尺度和定序尺 度更为高级,更为精确的一种计量尺度。其主要特征体现为:
(1)不仅能区分事物的类别、进行排序、比较大小, 而且可以精确地计量大小的差异,即可以进行加减运算,但 不能计算乘除。
(2)没有绝对零点,即可以以任意一个零为起点。这 里的“零”表示一个数值,即“0”水平,而不表示“没有” 或“不存在”。
5
1.定类尺度
定类尺度又称列名尺度或列名水 平,它是按照某种属性对客观事物 进行平行分类或分组的一种测度, 主要用于非参数的统计推断。它是 对事物的一种最粗略、计量精度最 低或最基本的测度,是其他计量尺 度的基础,其主要特征体现为:
(1)只能区分事物的类别,但无 法比较类间的大小。 (2)对事物的区分必须符合穷尽 和互斥的要求。 (3)对其进行分析的统计量主要 是频数或频率。
14
统计数据的类型
按获取途经
原
次
始
级
数
数
据
据
按表现和用途
按时间状况
品
数
质
值
型
型
数
数
据
据
截
时
面
序
数
数
据
据
15
2.2. 数据的收集 2.2.1原始数据的收集 2.2.2次级数据的收集
16
2.2.1 原始数据的收集
1、统计调查的概念 2、统计调查的方式 3、统计调查方案 4、统计调查工具 5、统计调查误差
图2-2 调查方式
27
3、调查方案的设计
调查方案应包括的内容: 1、确定调查目的 2、确定调查对象和调查单位 3、确定调查项目(内容) 4、确定调查时间和调查期限 5、明确调查方式和调查方法 6、制定调查的组织实施计划
28
我国2018年第四次经济普查的调查方案
• 调查目的:全面调查我国第二产业和第三产业的发展规模、布
名录库以及部门共建共享、持续维护更新的机制,进一步夯实统计基
础,完善“三新”统计,推进国民经济核算改革,推动加快构建现代
化统计调查体系,为加强和改善宏观调控、深化供给侧结构性改革、
科学制定中长期发展规划、推进国家治理体系和治理能力现代化提供
科学准确的统计支持。
29
全国经济普查条例规定,经济普查分别在逢3、逢8 的年份实施。每五年进行一次经济普查,主要是为了 满足编制国民经济发展五年规划的需要。一方面分析 判断普查年份所在期五年规划的执行情况,另一方面 为制定下一个五年规划提供基础数据。
30
• 调查对象:普查对象是我国境内从事第二产业和第三产业的全部
法人单位、产业活动单位和个体经营户。
•
法人单位、产业活动单位和个体经营户按照《普查单位划分规
定》进行界定。
• 调查范围:根据《国民经济行业分类》(GB/T4754-2017)和《三次
产业划分规定》,普查范围具体包括:采矿业,制造业,电力、热 力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、 仓储和邮政业,住宿和餐饮业,信息传输、软件和信息技术服务业 ,金融业,房地产业,租赁和商务服务业,科学研究和技术服务业 ,水利、环境和公共设施管理业,居民服务、修理和其他服务业, 教育,卫生和社会工作,文化、体育和娱乐业,公共管理、社会保 障和社会组织,以及农、林、牧、渔业中的农、林、牧、渔专业及
统计标志
不 变 标 志
()
可
变 量
变 标 志
数 量 标 志
差 距 尺 度
定 比 尺 度
品 质 标 志
定定 序类 尺尺 度度
6
2.定序尺度
定序尺度又称顺序尺度或有序水平,它是对事物之间等级 或顺序差别的一种测度。其计量精度要优于定类尺度。它不 仅可以测度类别差,而且还可以测度次序差,并可比较大小。