统计学-数据的收集与整理..
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
内容安排
一、 数据的收集 二、 数据的整理 三、 统计表与统计图
数据的收集
统计资料收集是根据统计研究的目 的要求,采用一定组织形式与科学方法, 进行采集与研究问题有关的各类信息资 料的工作过程。
1.数据的来源
(1)第一手数据
(2)第二手数据
第一手数据是反映被调查对象原始状况的资料,如原始 记录、统计台账、调查问卷答案、实验结果等. 统计调查或进行实验是数据的直接来源.原始数据是统 计数据的最基本的来源.
2.统计调查 (1)统计调查方案设计 (2)统计调查方法 (3)统计调查的组织方式
统计调查方案
➢确定调查目的与任务 ➢确定调查对象和调查单位 ➢确定调查项目和调查表 ➢确定调查时间和调查期限 ➢制定调查工作的组织实施计划
统计调查方法
1. 现场观察法 2. 报告法 3. 问卷法 4. 访谈法 5. 实验采集法
概率抽样中的随机原则
• 随机原则:在抽选样本时排除主观因素的影响(不是有 意识的抽选某些单位),使每个单位都有一定的机会被 抽中. –等概率抽样:抽样时每个单位被选中的概率都相等. –不等概率抽样:抽样时不是每个单位被选中的概率 都相等.
抽样调查
概率抽样 非概率抽样
等概率抽样 不等概率抽样
抽样调查的特点
普查
普查(Census)是对调查对象的全 部调查单位逐一进行的调查。其特点: 是一次性调查,是专门组织的全面调查, 即普查主要用来调查属于一定时点上的 现象总量。 关键词:全面调查、一次性、时点资料
美国普查局 http://www.census.gov/
美国普查局
抽样调查
抽样调查(Sampling Survey)是 一种非全面调查,它是在全部调查单 位中抽取一部分单位作为样本进行调 查,再根据调查结果推断总体的一种 调查方法。
数据的收集、整理
学习目标
1.理解数据的来源,理解五种统计调查方式, 掌握五种概率抽样方法的定义,理解五种统 计调查方法.理解抽样误差的定义,了解非抽 样误差. 会撰写统计调查方案。 2.了解统计整理的概念;了解统计分组的定 义、作用,理解统计分组的原则、种类;掌握 组距数列的编制步骤;掌握洛伦兹曲线和基 尼系数的含义与用途. 3.准确应用统计图和统计表显示统计数据的 数量特征.
概率抽样和非概率抽样
根据抽选样本的方法,抽样调查可以分为:
概率抽样:也称随机抽样,是按照随机原则抽选样本
的抽样方式,抽样时每个样本单位被选中的概率是已 知.概率抽样中可以对抽样误差进行控制.在我国,习 惯上将概率抽样称为抽样调查.
不满足概率抽样要求的抽样都被归为非概率抽样.非
概率抽样单个单位被选中的概率是不可知的,不能从 概率意义上控制抽样误差.
• 从N个总体单位中抽选n个单位组成样本,可以先将N 个单位编号,若抽到某个号则对应的单位入样.通常 有抽签法和随机数法两种抽选方法.
• 抽签法:用均匀同质的材料制作N个签并充分混合,然 后一次抽取n个签,或一次抽取一个签但不放回,直至 抽满n个签为止.
①名单抽样框,即以名册或清单形式列出总体所有单位
例如,学生名册、企业名录、职工名单、住户名单、 村庄名单、社区名单等等.
②区域抽样框,按自然地域划分并排列出总体所有单位. 例如,一片土地划分为若干地块并编号、一片森林划分 为若干林区并编号等. ③时间表抽样框,按时间顺序排列总体单位. 例如,流水线生产的产品质量检验,把一天划分为若干时 段并按顺序排列.
统计调查组织方式
1. 统计报表 2. 普查 3. 抽样调查 4. 重点调查 5. 典型调查
统计报表Baidu Nhomakorabea
统计报表(Statistical Report Forms)是指依照国家统计局或国家各行 政管理部门的规定,自上而下地统一布置, 以一定的原始记录为依据,按照统一的表 式,统一的指标项目,统一的报送时间与 报送程序,自下而上地逐级定期提供基本 统计资料的一种调查方式。
抽样调查方法的分类
抽样单元和抽样框
• 在抽样调查中可以把总体分成若干个互不重叠又穷尽 的有限个部分,每个部分称为一个抽样单位(抽样单元 ,Sampling unit).
• 抽样单位可以是一个总体单位,也可以包含多个个体. • 所有抽样单位的名单称为抽样框(Sampling Frame).
抽样框应尽可能与目标总体相一致. 抽样框有以下形式:
第二手数据是已经存在的经他人整理分析过的资料.数 据的间接来源常用的有以下一些:①公开出版的统计数 据,主要来自官方的统计部门和政府、组织、学校和科 研机构. ②尚未公开发表的数据,如各企业的经营报表 数据.
使用第二手数据需要注意的问题 • 应注意数据的含义、计算口径和计算方法,避免误用 或滥用; • 注意第二手数据的时间性,不能用过时的数据; • 应充分搞清这些数据的来源和可靠程度; • 应注明数据的出处,以尊重他人的劳动成果.
有放回抽样和无放回抽样
有放回抽样:也称为重复抽样,在一个单位被选入样本 后,记录其编号,然后又将其放回总体中继续参与随后 的抽样过程. 无放回抽样:也称为不重复抽样,在一个单位被选入样 本后,不再放回总体参与随后的抽样过程.
重复抽样的误差也比不重复抽样略大.实际应用中一般 采用不重复抽样.
抽选样本单位的方法
抽样框的编制是抽样调查的前提条件,要求不重不漏来 保证样本对总体的代表性.
概率抽样调查的方式主要有以下五种:
(Ⅰ)简单随机抽样 (Simple Random Sampling)
• 也称纯随机抽样.直接从总体单位中抽选样本单位, 每个个体被选入样本的概率都相等.可分为有放回 和无放回两种方式.
• 是最基本的抽样方法,许多抽样方法都是在它的基 础上发展起来的.其数学性质简单,理论也最为成熟.
• 是实际中应用最广泛的一种调查方式.1992年我国的国 家调查系统将抽样调查列为统计调查的主体.
• 与全面调查相比,它具有以下明显的特点: –经济性.普查需要花费大量人力、财力,而采用抽样 调查则可取得事半功倍的效果. –时效性强 .可以迅速及时地获得信息. –适应面广 .对于某些不可能进行普查的现象,只能通 过抽样调查获取这些现象的部分数据. –有可能获得比普查更高的数据质量.普查中工作量大 、环节多,登记性误差往往很大.