第七章 抽样调查技术
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
20
(三)等距抽样的参数估计
1、估计量
1 ysy yi yij n j 1
n
2015/12/22
21
V ( y sy )
N 1 2 K (n 1) 2 S S wsy N N
2.估计量的方差
N 1 2 K (n 1) 2 V ( ysy ) S S wsy N N
第二,等距抽样的效率取决于对总体进行 排列时所使用的标志值。在等距抽样中, 调研人员假设总体是有序的。
2015/12/22
23
三、分层抽样
(一)分层抽样的具体步骤 (二)分层抽样的方法 (三)分层指标的选择 (四)分层抽样的优缺点 (五)分层抽样适用的范围
2015/12/22
24
5
2015/12/22
(二)样本总体
概念: 也称抽样总体(sampled population)或者“子 样”、“样本”,是指从全及总体中抽取出来的 单位集合。 大样本与小样本: 样本总体通常是有限总体,它所包含的的总 体单位数目称为样本容量(通常用英文字母n来表 示)。一般来说,样本单位数达到或者超过30个 称为大样本,而在30个以下的称为小样本。
2015/12/22
2
第一节 抽样调查的基本概念
一、普查 二、全及总体与样本总体 三、抽样误差 四、抽样框与抽样框误差
2015/12/22
3
一、普查
概念: 普查是指为了某一特定调查目的而专门组织 的一次性全面调查,即为了了解调查对象的基本 情况而一次性地对调查对象中的全部单位逐一进 行登记的调查。 特点: 同其它调查形式相比,涉及面大、调查的内 容和项目比较简单,但所收集的资料全面准确、 可靠、误差比较小。同时,普查需要占用较多的 人力、花费较多的财力和物力才能完成。
第七章:抽样调查技术
本章教学目的 第一节 抽样调查的基本概念 第二节 概率抽样设计 第三节 非概率抽样 第四节 样本容量的确定
2015/12/22
1
本章教学目的
通过本章学习,了解抽样调查的各项 技术的特点,正确地应用各项技术进行 抽样调查;掌握如何选取样本、样本框, 减少抽样调查的误差,提高抽样调查的 精确度。
(一)分层抽样的具体步骤
第一步,辨明突出的(重要的)人口统计 特征和分类特征,这些特征与所研究的行 为相关。 第二步,确定在每个层次上总体的比例。
2015/12/22
25
(二)分层抽样的方法
例如,我们要在一个有1000名职工的企业中 抽取100名职工。我们以工作岗位为分层指 标,主要分为管理人员、一线工人和后勤 工人三类,已知的情况是管理人员占职工 总数的10%、一线工人占60%、后勤工人占 30%,从而确定了各类人员的样本数为管理 人员10名、一线工人60名、后勤工人30名。 然后,用简单随机抽样的方法对各类人员 进行抽样。
假如我们要进行北京市居民家用电器的拥 有状况调查,采用整群抽样方法,那么, 我们在北京市3,600个居民委员会中随机抽 取20个居委会,这20个居委会中的所有户都 成为我们的调查样本。
2015/12/22
32
(二)采用整群抽样的原因
原因一:当缺少基本单位的名单而难以 直接从总体中抽取所要调查的基本单位。 原因二:即使容易获得个体的抽样框, 但从费用上考虑,直接从个体抽样获得 的样本可能比较分散。 原因三:采用整群抽样是抽样调查本身 目的的需要。 原因四:如果某些总体的各个子总体之 间的差异不大。
2015/12/22
19
(二)等距抽样的实施办法
1.随机起点等距抽样 2.循环等距抽样 3.中点等距抽样 4.对称等距抽样法 (1)塞蒂(Sethi)的方法——两两对称等距抽样。 (2)辛(Singh)等人的修正方法——中心对称等距 抽样。 5.总体有周期性变化时的等距抽样
2015/12/22
11
2015/12/22
第二节 概率抽样设计
一、简单随机抽样 二、等距抽样 三、分层抽样 四、整群抽样法 五、多阶段抽样
2015/12/22
12
一、简单随机抽样
(一)简单随机抽样的具体操作 (二)简单随机抽样平均误差 (三)简单随机抽样的方法 (四)简单随机抽样的优缺点
2015/12/22
2015/12/22 10
3.减少抽样框误差的方法
(1)在抽选样本之前,要对抽样框加以检查,发 现可能存在的问题,进行识别、处理,并采取一 定措施加以补救。 (2)联接遗漏单位法,就是指把抽样样本遗漏的 个体和抽样样本中某个值相联接,其联接规则必 须在调查前明确规定。 4.抽样估计的总体参数 (1)总体和 (2)总体中具有某种特定特征的个体总数或它们 在总体中所占的比例或百分率: (3)总体两个不同指标的总和或均值的比值
13
一、简单随机抽样
(一)具体操作步骤:
第一,对总体的每个单位进行编号,总体单位数 为10,000的总体可编为00 001到期10,000号;
第二,在随机数码表(一般的数理统计书中都有 此表)中从任意一个编号数开始,向上、向下或 跳跃选取编号,在00 001和10,000之间选出200个 (样本单位数);
8
2015/12/22
(二)抽样框误差
1.抽样框误差的概念 抽样框误差(sampling frame error)是因不 准确或不完整的抽样框而引起的误差。抽 样框误差是一种非抽样误差
2015/12/22
9
2.抽样框误差的形成
(1)丢失目标总体单位也被称为“涵盖不足”,是指抽 样框没有覆盖全部目标总体单位。 (2)包含非目标单位也被称为“过涵盖”,是指抽样框 中包含了一些不属于研究对象的非目标总体单位。 (3)丢失目标单位和非目标单位共存,是指在抽样框中 既有丢失目标单位,也有包含非目标单位。 (4)复合连接是指抽样框单元与目标总体单元不完全一一 对应,而是存在一对多、多对一或多对多模式的现象。 (5)不正确的辅助信息误差也被称为“内容上的偏差”, 这种误差会降低估计的精度。 (6)抽样框老化又被称为“抽样框过时”或“不准确的抽 样框”。
33
2015/12/22
(三)整群抽样需注意的几个问题
Hale Waihona Puke Baidu
第一,整群抽样的随机性体现在群与群之间不重叠, 总体的任何一个基本单位都必须且只能归于某一群, 群的抽选按概率确定。
第二,如果把每一个群看成一个单位,那么,整群抽 样就是以群为单位的纯随机抽样。 第三,整群抽样对于群而言是非全面调查,对于被抽 中群内基本单位而言则是全面调查,是“先部分,后 全部”的抽样组织形式,与分层抽样正好相反。 第四,整群抽样也是多阶段抽样的前提和基础。
其中,
2 S wsy K 1 K (n 1) i 2 ( y y ) ij i j n
为等距样本(群) 内方差
2015/12/22
S
2
为总体方差。
22
(四)等距抽样的优缺点
第一,运用等距抽样的前提是要有总体每 个单位的有关材料,特别是按有关标志排 队时,往往需要有较为详细、具体的相关 资料。
(一)等距抽样法的具体操作 (二)等距抽样的实施办法 (三)等距抽样的参数估计 (四)等距抽样的优缺点
2015/12/22
18
(一)等距抽样法的具体操作
第一步,将N个总体单位按一定顺序排列, 编号为1,2,…N, 第二步,根据总体单位数N和样本单位数n 计算出抽样间隔K(必须是整数),K=N/n; 第三步,在1和K之间随机选一个数字r,称 为随机起点; 第四步,根据r和K从总体中抽取n个样本单 位。
第三,在有明确总体单位的数字表中选出符合上 述数字的总体单位,这些总体单位就是样本。
14
2015/12/22
Sx
2
n
n
(二)简单随机抽样平均误差公式
Sx
2
n
n
是抽样单位数
是全及总体标准差;
n
2015/12/22
15
(三)简单随机抽样的方法
1.抽签法 2.随机掷骰子法 3.计算机随机数法 4.随机数表法 5.使用统计软件直接抽取 6.其他方法 7.放回抽样与不放回抽样的比较
2015/12/22 34
五、多阶段抽样
(一)多阶段抽样的特点
第一,多阶段抽样对基本调查单位的抽选不是一 步到位的,至少要两步。
第二,组织调查比较方便,尤其对于那些基本单 位数多且分散的总体,由于编制抽样框较为困难 或难以直接抽取所需样本,就可以利用地理区域 或行政系统进行多阶段抽样。 第三,多阶段抽样是多种抽样方法的结合物。 (二)二级抽样和分层抽样、整群抽样的比较
35
2015/12/22
(二)二级抽样和分层抽样、整群抽样的比较
名称
一级 二级 精度(样本含 单元 单元 量相同时)
28
分层抽样的缺点:
首先是层的划分,有时在实际工作中分层并 不容易,需要收集必要的资料,从而耗费 额外的费用。另外,分层抽样要求各层的 大小都是已知的,当它们不能精确得知时, 就需要通过别的手段进行估计,这不仅增 加了抽样设计的复杂性,而且也会带进新 的误差。
2015/12/22 29
(四)分层抽样适用的范围
在起始部分时 采用简单随机 抽样
总体个数 较多
分层抽样时采 用简单随机抽 样或等距抽样
总体由差 异明显的 几部分组 成
2015/12/22
30
四、整群抽样法
(一)整群抽样法的具体操作 (二)采用整群抽样的原因 (三)整群抽样需注意的几个问题
2015/12/22
31
(一)整群抽样法的具体操作
16
2015/12/22
(四)简单随机抽样的优缺点
方法简单直观,当总体名单完整时,可直 接从中随机抽取样本,由于抽取概率相同, 计算抽样误差及对总体指标加以推断比较 方便。
尽管简单随机抽样在理论上是最符合随机 原则的,但在实际应用中则有一定的局限 性。
2015/12/22
17
二、等距抽样
2015/12/22
27
(四)分层抽样的优点
分层抽样比简单随机抽样和等距抽样等方 法更为精确,能够通过对较少的抽样单位 的调查,得到比较准确的推断结果,特别 是当总体较大、内部结构复杂时,分层抽 样常能取得令人满意的效果。同时,分层 抽样在对总体推断的同时,还能获得对每 层的推断。
2015/12/22
4
2015/12/22
二、全及总体与样本总体
(一)全及总体 概念: 也称目标总体(target population),是由符合研 究目的的所有具有相同性质或特征的个体(individual) 所组成的集合。在抽样调查中,全及总体是抽样推 断的目标。 分类: 全及总体可以根据单位数量是否有限,分为无限 全及总体(infinite population)和有限全及总体 (finite population)。
6
2015/12/22
三、抽样误差
在市场调查中存在两类误差:抽样误差与 非抽样误差。 抽样误差是指在调查中因使用的样本而发 生的样本指标与总体指标之间的差异。
2015/12/22
7
四、抽样框与抽样框误差
(一)抽样框(sampling frame) 1.抽样框的概念 抽样框就是供抽样调查使用的所有调查单位 的名单。这份名单为调查者提供了辨别和联系调 查总体中个体的有效途径。 2.设计抽样框的要点 准确的抽样框包括两个方面:完整性与不重复 性。①完整性是指不遗漏总体中的任意一个个体; ②不重复性是指任意一个个体不能重复列入抽样 框。
类别
简单随机 抽样
各自特点
共同点
抽样间的联系
适用范围 总体个数 较少
等距抽样
分层抽样
从总体中逐个抽 (1)抽样过 取 程中每个个 体被抽到的 将总体均分成几 可能性相等 部分,按预先制 (2)每次抽 定的规则在各部 出个体后不 再将它放回, 分抽取 即不放回抽 样 将总体分成几层, 分层进行抽取
26
2015/12/22
(三)分层指标的选择
例如,我国国内一般大规模的民意调查都是以居 住地分层的,至少分为城镇和乡村两层。因为城、 乡居民的观念、行为和习惯等是很不相同的。中 央人民广播电台1992年的全国抽样调查是多级分 层的,第一级的分层是按经济发展水平将全国467 个地区分成四层:“经济发达地区”、“经济一 般发达地区”、“不发达地区”和“贫困地区”, 因为根据以往的研究,人们的广播接触行为是与 地区的经济发展水平和个人的经济地位相关的。