第六章 抽样设计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

28 20 04 55 72
46 67 36 01 58
53 42 28 26 43
35 15 19 64 57
74 20 26 98 89
92 57 64 56 64
13 80 37 71 27
45 90 15 49 54
二、等距抽样
STAT
等距抽样 (systematic sampling) 又称系统抽样, 就是先将总体各中依按一定顺序排列起来,然 后按一定向隔来抽取样本单位。 单位顺序的排列方式有两种: 排列顺序与调查项目无关 按与调查项目有关标志排队 抽样距离(间隔)计算公式为 : 抽样距离=N/n
不受上述条件限制,即有的层可多抽些样 不等比抽样 本单位,有的层也可少抽些样本单位。非 等比例抽样大多适用于各层的单位数相差 悬殊,或层内方差相差较大的情形。
分层抽样
STAT
在分层时可以根据调查的具体要求,按照一个或 多个特性来分层。比如下面的例子是按照教育程 度和性别这两个指标来分层的。为便于计算,假 设总体是1,000,000人,从中抽取1,000人的样本。 教育程度作为第一阶段分层的指标,性别作为第 二阶段分层的指标,先按教育程度分为四组,每 组再按性别分成两组,共分为八层 。
抽样方法的条件
STAT
一个好的抽样方法须满足: 能代表研究调查的对象; 由样本数据估计总体的特征数,不仅要精确还 要有可靠性; 符合抽样成本。 抽样偏误来源有: 抽样设计失误; 抽样误差。
三、常用术语
1.总体(population)和样本(sample) 2.总体指标和样本指标 3.重复抽样和不重复抽样 4.抽样框和抽样单元
系统抽样的例子
STAT
例如要从120户居民中选出7户,使用系统(等距)抽样的过程
a. 先将120户居民从“1”到“120”编号; b. 决定间隔数;120/7=17.1,最接近的整数是17,间 隔数定为17。 c. 抽取第一个编号:等距抽样的方式可以随意使用一 个起点,可通过随机表选取,也可按照简单的主观随意决定第 一个编号。 d. 然后每隔17抽取一个编号,这时可能出现两种情况: 第一是开始的号码比较大,按照间隔抽选时,会出现超出编号 的可能,即1);第二是选中的样本偏好在总体编号的范围内, 即2 1)38,55,72,89,106,123(3),140(20); 2)8,25,42,59,76,93,110 “1)”中最后两个编号超过了120,则把它们分别减去120, 得到最后的编号3,20 “2)”里由于第一个编号限定在1至17之间,所以没有出 现超过120的编号,则所抽中编号不需修正,它们所对应单元入 样。由此可见,在确定第一个编号时,“2)”的方法更为简便。
STAT
抽样单元 为了便于抽样,通常把总体划分为有限个互不 重迭又穷尽的部分,每个部分称为一个抽样单 元。抽样单元可大可小 。例如,在全国居民生 活状况调查中,各省就是一级单元,每个省义 可分为较小的二级单元,如市、县等,还可按 区、街道、家庭户、个人再细分为三级、四级 单元等。
四、抽样方案设计
STAT
简单随机抽样
STAT
简单随机抽样一般可采用掷硬币、掷子、 抽签、随机数表等方法抽取样本本
就是给总体的每个单位编号,并做成 号签,把号签混合之后,抽取所需单 位数,然后,按照抽中的号码,查对 调查单位,加以登记。
抽签法
随机数表
随机数表是0到9十个数字用完全 随机顺序排列编制而得的表。
随机数表法的例子
抽样框和抽样单元
STAT
抽样框 是指供抽样所用的所有调查单位的详细名单。 例如要从50000名职工中抽取300名职工组成一 个样本,则50000名职工的名册,就是抽样框。 应注意:利用现有名单作为抽样框时,要先对 该名录进行检查,避免有重复、遗漏情况的发 生,以提高样本框对总体的代表性 。
抽样框和抽样单元
STAT
重复抽样和不重复抽样
STAT
重复抽样又称有放回抽样,是一种在总体 中允许重复抽取样本单位的抽选方法,即 从总体中随机抽出一个样本单位后,将它 再放回去,使它仍有被选取的机会,在抽 样过程中总体单位数始终相同。 不重复抽样又称无放回抽样,即先被抽选 的单位不再放回到总体中去,即任何单位 一经抽出,就不会再有第二次被抽取的可 能性。
五、多阶段抽样
STAT
五、多阶段抽样
STAT
从中可以看到,整个过程是先在所有一级单元 (100个班)中,抽取10个班,再从每个班中抽 取 10 个人,这 10 个班抽中的所有人合在一起构 成了100人的样本。如果第一阶段的抽样时,所 有一级单元全部被抽中,此时二阶抽样就相当 于分层抽样,如果第二阶段抽样时,整个班的 人全部入样,此时二阶抽样就相当于整群抽样。
STAT
抽样方案设计的主要程序
定义总体及抽样单位 确定所使用的抽样框 选择抽样技术 确定必要样本数 确定总体目标量的估算方法 实施抽样
STAT
第二节 随机抽样技术
简单随机抽样
STAT
整群抽样
分层抽样
多阶段抽样
系统抽样
一、简单随机抽样
STAT
简单随机抽样(simple random sampling) (纯随机 抽样)考虑一个包含N个单位的总体,从中抽取n 个单位作为样本。如果抽样是不放回的,即同 一个单位不能在样本中重复出现,那么总共有 N! n M CN n 个 种不同的取法,也就是说共有 C N n!( N n)! 可能的不同样本。如果每个样本被抽中的概率 都相等,则称这种抽样方法为简单随机抽样, 所得到的样本叫做简单随机样本 (SRS);如果抽 样是有放回的,则得到的样本叫做非常简单随 机样本(VSRS),也叫做独立同分布样本。
五、多阶段抽样
STAT
在许多情况下、特别在复杂的、大规模的市场 调查中,调查单位一般不是一次性直接地抽取 到的,而是采用两阶段或多阶段抽取的办法, 即先抽大的调查单元,在大单元中抽小单元, 再在小单元中抽更小的单元,这种抽样组织方 式称为多阶段抽样 (multi –stage sampling) 。 多阶段抽样有以下两个特点:一是对抽样单位 的抽选不是一步到位的,至少要两步;二是组 织调查比较方便,尤其对于那些基本单位数多 且分散的总体。
从一定总体抽取样本数据前,先确定 抽样的程序及方案,保证抽选样本对 总体有充分代表性,以求最经济、有 效的结果。 如何兼顾抽样效果和所付出的代价, 使之能有机结合,一直是摆在抽样方 案设计者面前的一个重要问题,也是 抽样方案设计的难点所在。
抽样方案的基本内容
确定抽样调查目的、任务、要求; 确定总体范围、抽样单位; 确定抽取样本方法; 确定必要样本数; 要求主要抽样指标的精度; 确定总体目标量的估算方法; 制定实施总体方案的办法、步骤。
四、整群抽样
STAT
从图中看到整群抽样的特点就是对群进行随机抽样, 抽到的群的所有单元全部入样。整体抽样的优点是, 组织实施比较方便,确定一组就可以抽出许多单位进 行调查;而且只是需要群的名单,而不需要群内单元 的名单,这就使得抽样工作大为简化。
四、整群抽样
STAT
划分群时,每群的单位数可以相等,也可以不等,在 每一群中的具体抽选方式 ,既可以采用等概率抽样 (例如简单随机抽样),也可以采用不等概率抽样。 因为以群为单位进行抽选,抽选单位比较集中,明显 地影响了样本分布的均匀性 。 整群抽样和其它抽样方式相比,在抽样单位数目相同 的条件下抽样误差较大,代表性较低 。 整群抽样的可靠程度,主要还是取决于群与群之间的 差异大小 。 应用:在大规模的市场调查中,当群内各单位问的差 异较大,而各群之间差异较小时,才可考虑采取整群 抽样方式。
系统抽样的局限
STAT
①运用等距抽样的前提是要有总体每个单位的 有关材料,特别是按有关标志排队时,往往需 要有较为详细、具体的相关资料; ②当抽选间隔和被调查对象本身的节奏性(或循 环周期)重合时,就会影响调查的精度。如对某 商场每周的商品销售量情况进行抽样调查,若 抽取的第一个样本是周末,抽样间隔为7天,那 么抽取的样本单位都是周末,周末往往商品销 售量较大,这样就会发生系统性偏差(各样本标 志值偏向一边),从而影内等距抽样的代表性; ③等距抽样的抽样误差计算较为复杂 。
抽样调查特性
STAT
抽样调查因以下特性,能迅速正确地掌握 资料,极具时效,成为市场调查中使用最 频繁的一种调查方式。 经济:可节省人力、物力、财力。 效率:迅速的取得调查结果。 准确:规模小,质量高 。
二、抽样调查的作用
STAT
取代普查对不必要、不可能进行普查的现象作 调查; 在资源有限情况下,达到最满意的调查效果; 对同一现象在不同时间进行连续调查,了解变 化状况; 对普查进行验证; 运用于企业管理、质量管理,为企业提升竞争 力。
四、整群抽样
STAT
比如某高校学生会要调查该校在校生对学 校广播站节目的评价,用整群抽样法抽样 时,可以把全校每一个班级做为每一群, 也可以按宿舍来划分,每一个宿舍做为一 个群,因为在这个问题上,一般来说各班 之间或各宿舍之间差异不会太大。假设该 校有1500名学生,200个学生宿舍,从中抽 取15个宿舍进行调查,抽样过程见图
STAT
如某居民区有620户居民,拟抽取15户调查其家庭收入状 况,可将居民根据其门牌号码编号为001—620,抽取时可 从任何一行、任何一列、任何一个数开始,并将随机数表 数字中的三位数组成一组。例如,从随机数表的第二排第 三列的数组起,自上而下、自左而右抽取,则顺序取得的 样本号为:421,281,266,435,574,520,(926), 498,(789),(921),578,(643),567,(642),345,090, (715),149,(754),284,206,043。
第六章 抽样设计
第一节抽样调查的基本概念
STAT
一、抽样调查的特点 抽样调查 定义:按照一定程序,从所研究对象 的全体(总体)中抽取一部份,进行 调查或观察,并在一定的条件下,运 用数理统计的原理和方法,对总体的 数量特征进行估计和推断。
抽样方法
STAT
随机抽样是指按照概率原则,从总体中抽取一 定数目的单位作为样本进行观察,随机抽样使 总体中每个单位都有一定的概率被选入样本, 从而使根据样本所做出的结论对总体具有充分 的代表性。 非随机抽样是从方便出发或根据研究者主观的 判断来抽取样本。非随机抽样主要依赖研究者 个人的经验和判断,它无法估计和控制抽样误 差,无法用样本的定量资料来推断总体。但非 随机抽样简单易行,尤其适用于做探索性研究。
分层抽样对比
STAT
分层抽样比简单随机抽样和等距抽样更为 精确,能够通过对较少的抽样单位的调查, 得到比较准确的推断结果,特别是当总体 较大、内部结构复杂时,分层抽样常能取 得令人满意的效果。同时,分层抽样在对 总体推断的同时,还能获得对每层的推断。
四、整群抽样
STATBiblioteka Baidu
前面所讲的几种方式都是按基本抽样单位抽样, 如果若干小的抽样单位可组合成一个较大的抽 样单位,抽样按大的抽样单位抽取,一旦某个 抽样单位被抽取,则调查其中每个小的抽样单 位,这种抽样称为整群抽样(cluster sampling) 。 例如,在对居民收入情况进行调查时,若以居 民小组为群,抽样时可先抽取居民小组,再调 查每个被抽到的居民小组中的每一居民户。
三、分层抽样
STAT
分层抽样(stratified sampling) 又称类型抽样, 它是先将总体所有单位按某些重要标志进行分 类(层),然后在各类(层)中采用简单随机抽样或 等距抽样方式抽取样本单位的一种抽样方式。 等比抽样
要求各类样本单位数的分配比例与 总体单位在各类的分配比例一致, 即ni /n=Ni/N
分层抽样
STAT
分层抽样
STAT
从图中可以看到,整个抽样过程是先按照教育程 度和性别将总体分为八层,根据各种教育程度在 总体中所占比例和各种教育程度中男女所占比例, 计算出每层的人数,再按照“1000/ 1000000= 1/1000”的比例从每一层中随机抽取子样本,八 个子样本合在一起即为样本。
五、多阶段抽样
STAT
以二级抽样为例,二级抽样是先将总体分为互 不重叠的若干部分(称为一级单元),从中随 机抽取一些一级单元,这是抽样的第一阶段; 再从这些抽中的一级单元中分别随机抽取子样 本,所有的子样本合起来构成样本,这是抽样 的第二阶段。分层抽样和整群抽样是二级抽样 的两种特殊形式。假设 5000 人中用二级抽样的 方法抽取100人的样本,
相关文档
最新文档