第二章 基本抽样方法

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一,简单随机抽样的抽样误差 一,简单随机抽样的抽样误差 放回简单随机抽样 放回简单随机抽样 不放回简单随机抽样 不放回简单随机抽样 标准误差的意义 标准误差的意义
二,简单随机抽样的样本规模 二,简单随机抽样的样本规模 样本规模又称样本容量,是指样本中所包 含元素的数量.样本规模一方面会影响到 样本的代表性,另一方面,则直接影响到 调查成本的大小.太小的样本其代表性可 能较差,但太大的样本又会增加不必要的 成本.因此,在实际抽样中,选择合适的 样本规模是非常重要的.
另一种方法适用于等比例分层抽样.先将 所有总体元素按分层变量进行分层,然后 将各层的总体元素一层一层连续排列,最 后对连续排列的总体元素进行等距抽样.
四,整群抽样 整群抽样(c1uster sampling)是先将总体划 整群抽样(c1uster sampling)是先将总体划 分成若干个群(视为初级单位),每个群 包含若干个次级单位,然后以一定方式从 总体中抽取一部分群,并由中选群中的所 有次级单位构成总体的样本.
这样一来,规模大的群以大概率入样,规模小的 群以小概率入样.由于抽取PSU的过程是不等概 群以小概率入样.由于抽取PSU的过程是不等概 率抽样,因此如果要保证总抽样比不变,就需要 以一个固定的样本规模从抽中的PSU内抽取样本 以一个固定的样本规模从抽中的PSU内抽取样本 单位. 因为如果抽取的单位规模对每个PSU都一样,那 因为如果抽取的单位规模对每个PSU都一样,那 单位入样的概率就会与群的规模成反比.这样大 概率抽取群,小概率抽取样本单位,一大一小相 互抵消,就保证了总体单位抽取的等概率性.与 此同时,由于不论PSU大小,都抽取固定规模的 此同时,由于不论PSU大小,都抽取固定规模的 样本单位,于是也控制了样本规模的变动.
第二节 一阶段抽样 一阶段抽样
在抽样中,如果样本是一次直接从抽样框 中抽出的,则称之为一阶段抽样.它是最 基本的抽样方法,其他形式的抽样方法都 是在此基础上发展出来的.
一,简单随机抽样 一,简单随机抽样 简单随机抽样(simple 简单随机抽样(simple random sampling)也 sampling)也 称纯随机抽样,是严格按照随机原则从含 有N个单位的总体中抽取n个单位组成样 个单位的总体中抽取n 本(N>n),在抽样过程中总体的每个单 本(N>n),在抽样过程中总体的每个单 位都有同等的机会入选样本,而且每个单 位的抽取都是相互独立的.
(一)影响样本规模的因素 首先,抽样精度是指抽样中希望达到的精 确度,其实就是能够容忍的抽样误差e 确度,其实就是能够容忍的抽样误差e. 其次,总体标准差α 其次,总体标准差α是反映总体元素间异质 性程度的指标,一般说来,在给定抽样精 度后,总体异质性程度越小,所需样本规 模也越小,反之亦然.

(三)分层抽取样本的方法 (三)分层抽取样本的方法 在分层抽样中,有两种常见的样本抽取方法. 一种方法是先将所有总体元素按分层变量 进行分层,并计算各层在总体中的比例. 接着如果采用等比例分层抽样,则直接将 总体比例视为样本比例;如果采用不等比 例分层抽样,则需要对样本比例做一定的 调整.最后,再按确定的样本比例,用简 单随机或系统抽样方法,抽出适量的样本 元素.
第三节 多阶段抽样 多阶段抽样
一,按规模分层抽样 在多阶段抽样中,最初从总体中抽出的群 被称为初级抽样单位(primary 被称为初级抽样单位(primary sampling unit, unit, PSU),如果PSU的规模相等,用简单随机 PSU),如果PSU的规模相等,用简单随机 抽样或等距抽样方法,直接进行第二阶段 的抽样,这时第二级单位是等概率入样的, 而且样本规模是常数.这个原则也适用于 更多阶段的抽样.
主要方法: 抽签法 抽签法 随机数法 随机数法
二,系统抽样 二,系统抽样 实际抽样中经常采用的是系统抽样 (systematic sampling),又称机械抽样,即 sampling),又称机械抽样,即 将N个总体单位按一定顺序排列,然后 先随机抽取一个单位作为起始单位,再按 某种确定的规则抽取其他 某种确定的规则抽取其他n-1个样本单 位.
(一)整数抽样间距 (一)整数抽样间距 (二)非整数抽样间距 (二)非整数抽样间距 (三)总体单位的排列 (三)总体单位的排列
பைடு நூலகம்
三,分层抽样 分层抽样(stratified sampling)也称类型抽 分层抽样(stratified sampling)也称类型抽 样,是先将总体 样,是先将总体N个单位,按某种特征 划分成若干个子总体,称为层,然后在每 个层中分别独立地进行抽样,最后,将抽 出的子样本合起来构成总体的样本. 出的子样本合起来构成总体的样本.
(一)样本量在各层的分配 (一)样本量在各层的分配 最常见的样本量分配方式是按比例分配 (proportional allocation),即各层的子样本 allocation),即各层的子样本 单位在总样本中所占的比例,与各层单位 在总体中所占的比例完全相同.
(二)层的划分 (二)层的划分 理论上,按调查目标变量进行分层是最好 的,但在调查之前目标变量的值是不知道 的,因此只能是根据与目标变量最相关的 辅助变量进行分层,常用的辅助变量包括 性别,年龄,职业,教育程度,收入,地 域,民族和宗教等.
三,规模测量值 进行PPS抽样的一个前提条件是要在具体抽 进行PPS抽样的一个前提条件是要在具体抽 样前,知道各级抽样单位的规模.可是在 抽样前一般无法确切知道抽样单位的实际 规模,为了能使用PPS方法,只能代之以各 规模,为了能使用PPS方法,只能代之以各 级抽样单位规模的估计值 级抽样单位规模的估计值M,称为规模 测量值(measure size).估计值可以从 测量值(measure of size).估计值可以从 离调查时点最近的一次普查资料或其他统 计资料中查找到.
第四节 抽样误差与样本规模 抽样误差与样本规模
实际抽样中, 实际抽样中,影响样本代表性的有两类误差: 抽样误差和非抽样误差.其中抽样误差是 一种随机误差. 抽样中的随机误差并非都是抽样误差,有 些可能是由于调查人员的失误引起的非抽 样误差.它是由于样本范围与总体范围的 差异而引起的误差,无论抽样设计多么精 致,都会产生抽样误差.不过在概率抽样 中,抽样误差是可以估算出来的.
二,PPS抽样 二,PPS抽样 在PPS抽样中,第一阶段抽样即抽取PSU的 PPS抽样中,第一阶段抽样即抽取PSU的 阶段,要先放弃等概率抽样条件,采用 "概率与规模成比例"(probability 概率与规模成比例" proportional to size,PPS)的方法,即赋予 size,PPS)的方法,即赋予 规模不等的群与其规模(或辅助变量)成 比例的入样概率.
(一)群的性质 (一)群的性质 群的划分可以遵循以下原则:群内方差尽 可能大,群间方差尽可能小,即群内各单 位的差异尽可能大,群与群之间的差异尽 可能小.这个原则与分层原则恰好相反, 简言之,异质的群,同质的层. 简言之,异质的群,同质的层.
(二)规模不等的群 为了保证样本单位满足等概率原则,可以 采取相应措施来控制样本规模的变动.一 方面可以按群的大小进行分层,然后对各 个层使用相同的抽样比. 个层使用相同的抽样比.
第二章 基本抽样方法
基本抽样技术是指调查研究中,设计抽样 方案所依赖的一些基本设计要素.具体说 来,这些基本抽样技术包括抽样框的制定, 一阶段抽样,多阶段抽样,估计抽样误差 和确定样本规模.
第一节 调查总体与抽样框 调查总体与抽样框
抽样一般包括以下几个步骤: 确定总体(population) 确定总体(population) 抽样框(sampling frame) 抽样框(sampling frame) 制定抽样方案 实际抽取样本 评估样本质量.
相关文档
最新文档