07第七章 等距抽样

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

三、中点等距抽样
1953年麦多为克服随机起点等距抽样容易 产生系统性偏差的缺点,提出中点等距抽 样(即抽取中心位置的样本)法:计算出抽 样间隔K后,以第一组的组中点为起点, 等距抽取单元组成样本。如果K为奇数, 以(K+1)/2为起点,K为偶数,以K/2或 (K+2)/2为起点。
四、对称等距抽样法
由于N不一定恰好是K的整数倍,所以按上述 方法得到的等距样本的样本量可能为
n [ N ]或n [ N ] 1
K
K
为避免这种样本量不能确定的情况,确保样 本量为n,1952年拉希里提出了循环等距抽 样的方法。
二、循环等距抽样
在N≠nK时,把总体中的N个单元按一定顺序排 列成一个首尾相接的环(圆形图),取最接近于 N/n的整数为抽样间隔K,然后在1到N的单元中, 随机抽取一个单元(设为第i单元)作为起点,再 沿着圆圈按一定方向每间隔K抽取一个单元,直 到抽够n个单元为止。按此方法,可以保证样本 量n不变。不过此时首尾两个样本单元的间隔不 一定恰好为K,它可能小于K,也可能大于K。
(5)若总体中的单元呈周期性的变化,等 距抽样的精度可能很高也可能很差。这时 要慎重地选择K。
第二节 等距抽样的实施方法
一、随机起点等距抽样 二、循环等距抽样 三、中点等距抽样 四、对称等距抽样法 五、两端修正法 六、总体有周期性变化时的等距抽样 七、累计和等距抽样
一、随机起点等距抽样
二、排ቤተ መጻሕፍቲ ባይዱ标志
等距抽样需要有作为排序依据的辅助标志。排序 标志各式各样,可自由选择,但归纳起来,可分 为两类,即无关标志和有关标志,它们对等距抽 样的作用和相应的估计精度各有不同的影响。
1、按无关标志排序
所谓无关标志排序,即用来对总体单元进 行排序的标志,与所要调查研究的标志是 不同性质的,二者没有任何必然的关系。 如研究人口的收入状况时,按身份证号码、 按门牌号码排序非常方便,一般说来,这 些号码与调查项目没有关系,因此可以认 为总体单元的次序排列是随机的,所以也 有人直接称无关标志排序的等距抽样为无 序等距抽样。
对称等距抽样也是针对有序等距抽样所提 出的,其基本思想是使低标志值的单元与 高标志值的单元在样本中对等出现。从而 使样本的偏差缩小,代表性增强。由于具 体的方法不同,对称等距抽样又有几种类 型。
1.塞蒂的方法——两两对称等距抽样
1965年塞蒂提出了一种新的等距抽样方 法——对称等距抽样法,以克服总体的线 性趋势对估计效率的影响。
三、等距抽样的特点
(1)将总体各单元按一定的顺序排列后再 抽样,使得样本单元的分布更加均匀,因 而样本也就更具代表性,比简单随机抽样 更精确,在某些场合下甚至可以不用抽样 框。并且如果能够利用好样本的相应顺序 在总体中均匀分布这一特点,则容易形成 一个按比例样本。
(2)等距抽样简单明了,快速经济,操作灵活方 便,使用面广,是单阶段抽样中变化最多的一种 抽样技术。等距抽样最初用于森林和土地使用情 况的调查,后来经过汉森、麦多、科克伦等学者 的努力,使其成为当今家计调查、记录抽样、空 间抽样、工业抽样和为普查取得附加信息及估计 非抽样误差的一种常用方法。在我国,等距抽样 已成了最主要、最基本的抽样方式,一些大规模 的抽样调查,如农产量抽样调查、城乡住户调查、 产品质量抽样检查中都普遍采用了等距抽样。
(3)当N=nK时,等距抽样就等同于每层只抽一个 单元的分层抽样或群的大小相等时只抽一个群 的整群抽样。
因为,这时,总体各单元可排列成如下方式: y11 y21 … yi1 yk1 y12 y22 … yi2 yk2
┋┋┋ ┋┋
y1n y2n … yin ykn
(4)等距抽样的样本常被视为一个集体单 元,一般不计算样本调查变量的方差,所 以它只能抽象地进行理论分析,而不能对 抽样方差进行估计。
设N=nK,n为偶数。抽样时,先把总体单元 分成n/2个抽样间隔,使每一抽样间隔含 有2K个单元。然后,在每一抽样间隔内, 抽取分别与两端距离相等的两个单元,这 样共抽取n个单元组成等距样本。
即:如果随机起点为i,则在第一个抽样间隔所 抽两个样本单元的号码分别为i及2K-i+1;在第 二 个 抽 样 间 隔 所 抽 两 个 样 本 单 元 号 码 为 i+2K 及 2(2K)-i+1;如此,最后在第n/2个抽样间隔所抽 两个样本单元号码分别为i+(n-2)K及nK-i+1。
中,
循环等距抽样从本质上看仍然是随机起点等距抽 样。
我们注意到,当N=nK时,在上述两种抽样实施方 法中,无论按哪一种方法,总体中每个单元的入 样概率都相等,从而是一种严格的等概率抽样。 但当N≠nK时,按第一种方法每一个单元的入样 概率依赖于初始值i,对不同的i,稍有不同。以 下为了处理方便,我们假定N总是n的整数倍。在 实际工作中,若n充分大,则由于N/n非整数而带 来的影响就充分小,可以忽略不计。
2、按有关标志排序
所谓有关标志排序,即用来对总体单元规 定排列次序的辅助标志,与调查标志具有 共同性质或密切关系。这种排序标志,在 我国抽样调查实践中有广泛应用,如农产 量调查,以本年平均亩产为调查变量,以 往年已知平均亩产作为排序标志。利用这 些辅助标志排序,有利于提高等距抽样的 抽样效果。
随机起点等距抽样就是前面概念所描述的方法。 具体地说,它是在总体单元排序后的第1至K单元 之间(第一个抽样间隔之内)随机抽取一个整数i, 以它作为起始单元的编号,以后按固定的顺序和 间隔依次在每个间隔之内各抽取一个单元组成等 距样本,则整个样本是由以下编号的单元所组成 的。
i+(j-1)K (j=1,2,…,n)
第七章 等距抽样
第一节 第二节 第三节 第四节
等距抽样概述 等距抽样的实施方法 总体参数的估计 其它形式的等距抽样
第一节 等距抽样概述
一、等距抽样的概念
等距抽样也称系统抽样或机械抽样。它是将总体 各抽样单元按一定的标志和顺序排列以后,每隔 一定的距离(间隔)抽取一个单元组成样本进行调 查。
相关文档
最新文档