第八章 系统抽样

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

r 2 jk,2( j 1)k r 1
j=0,1,2,…,n/2-1
13
2.修正系统抽样法(总体对称抽样法)
在总体单位数为n×k的线性趋势排列总体中,对应 于抽样单位数n,计算一个正整数K(k为抽样距离)。对 号码1至K作随机抽样。若第r号单位入样(1≤r≤K), 则K+r, 2K+r, „„, (n-1)K-r+1, nK-r+1号单位皆 入样。按这种抽样方法所取得的样本称为修正系统抽样 样本。 平衡系统抽样法的抽样模型为:
N n S2 v y N n

17
以上分析告诉我们,等距抽样时样本内各单位的差异较大, 抽样精度较高;反之,抽样精度就低。这与下面进一步考察等 距样本内一对单位之间的相关系数后所得揭露是一致的。 在同一等距样本内,两个单位之间的总体相关系数为:
w
E yij Y

总的来说,等距抽样估计量的方差大小主要与总体内各单位的 排列状况有关。 1. 总体内各单位的排列是随机的,这时 w 0,当N充分大时, V y sy V y。值得注意的是:当n、k给定时,等距抽样估计量 的方差 V y sy 仅有k个自由度,它与简单随机抽样估计量的方差一 般不相等。但对任意给定的N个单位 X1 , X 2 ,… X N , 其不同的 全排列方法有N!种,每种情况为一个随机排列的有限总体。对这
8
Yi
四、有序排列下的系统抽样
简称有序等距抽样,是指用与调查目的有关的标志值作为 总体各单位排队的依据,在排队后的基础上再进行系统抽样。 当总体各单位标志值按由大到小的变化趋势排列后,总体 被改造为完全或近似地呈递增或递减的线性趋势总体。这是总 体各单位标志值 Yi 与其排队顺序i(i=1,3,…,N)之间, 为一种完全或近似的现行趋势关系,可用直线方程表示为:
1 N 1 U i N i 1 2
N
的均值和方差分别为:
1 V U N
U
N i 1
i
U

2
N 2 1 12
Y
的均值和方差分别为:
1 Y N
1 Yi N i 1
1 N
N
1 i N i 1
i
N
N 1 i 2 i 1
E yij Y

y
ik
Y


2


N!个有限总体,等距抽样平均数来说相当于简单随机抽样。
18
2. 当总体内各单位的排列顺序具有依数值由大到小的线性趋势 时,从中抽取的等距样本单位差异较大,一般有 w 0 ,如 N也较大,可知:
V y来自百度文库sy V y


比较以上各式(N>k),故可得如下结论,在总体内各单位 的排列具有线性趋势时,一般有下列关系存在: V y st V y sy V y
N
V Y
Y
N i 1
Y

2

2 N 2 1
12
10
当总体呈线性趋势时,样本观测值可能会偏低或偏高,产生 “趋向性的偏差”,对此统计学家们采用了很多方法来弥补这一不 足。 (一)首尾校正法 即将不加权的均值估计量改为加权的估计,加权时样本中所 有中间单位的权数都是1,但对样本的第一个和最后一个单位赋予 不同的权。若设我们在1到k中所抽到的随机数是i,则首尾两个单 位的权数就是:

(二)总体单位排序与其标志值的大小有某种周 期性的关系
当总体各单位的排列顺序与其标志值的大小有某种周期性的 关系时,就有可能出现样本各单位的标志值都是一个相同数字的 情况。在这种情况下,系统样本对总体完全没有代表性。为了防 止出现这种情况,在采用线性系统抽样时,应注意避免抽样的规 律与现象变动的周期相一致。

二、系统抽样的基本方式
系统抽样与其他抽样方法所不同的一个最显著 的特点,就是系统抽样只需要抽取一个样本单位, 然后按照某种规律,顺次地得到整个样本。这里所 提到的“某种规律”,就是指样本单位抽取的一种 事先的规定和安排。在此基础上,系统抽样又可以 划分为若干种具体的系统抽样方法。其中,线性系 统抽样是一种最基本的方法 。


2
2 S2 若 Swsy
,则等距抽样均值估计量的方差小于简单随机抽样。
这是因为:若 y 是容量为n的一个简单随机样本的均值,则
N 1 2 k n 1 2 N n S2 若要 v y sy v y ,当且仅当 S Swsy N N N n N n 2 2 2 S k n 1 S 即 k n 1 Swsy N 1 N 2 2 S S 这等价于 wsy

11
(二)中心系统抽样法
在一个总体单位数为n×k的线性趋势排列总体中, 对应于抽样单位数n,计算一个正整数K(K为抽样距离), 并将总体视为K组,然后,在总体的第一组中,取位置居 中的单位 Yk 作为抽样起点,并依抽样距离K,依次取 2 出 Y ,Y ,…… Y ,入样(即取各组组中心位 置所在单位入样)。按这种方法取得的样本称为中心系 统样本。 中心系统抽样法的抽样模型为:
5
(二)圆圈系统抽样
在前述的线性系统抽样中,我们假定了N是n的整数 倍,这种假定有时并不能得到满足,即 N可能并不是 n 的整数倍。为了解决这一问题,D.B.拉希里(D.B.Lahiri) 于1952年提出了一种改进的线性系统抽样法——圆圈系统 抽样法。其具体做法是:将总体N个单位的排序看作为一 个首尾相连的圆圈,取最接近N/n 的整数为k , 在总体N 个单位中随机地抽取一个单位为随机起点i,沿圆圈按顺 时针方向每隔k 个单位抽取一个单位,直到抽出n个单位 为止。如 N=21,n=4, 取 k=5。设随机 起点为 i=3,则应抽取的样本单位编 号依次为:3,8,13,18,如下图所 示,○表示随机起点,□表示所抽中 的其它样本单位。
18 16 14 12 10 8 6 4 2 0 50-60 70-80
35% 30% 25% 20%
`
15% 10% 5% 0% 90-100
第八章
系统抽样
本章要点
本章将对系统抽样这种具有简便易行、样 本分布均匀、估计效率较高等多方面优点的 抽样组织方式进行介绍,以便在实践中灵活 加以应用。具体要求: ①正确理解系统抽样的基本思想和方式; ②掌握系统抽样的估计量及其性质; ③熟知系统抽样估计量方差的样本估计方 式; ④对系统抽样的相关问题有所了解。



特别:n=1时,上式中的等号才成立。
19
第三节 估计量方差的样本估计
20
一、纯随机抽样估计法
从平均意义上讲,无序等距抽样类似于简单随机抽样,故 估计量的方差为: 2
v y sy
Yi i
Yi
(i=1,3,…,A)
作变换

U i 即: Ui i
则总体按新变量 Ui i 排列为:
1 K+1 … (n-1)K+1 2 … i K +2 … K+i … … … (n-1)K+2 … (n-1)K+i … K … 2K … … nK
9
易证新变量 Ui i
4
(一)线性系统抽样
即对于一个容量为A的总体,欲从中抽出一个容 量为n的样本。首先将总体各单位按任意的顺序排列 并编号,然后计算一个正整数 k=N/n (这里假定A 是a的整数倍,称k 为抽样距离),将总体分为n段, 每段包含k 个总体单位。再从第一段的k个单位中, 随机抽出一个单位,假设其编号为第r号,然后每隔 k个单位抽出一个单位,即编号为r+k, r+2k, „, r+(n-1)k单位皆被抽中。 线性系统抽样法的抽样模型为: r + (j-1)k (j = 1,2,„,n; r为随机数)

(四)总体各单位按某种“负相关”的趋势排列
这里又分为两种情况:一种是总体各单位的标志值奇数层顺 排列而偶数层反排列;另一种是总体中上一半单位的标志值顺排 列而下一半单位的标志值反排列。实际上,在这种负相关趋势排 列的情况下,线性系统抽样法的估值精度最高。后面我们将说明: 对于这种负相关趋势采用线性系统抽样法与对线性趋势总体采用 对称系统抽样法的效果完全相同。因此,对线性趋势总体下的系 统抽样或称为有序排列下的系统抽样的研究是十分重要的。
6
三、总体单位排序与系统抽样的关系

(一)总体单位随机排序
对于总体各单位的某一种特定的排列顺序,线性系统抽样的 效果可能优于简单随机抽样,也可能劣于简单随机抽样,无法预 言。但从一个容量为N的总体来讲,就其全部总体单位所有的N! 种排列顺序而言,线性系统抽样的平均估值精度等于简单随机抽 样估值的精度。因此,在这种情况下,线性系统抽样的估计效率 与简单随机抽样估计效率相同。在抽样实践中,总体各单位按随 机顺序排列下的线性系统抽样,称为无关标志排队等距抽样。
K K 2
2K K 2
n 1 K
K 2

K jK 2
j=0,1,2,…,n-1
12
(三)对称系统抽样法
1984年1月,我国国家统计局在《农村抽样调查网点 抽选方案》(初稿)中,决定采用“有关标志排队等距抽 样方法”。这里应当指出,我国所采用的方法,从方法上 讲属于平衡系统抽样法类型,下面分别介绍这两种方法。 1.平衡系统抽样法(分组对称抽样法) 在总体单位数为n×k的线性趋势排列总体中,对应 于抽样单位数n,计算一个正整数K(k为抽样距离)。对 号码得K作随机抽样。若第r号单位入样(1≤r≤K),则 2K-r+1, 2K+r, 4K-r+1, 4K+r,„„, (n-2)K+r, nK-r+1 号单位皆入样。按这种抽样方法所取得的样本称为平衡系 统抽样样本。 平衡系统抽样法的抽样模型为
k
n
rj
Y
二.估计量的方差
估计量 y sy 的方差为:
v y sy E y i. Y

y
2 k i 1
i.
Y

2
1 k Pi y i. Y K i 1


2
16
2 Swsy S2
2 S 记等距样本内的方差为 wsy ,
S
2 wsy
k n 1 yij y i. k n 1 i 1 j 1
7

(三)总体单位排序有线性趋势
当总体各单位与其排列顺序有某种线性趋势关系时,对于一 般的系统抽样法(即线性系统抽样法)来讲,可以证明:其抽样估 值精度虽优于简单随机抽样,但劣于分层随机抽样。其原因在于 对有线性趋势的总体,采用线性系统抽样法,可能会使所抽样本 产生一种“趋向性”的偏差。统计学家们发现:在总体呈现这种 “线性趋势”或“单调上升或下降趋势”时,采用中心位置的系 统抽样法或对称的系统抽样法,可以大大地改善系统抽样法的估 值精度。
n 2i K 1 i 2 n 1 K
其中,“+”号用于样本的第一个单位,“-”号用于样本 的最末一个单位,则对于任意的i,这两个权数之和为2。可以证 明,若总体是一个由线性趋势排列所构成的,且N=nk,则加权 的线性系统样本的均值就是总体均值的无偏估计量。
nK 1 nK 1 E y E Y 2 2
2
第一节
抽样方式
3

一、系统抽样的基本思想
对于一个容量为N的总体,首先,将总体中各单 位按某种顺序编为从1到A 的号码。若要从中抽出一 个容量为n的样本,则应先从编号为1到k(k<N)的k个 单位中,随机地抽取一个单位,然后,按照一定的 规律,如每隔k个单位抽出一个单位等,顺次地抽出 n个样本单位。
r jk , N r jk 1
j=0,1,2,„,n/2-1(n为偶数)
1 r jk , N r jk 1, r n 1 k 2
j=0,1,2,…,(n-1)/2-1(n为奇数)
14
第二节 等概率系统抽样的 估计量及其方差
15
一.估计量
设系统抽样的随机起点值为r,则其相应系统样本的均值为:
1 n 1 n y sy yrj Yrj n j 1 n j 1
为总体均值 Y 的估计量。 当N=n k时,可以证明这个估计量是无偏的。
E y sy

1 k 1 yr k r 1 nk
y
r 1 j 1
相关文档
最新文档