抽样调查第7章系统抽样

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
假设抽样间距为k,总体单元数为N=nk。将总体 的N个单元排列成k行n列,如下表所示。表中的每 一行单元都是系统抽样的一个样本。
返回
系统抽样的总体单元
1
2
j
n 平均
1 2
r
k
Y1
Y Y Y k1
( j1)k 1
y (n1)k 1
1
Y2
Yr
Yk
Yk 2
Yk r
Y2k
Y Y ( j1)k2
r k, r 2k,, 直到抽出n个单元.
返回
例如 某学院共有200个学生,要抽10个学生做样本
首先计算抽样间距
k N 200 20, n 10
然后在1~20中随机抽出一个数字,假设抽中 排在第3位的学生,则其余 样本单元依次为第23,43, 63,83,103,123,143,163, 183位共10个学生抽取.
返回
2.循环等距抽样
当N不是n的整数倍,即抽样间距
kN n
不是整数时,实际抽取的样本量是不确定的,每个
总体单元入样的概率也是不等的,这时用直线等距
抽样就有可能产生偏倚,若采用循环等距抽样则可
以解决此问题.
其方法是将N个总体单元排成首尾相接的一个
圆从1到N中随机抽取一个起点作为起始单元,然后
每隔k个单元抽出一个,直到抽出n个单元为止.
可能被重复抽到.为了避免这种情况,可以事先将这 些单元抽出直接入样.
返回
三、总体单元的排序
系统抽样时N个总体单元的排序情况 大致有以下三种:
(1)按无关标志排队 (2)按有关标志排队 (3)介于上述两者之间
返回
四、系统抽样的优缺点 系统抽样的优点:
1.简便易行,容易确定样本单元
2.样本单元在总体中分布比较均匀
§7.1 引言
一、系统抽样的定义
系统抽样(systematic sampling)是将N个总体单元 按一定顺序排列,先随机抽取一个单元作为样本 的第一个单元,然后按某种确定的规则抽取其他 样本单元的一种抽样方法。
返回
系统抽样的特点
系统抽样是一种被广泛采用的抽样方法,系 统抽样比简单随机抽样易于操作,但抽样误差的 估计比较复杂。实践中,各种抽样调查,如人口 调查、产品质量调查、城乡居民调查等都普遍采 用系统抽样。
返回
取系统样本的平均数作为总体均值 Y 的估计量:
总体单元数:N
样本单元数:n
系统样本平均数: yr
1 n
n i1
yrj
系统样本均值估计量:y sy
层 均 值:y j , j 1,2,, n
总体方差:S 2
系统样本内方差:S
2 wsy
1 k(n 1)
k r 1
n
( yrj
j 1
yr )2
返回
样本内相关系数:
wsy
E( yrj Y )( yru Y ) E( yrj Y )2
(n1)k 2
Y Y ( j1)kr
(n1)k r
Baidu Nhomakorabea
Y jk
Ynk
y2
yr
yk
返回
令 Yrj Y( j1)kr (r 1,2,,k; j 1,2,,n) 得下表:
1
1
Y11
2
Y21
r
Yr1
k Yk1
层平均 Y 1
2
Y12
Y22
Yr 2
Yk 2
Y2
j
Y1 j Y2 j
Yrj
Ykj
Yj
n 群平均
系统抽样中最简单也是最常用的规则是等间隔 抽取,这种系统抽样又称等距抽样。
返回
二、系统抽样的一般方法 1.直线等距抽样 假设总体单元数为N,样本容量为n,N是n的整数倍.
首先计算抽样间距 k N ,把总体分为n段,每段k n
个单元,然后在第一段的k个单元中随机抽出一个 单元,假设为r,然后每隔k个单元抽出一个单元.即
Y1n
Y1
Y21
Y2
Yrn
Yr
Ykn
Yk
Yn
如果将每一行单元视为一个群,则总体由k个群组成
每个群的大小都是n。系统抽样就是从 Y11 ~ Yk1中任选
一个单元,被选中单元所在行的所有单元就构成系统抽样
的一个样本。
返回
§7.2 等概率系统抽样估计量
一、符号说明
第r行第j列的单元指标值:Yrj Yrj Y( j1)kr , r 1,2,, k; j 1,2,, n.
Mi
i1
1870, n
3, k
M0 n
623
返回
从[1,k]中随机抽取一个整数 r=100,则代码 为:r=100,
r+k=100+623=723, r+2k=100+2×623=1346, 所对应的行政村入样,其序号依次为1,4,8.
在系统抽样中,对于特别大的单元一定要注意.
如果出现 M i k ,该单元肯定被抽入样本,而且还
循环等距抽样
返回
3. 不等概系统抽样法
不等概系统抽样中每个单元的入样概率不相等.最常用
也是最简单的不等概系统抽样是PS抽样.即入样概率
与单元大小
i
M
i
成比例的系统抽样.令
N
M0 Mi
i1
表示总体所有单元大小的总和,则
i
n Mi M0
实施不等概系统抽样最简单的方法是代码法:
下面以例7.1来说明
【例7.1】设总体由10个行政村组成,N=10,每个行政村
层内方差:
S 2 wst
1 n(k 1)
n j 1
k
( yrj
r 1
yj )2
同一系统内对层均值离差的相关系数:
wst
E( yrj y j )( yru E( yrj y j )2
yu )
二、估计量
假设起始值为R,相应系统样本的平均值为:
yr
1 n
n j 1
yrj
1 n
n
Yrj
j 1
的人数 Mi 见下表.利用PS系统抽样抽取n=3个行政村.
返回
用PS系统抽样抽选行政村
行政村编号 人数(Mi)
累计人数
抽中代码
1
103
103
100
2
432
535
3
96
631
4
246
877
723
5
84
961
6
73
1034
7
205
1239
8
168
1407
1346
9
146
1553
10
317
1870
M0
N
返回
例如总体有14个单元,欲抽取n=3,则 k N 4.7 n
取与之最近的整数 k 5. 然后在总体中随机抽取一个 单元作为起点,假设抽中3,即 r 3, 依次抽取r 3, r k 8, r 2k 13, 直到抽满。因此样本的编号为:
3,8,13。
7 6 54 3
8
9
2
10
1
11 12 13
系统抽样的缺点: 1.如果单元的排列存在周期性的变化,而抽样 者对此缺乏了解或缺乏处理经验,抽取的样本 的代表性就可能很差。 2.系统抽样的方差估计较为复杂,一般不存 在无偏估计量。
返回
五、系统抽样、整群抽样和分层抽样的关系
系统抽样既可以看成一种特殊的整群抽样, 又可以看成一种特殊的分层抽样。下面以一般 的等距抽样为例说明:
相关文档
最新文档