抽样调查-第7章系统抽样
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
返回
依某种随机化程序将总体单元重新排列
1
2
3
4
5 群平均
1
11 12 11 12 15 13.00
2
11 12 11 12 15 13.00
3
11 12 13 14 15 13.00
4
源自文库
11 12 13 14 15 13.00
S2 wsy
越大,系统抽样的
精度越高.为了提高系统抽样的精度,总体单元
的排列应尽可能增大样本内方差。
返回
形式二 系统抽样可看作一种特殊的整群抽样
系统抽样估计量的方差可以用样本内相关系数
wsy 表示:
V
(
y sy
)
S2 n
(
N 1)[1 N
(n
1) wsy
]
式中,wsy 为样本内相关系数。
wsy
Mi
i1
1870, n
3, k
M0 n
623
返回
从[1,k]中随机抽取一个整数 r=100,则代码 为:r=100,
r+k=100+623=723, r+2k=100+2×623=1346, 所对应的行政村入样,其序号依次为1,4,8.
在系统抽样中,对于特别大的单元一定要注意.
如果出现 M i k ,该单元肯定被抽入样本,而且还
返回
取系统样本的平均数作为总体均值 Y 的估计量:
y sy
yr
1 n
n j 1
yrj
性质1 当 N=nk 时,有k个可能样本:
E( ysy )
1 k
k r 1
yr
1 nk
k r 1
n j 1
yrj
Y
因此 ysy是无偏估计量。
k
但是当 N nk 时,采用直线等距抽样得到的 个可能样本所包含的单元数不全相等,因此 ysy
§7.1 引言
一、系统抽样的定义
系统抽样(systematic sampling)是将N个总体单元 按一定顺序排列,先随机抽取一个单元作为样本 的第一个单元,然后按某种确定的规则抽取其他 样本单元的一种抽样方法。
返回
系统抽样的特点
系统抽样是一种被广泛采用的抽样方法,系 统抽样比简单随机抽样易于操作,但抽样误差的 估计比较复杂。实践中,各种抽样调查,如人口 调查、产品质量调查、城乡居民调查等都普遍采 用系统抽样。
是有偏的。
返回
三、估计量方差的不同表示形式
为方便起见,以后均假定 N nk 时,系统 样本的平均数 ysy 作为总体均值的估计是无偏的。
它的方差按定义为:
V
( y sy )
E( y sy
Y )2
1 k
k
(yr
r 1
Y )2
下面给出方差的三种不同的表示形式。
形式一
用样本内方差
S2 wsy
表示系统抽样估
层内方差:
S 2 wst
1 n(k 1)
n j 1
k
( yrj
r 1
yj )2
同一系统内对层均值离差的相关系数:
wst
E( yrj y j )( yru E( yrj y j )2
yu )
二、估计量
假设起始值为R,相应系统样本的平均值为:
yr
1 n
n j 1
yrj
1 n
n
Yrj
j 1
(n1)k 2
Y Y ( j1)kr
(n1)k r
Y jk
Ynk
y2
yr
yk
返回
令 Yrj Y( j1)kr (r 1,2,,k; j 1,2,,n) 得下表:
1
1
Y11
2
Y21
r
Yr1
k Yk1
层平均 Y 1
2
Y12
Y22
Yr 2
Yk 2
Y2
j
Y1 j Y2 j
Yrj
Ykj
Yj
n 群平均
【例6.3】 设某总个体N=30个单元,总体单元排列
如下表,我们要产生一个样本量n=5为的系统样本, 试与其他抽样方法的结果进行比较。
返回
N=30,k=6, n=45 等距样本数据
1 2 3 4 5 群平均
1
11 12 13 14 15 13.00
2
11 12 13 14 15 13.00
3
11 12 13 14 15 13.00
n )[1
(n
1) wst
]
式中,S
2 wst
为层内方差;
wst 为同一系统样本内对层均值离差的
相关系数。
比较系统抽样方差 V (ysy )与比例分配的分层随机
抽样方差V ( yst ) ,比例分配的分层随机抽样总 体均值估计量的方差。
返回
V
(
y st
)
S2 wst n
(
N N
n)
因此当
V V
循环等距抽样
返回
3. 不等概系统抽样法
不等概系统抽样中每个单元的入样概率不相等.最常用
也是最简单的不等概系统抽样是PS抽样.即入样概率
与单元大小
i
M
i
成比例的系统抽样.令
N
M0 Mi
i1
表示总体所有单元大小的总和,则
i
n Mi M0
实施不等概系统抽样最简单的方法是代码法:
下面以例7.1来说明
【例7.1】设总体由10个行政村组成,N=10,每个行政村
的人数 Mi 见下表.利用PS系统抽样抽取n=3个行政村.
返回
用PS系统抽样抽选行政村
行政村编号 人数(Mi)
累计人数
抽中代码
1
103
103
100
2
432
535
3
96
631
4
246
877
723
5
84
961
6
73
1034
7
205
1239
8
168
1407
1346
9
146
1553
10
317
1870
M0
N
V ( ysy )
N 1S2 N
k(n 1) N
S2 wsy
N
1 S 2
k(n 1)
2
Sr
0
N
N
返回
(1) 以行为群的整群抽样或以行为“系统样本” 的系统抽样k=6,n=5.
V ( ysy )
N 1S2 N
k(n 1) N
S2 wsy
N
1 S 2
k(n 1)
2
Sr
0
N
N
返回
(2) 以列为群的整群抽样或以列为“系统样本” 的系统抽样k=5,n=6.
V ( ysy )
N 1S2 N
k(n 1) N
S2 wsy
N
1 S 2
k(n 1)
2
S.j
2
N
N
返回
(3)以行为层的分层随机抽样(每层抽1个单元) L=6,n=6,f=6/30.
V
(
y
st
)
1
n
f
L
Wh
S
2 h
h1
1 n
f
2
S r 0.333
(4)以列为层的分层随机抽样(每层抽1个单元) L=5,n=5,f=5/30.
系统抽样中最简单也是最常用的规则是等间隔 抽取,这种系统抽样又称等距抽样。
返回
二、系统抽样的一般方法 1.直线等距抽样 假设总体单元数为N,样本容量为n,N是n的整数倍.
首先计算抽样间距 k N ,把总体分为n段,每段k n
个单元,然后在第一段的k个单元中随机抽出一个 单元,假设为r,然后每隔k个单元抽出一个单元.即
4
11 12 13 14 15 13.00
5
11 12 13 14 15 13.00
6
11 12 13 14 15
层平均 11.00 12.00 13.00 14.00 15.00
层内方差 0 0 0 0 0
13.00 13.00
0
群内方差 2.5 2.5 2.5 2.5 2.5 2.5 2.5 2.07
V
(
y
st
)
1
n
f
L
Wh
S
2 h
h1
1 n
f
2
S.j 0
返回
(5)简单随机抽样n=5,f=5/30.
V ( y) 1 f S 2 0.345 n
(6)简单随机抽样n=6,f=6/30.
V ( y) 1 f S 2 0.276 n
返回
【评价】从上面的结果可以看出:
(1)像整群抽样一样,系统抽样的估计精度几乎完 全取决于其“系统样本”内差异与总体差异的对比。
Y1n
Y1
Y21
Y2
Yrn
Yr
Ykn
Yk
Yn
如果将每一行单元视为一个群,则总体由k个群组成
每个群的大小都是n。系统抽样就是从 Y11 ~ Yk1中任选
一个单元,被选中单元所在行的所有单元就构成系统抽样
的一个样本。
返回
§7.2 等概率系统抽样估计量
一、符号说明
第r行第j列的单元指标值:Yrj Yrj Y( j1)kr , r 1,2,, k; j 1,2,, n.
r k, r 2k,, 直到抽出n个单元.
返回
例如 某学院共有200个学生,要抽10个学生做样本
首先计算抽样间距
k N 200 20, n 10
然后在1~20中随机抽出一个数字,假设抽中 排在第3位的学生,则其余 样本单元依次为第23,43, 63,83,103,123,143,163, 183位共10个学生抽取.
V ( y srs )
N nS2 Nn
1 f n
S2
式中,S 2为总体方差;n为样本量;f为抽样比。
返回
比较等距抽样方差V ( ysy ) 和简单随机抽样方差 V ( ysrs ),
V ( y srs )
V
( y sy )
n
n
1
(
S
2 wsy
S2)
对于固定总体,总体方差是惟一确定的,因
此,系统样本内的方差
返回
例如总体有14个单元,欲抽取n=3,则 k N 4.7 n
取与之最近的整数 k 5. 然后在总体中随机抽取一个 单元作为起点,假设抽中3,即 r 3, 依次抽取r 3, r k 8, r 2k 13, 直到抽满。因此样本的编号为:
3,8,13。
7 6 54 3
8
9
2
10
1
11 12 13
系统抽样的缺点: 1.如果单元的排列存在周期性的变化,而抽样 者对此缺乏了解或缺乏处理经验,抽取的样本 的代表性就可能很差。 2.系统抽样的方差估计较为复杂,一般不存 在无偏估计量。
返回
五、系统抽样、整群抽样和分层抽样的关系
系统抽样既可以看成一种特殊的整群抽样, 又可以看成一种特殊的分层抽样。下面以一般 的等距抽样为例说明:
( (
y sy y st
) )
1
(n
1)
wst
wst 0时, 系统抽样的精度低于分层随机抽样;
wst 0时, 系统抽样的精度与各层抽取一个单元
的分层随机抽样相同;
wst 0时, 系统抽样的精度高于分层随机抽样。
返回
下面通过一个模拟的例子说明系统抽样与其他抽 样方法的联系,并对不同抽样方法的效果进行比较。
总体单元数:N
样本单元数:n
系统样本平均数: yr
1 n
n i1
yrj
系统样本均值估计量:y sy
层 均 值:y j , j 1,2,, n
总体方差:S 2
系统样本内方差:S
2 wsy
1 k(n 1)
k r 1
n
( yrj
j 1
yr )2
返回
样本内相关系数:
wsy
E( yrj Y )( yru Y ) E( yrj Y )2
(2)系统抽样与其他抽样方法相比其优劣难以定论, 可能好也可能差,这完全取决于其“系统样本”内差异 与总体差异的对比,而这个对比则取决于系统抽样中 的总体单元排列顺序。
(3)另外三种方法的比较同样难定优劣,都需要具 体情况具体分析。
我们下面将上表中总体单元的顺序重新排列,来研 究总体单元不同排列对系统抽样的影响。
返回
2.循环等距抽样
当N不是n的整数倍,即抽样间距
kN n
不是整数时,实际抽取的样本量是不确定的,每个
总体单元入样的概率也是不等的,这时用直线等距
抽样就有可能产生偏倚,若采用循环等距抽样则可
以解决此问题.
其方法是将N个总体单元排成首尾相接的一个
圆从1到N中随机抽取一个起点作为起始单元,然后
每隔k个单元抽出一个,直到抽出n个单元为止.
2 (n 1)(N
1)S 2
k r 1
n
( yrj
ju
Y )( yru
Y)
系统样本内正相关越大,即系统内单元越 相似,则估计量方差越大,等距抽样精度越差。
返回
形式三、系统抽样可看做一种特殊的分层
抽样,系统抽样估计量的方差可以用层内
方差
S
2 wst
和
表示:
wst
V
(
y sy
)
S2 wst n
(
N N
假设抽样间距为k,总体单元数为N=nk。将总体 的N个单元排列成k行n列,如下表所示。表中的每 一行单元都是系统抽样的一个样本。
返回
系统抽样的总体单元
1
2
j
n 平均
1 2
r
k
Y1
Y Y Y k1
( j1)k 1
y (n1)k 1
1
Y2
Yr
Yk
Yk 2
Yk r
Y2k
Y Y ( j1)k2
返回
从上表可计算出:
总体方差
S 2 2.07
平均群(行)内方差
2
S r.
1 (2.5 2.5 2.5) 2.5
6
平均层(列)内方差
2
S.j
1 (0 0 0) 0
5
下面我们按不同的抽样方法计算总体均值 估计量的方差。
返回
(1) 以行为群的整群抽样或以行为“系统样本” 的系统抽样k=6,n=5.
可能被重复抽到.为了避免这种情况,可以事先将这 些单元抽出直接入样.
返回
三、总体单元的排序
系统抽样时N个总体单元的排序情况 大致有以下三种:
(1)按无关标志排队 (2)按有关标志排队 (3)介于上述两者之间
返回
四、系统抽样的优缺点 系统抽样的优点:
1.简便易行,容易确定样本单元
2.样本单元在总体中分布比较均匀
计量的方差。
V
( y sy
)
N 1S N
2
k(n 1) N
S2 wsy
返回
式中,S 2
1k N 1 r1
n
( yrj
j 1
Y )2
为总体方差;
S 2 wsy
1 k(n 1)
k r 1
n
( yrj
j 1
yr )2
为样本内方差。
如果从总体N中直接抽取样本量为n的简单随机
样本,则总体均值 Y 的估计量 yrsy的方差为:
依某种随机化程序将总体单元重新排列
1
2
3
4
5 群平均
1
11 12 11 12 15 13.00
2
11 12 11 12 15 13.00
3
11 12 13 14 15 13.00
4
源自文库
11 12 13 14 15 13.00
S2 wsy
越大,系统抽样的
精度越高.为了提高系统抽样的精度,总体单元
的排列应尽可能增大样本内方差。
返回
形式二 系统抽样可看作一种特殊的整群抽样
系统抽样估计量的方差可以用样本内相关系数
wsy 表示:
V
(
y sy
)
S2 n
(
N 1)[1 N
(n
1) wsy
]
式中,wsy 为样本内相关系数。
wsy
Mi
i1
1870, n
3, k
M0 n
623
返回
从[1,k]中随机抽取一个整数 r=100,则代码 为:r=100,
r+k=100+623=723, r+2k=100+2×623=1346, 所对应的行政村入样,其序号依次为1,4,8.
在系统抽样中,对于特别大的单元一定要注意.
如果出现 M i k ,该单元肯定被抽入样本,而且还
返回
取系统样本的平均数作为总体均值 Y 的估计量:
y sy
yr
1 n
n j 1
yrj
性质1 当 N=nk 时,有k个可能样本:
E( ysy )
1 k
k r 1
yr
1 nk
k r 1
n j 1
yrj
Y
因此 ysy是无偏估计量。
k
但是当 N nk 时,采用直线等距抽样得到的 个可能样本所包含的单元数不全相等,因此 ysy
§7.1 引言
一、系统抽样的定义
系统抽样(systematic sampling)是将N个总体单元 按一定顺序排列,先随机抽取一个单元作为样本 的第一个单元,然后按某种确定的规则抽取其他 样本单元的一种抽样方法。
返回
系统抽样的特点
系统抽样是一种被广泛采用的抽样方法,系 统抽样比简单随机抽样易于操作,但抽样误差的 估计比较复杂。实践中,各种抽样调查,如人口 调查、产品质量调查、城乡居民调查等都普遍采 用系统抽样。
是有偏的。
返回
三、估计量方差的不同表示形式
为方便起见,以后均假定 N nk 时,系统 样本的平均数 ysy 作为总体均值的估计是无偏的。
它的方差按定义为:
V
( y sy )
E( y sy
Y )2
1 k
k
(yr
r 1
Y )2
下面给出方差的三种不同的表示形式。
形式一
用样本内方差
S2 wsy
表示系统抽样估
层内方差:
S 2 wst
1 n(k 1)
n j 1
k
( yrj
r 1
yj )2
同一系统内对层均值离差的相关系数:
wst
E( yrj y j )( yru E( yrj y j )2
yu )
二、估计量
假设起始值为R,相应系统样本的平均值为:
yr
1 n
n j 1
yrj
1 n
n
Yrj
j 1
(n1)k 2
Y Y ( j1)kr
(n1)k r
Y jk
Ynk
y2
yr
yk
返回
令 Yrj Y( j1)kr (r 1,2,,k; j 1,2,,n) 得下表:
1
1
Y11
2
Y21
r
Yr1
k Yk1
层平均 Y 1
2
Y12
Y22
Yr 2
Yk 2
Y2
j
Y1 j Y2 j
Yrj
Ykj
Yj
n 群平均
【例6.3】 设某总个体N=30个单元,总体单元排列
如下表,我们要产生一个样本量n=5为的系统样本, 试与其他抽样方法的结果进行比较。
返回
N=30,k=6, n=45 等距样本数据
1 2 3 4 5 群平均
1
11 12 13 14 15 13.00
2
11 12 13 14 15 13.00
3
11 12 13 14 15 13.00
n )[1
(n
1) wst
]
式中,S
2 wst
为层内方差;
wst 为同一系统样本内对层均值离差的
相关系数。
比较系统抽样方差 V (ysy )与比例分配的分层随机
抽样方差V ( yst ) ,比例分配的分层随机抽样总 体均值估计量的方差。
返回
V
(
y st
)
S2 wst n
(
N N
n)
因此当
V V
循环等距抽样
返回
3. 不等概系统抽样法
不等概系统抽样中每个单元的入样概率不相等.最常用
也是最简单的不等概系统抽样是PS抽样.即入样概率
与单元大小
i
M
i
成比例的系统抽样.令
N
M0 Mi
i1
表示总体所有单元大小的总和,则
i
n Mi M0
实施不等概系统抽样最简单的方法是代码法:
下面以例7.1来说明
【例7.1】设总体由10个行政村组成,N=10,每个行政村
的人数 Mi 见下表.利用PS系统抽样抽取n=3个行政村.
返回
用PS系统抽样抽选行政村
行政村编号 人数(Mi)
累计人数
抽中代码
1
103
103
100
2
432
535
3
96
631
4
246
877
723
5
84
961
6
73
1034
7
205
1239
8
168
1407
1346
9
146
1553
10
317
1870
M0
N
V ( ysy )
N 1S2 N
k(n 1) N
S2 wsy
N
1 S 2
k(n 1)
2
Sr
0
N
N
返回
(1) 以行为群的整群抽样或以行为“系统样本” 的系统抽样k=6,n=5.
V ( ysy )
N 1S2 N
k(n 1) N
S2 wsy
N
1 S 2
k(n 1)
2
Sr
0
N
N
返回
(2) 以列为群的整群抽样或以列为“系统样本” 的系统抽样k=5,n=6.
V ( ysy )
N 1S2 N
k(n 1) N
S2 wsy
N
1 S 2
k(n 1)
2
S.j
2
N
N
返回
(3)以行为层的分层随机抽样(每层抽1个单元) L=6,n=6,f=6/30.
V
(
y
st
)
1
n
f
L
Wh
S
2 h
h1
1 n
f
2
S r 0.333
(4)以列为层的分层随机抽样(每层抽1个单元) L=5,n=5,f=5/30.
系统抽样中最简单也是最常用的规则是等间隔 抽取,这种系统抽样又称等距抽样。
返回
二、系统抽样的一般方法 1.直线等距抽样 假设总体单元数为N,样本容量为n,N是n的整数倍.
首先计算抽样间距 k N ,把总体分为n段,每段k n
个单元,然后在第一段的k个单元中随机抽出一个 单元,假设为r,然后每隔k个单元抽出一个单元.即
4
11 12 13 14 15 13.00
5
11 12 13 14 15 13.00
6
11 12 13 14 15
层平均 11.00 12.00 13.00 14.00 15.00
层内方差 0 0 0 0 0
13.00 13.00
0
群内方差 2.5 2.5 2.5 2.5 2.5 2.5 2.5 2.07
V
(
y
st
)
1
n
f
L
Wh
S
2 h
h1
1 n
f
2
S.j 0
返回
(5)简单随机抽样n=5,f=5/30.
V ( y) 1 f S 2 0.345 n
(6)简单随机抽样n=6,f=6/30.
V ( y) 1 f S 2 0.276 n
返回
【评价】从上面的结果可以看出:
(1)像整群抽样一样,系统抽样的估计精度几乎完 全取决于其“系统样本”内差异与总体差异的对比。
Y1n
Y1
Y21
Y2
Yrn
Yr
Ykn
Yk
Yn
如果将每一行单元视为一个群,则总体由k个群组成
每个群的大小都是n。系统抽样就是从 Y11 ~ Yk1中任选
一个单元,被选中单元所在行的所有单元就构成系统抽样
的一个样本。
返回
§7.2 等概率系统抽样估计量
一、符号说明
第r行第j列的单元指标值:Yrj Yrj Y( j1)kr , r 1,2,, k; j 1,2,, n.
r k, r 2k,, 直到抽出n个单元.
返回
例如 某学院共有200个学生,要抽10个学生做样本
首先计算抽样间距
k N 200 20, n 10
然后在1~20中随机抽出一个数字,假设抽中 排在第3位的学生,则其余 样本单元依次为第23,43, 63,83,103,123,143,163, 183位共10个学生抽取.
V ( y srs )
N nS2 Nn
1 f n
S2
式中,S 2为总体方差;n为样本量;f为抽样比。
返回
比较等距抽样方差V ( ysy ) 和简单随机抽样方差 V ( ysrs ),
V ( y srs )
V
( y sy )
n
n
1
(
S
2 wsy
S2)
对于固定总体,总体方差是惟一确定的,因
此,系统样本内的方差
返回
例如总体有14个单元,欲抽取n=3,则 k N 4.7 n
取与之最近的整数 k 5. 然后在总体中随机抽取一个 单元作为起点,假设抽中3,即 r 3, 依次抽取r 3, r k 8, r 2k 13, 直到抽满。因此样本的编号为:
3,8,13。
7 6 54 3
8
9
2
10
1
11 12 13
系统抽样的缺点: 1.如果单元的排列存在周期性的变化,而抽样 者对此缺乏了解或缺乏处理经验,抽取的样本 的代表性就可能很差。 2.系统抽样的方差估计较为复杂,一般不存 在无偏估计量。
返回
五、系统抽样、整群抽样和分层抽样的关系
系统抽样既可以看成一种特殊的整群抽样, 又可以看成一种特殊的分层抽样。下面以一般 的等距抽样为例说明:
( (
y sy y st
) )
1
(n
1)
wst
wst 0时, 系统抽样的精度低于分层随机抽样;
wst 0时, 系统抽样的精度与各层抽取一个单元
的分层随机抽样相同;
wst 0时, 系统抽样的精度高于分层随机抽样。
返回
下面通过一个模拟的例子说明系统抽样与其他抽 样方法的联系,并对不同抽样方法的效果进行比较。
总体单元数:N
样本单元数:n
系统样本平均数: yr
1 n
n i1
yrj
系统样本均值估计量:y sy
层 均 值:y j , j 1,2,, n
总体方差:S 2
系统样本内方差:S
2 wsy
1 k(n 1)
k r 1
n
( yrj
j 1
yr )2
返回
样本内相关系数:
wsy
E( yrj Y )( yru Y ) E( yrj Y )2
(2)系统抽样与其他抽样方法相比其优劣难以定论, 可能好也可能差,这完全取决于其“系统样本”内差异 与总体差异的对比,而这个对比则取决于系统抽样中 的总体单元排列顺序。
(3)另外三种方法的比较同样难定优劣,都需要具 体情况具体分析。
我们下面将上表中总体单元的顺序重新排列,来研 究总体单元不同排列对系统抽样的影响。
返回
2.循环等距抽样
当N不是n的整数倍,即抽样间距
kN n
不是整数时,实际抽取的样本量是不确定的,每个
总体单元入样的概率也是不等的,这时用直线等距
抽样就有可能产生偏倚,若采用循环等距抽样则可
以解决此问题.
其方法是将N个总体单元排成首尾相接的一个
圆从1到N中随机抽取一个起点作为起始单元,然后
每隔k个单元抽出一个,直到抽出n个单元为止.
2 (n 1)(N
1)S 2
k r 1
n
( yrj
ju
Y )( yru
Y)
系统样本内正相关越大,即系统内单元越 相似,则估计量方差越大,等距抽样精度越差。
返回
形式三、系统抽样可看做一种特殊的分层
抽样,系统抽样估计量的方差可以用层内
方差
S
2 wst
和
表示:
wst
V
(
y sy
)
S2 wst n
(
N N
假设抽样间距为k,总体单元数为N=nk。将总体 的N个单元排列成k行n列,如下表所示。表中的每 一行单元都是系统抽样的一个样本。
返回
系统抽样的总体单元
1
2
j
n 平均
1 2
r
k
Y1
Y Y Y k1
( j1)k 1
y (n1)k 1
1
Y2
Yr
Yk
Yk 2
Yk r
Y2k
Y Y ( j1)k2
返回
从上表可计算出:
总体方差
S 2 2.07
平均群(行)内方差
2
S r.
1 (2.5 2.5 2.5) 2.5
6
平均层(列)内方差
2
S.j
1 (0 0 0) 0
5
下面我们按不同的抽样方法计算总体均值 估计量的方差。
返回
(1) 以行为群的整群抽样或以行为“系统样本” 的系统抽样k=6,n=5.
可能被重复抽到.为了避免这种情况,可以事先将这 些单元抽出直接入样.
返回
三、总体单元的排序
系统抽样时N个总体单元的排序情况 大致有以下三种:
(1)按无关标志排队 (2)按有关标志排队 (3)介于上述两者之间
返回
四、系统抽样的优缺点 系统抽样的优点:
1.简便易行,容易确定样本单元
2.样本单元在总体中分布比较均匀
计量的方差。
V
( y sy
)
N 1S N
2
k(n 1) N
S2 wsy
返回
式中,S 2
1k N 1 r1
n
( yrj
j 1
Y )2
为总体方差;
S 2 wsy
1 k(n 1)
k r 1
n
( yrj
j 1
yr )2
为样本内方差。
如果从总体N中直接抽取样本量为n的简单随机
样本,则总体均值 Y 的估计量 yrsy的方差为: