抽样技术期末论文分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
盐城师范学院
抽样调查技术与技能期末论文
题目: 《系统抽样与其他抽样的方法的联系,以及不同抽样方法的效果》
姓名: 崔亚楠
二级学院: 数学科学学院专业: 统计学
班级: 统计学131班学号: 13213205 成绩评定:
引言
1、申明
为处理方便起见,以下只讨论系统抽样,且总是假定N是n的整数倍,即N=nk的情形。在这一情况之下,直线和圆形等距抽样的结果一致,样本量一样,尤其关键的是这可以保证各个单元的入样概率都相等。
2、符号说明
为了方便讨论,将总体的N个单元(实际上是抽样框的N个抽样单元)排列成k行n列,如表1所示。
各符号的含义如下:
总体单元数:N
样本单元数:n
Y-+
第r行第j列的单元变量值:(1)
j k r
第r 行对应变量的总体均值 :r Y ⋅,r Y ⋅=(1)11j k r n
j Y n -+=∑
第j 列对应的变量的总体均值 :j Y ⋅,j Y ⋅=(1)1
1j k r k
r Y k -+=∑
注意表1中主区(上下左右去掉一行或者一列剩余的部分)共有k 行n 列,显然每行都是系统抽样的一个可能样本,所以系统抽样可以看做按简单随机抽样方式(由随机起点的抽法以及牵一发动全身的特性所决定)从k 行中抽取一行,每行被抽中的等概率都等于1/k 这种说法与第2章里关于简单随机抽样为从所有(等概率的)可能样本中随机抽出一个样本的第一种定义是吻合的。
如果表1中的第r 行第j 列的单元变量值改记为rj Y ,则
(1)rj j k r Y Y -+=, r=1,2,…,n; j=1,2,…,n
则表1的内容就将变成表2。
这一变换将导致一系列令人兴奋的结果:如果将每一行的单元视为群,总体由k 个群组成,每个群的大小都是n ,则系统抽样可以看成从k 个群中随机抽取
一个群的特殊整群抽样。而如果将每一列单元视为一层,则总体由n 个层组成,每个层的大小都是k ,则系统抽样可以看成从n 个层中各取一个单元的特殊分层抽样,所谓特殊是指这里的群与层更多是形式上的而不是本质上的,不是自然存在的,而是完全取决于单元的排序结果。例如由于上述系统抽样的样本单元在各层的位置相同,就和分层随机抽样中层的构成有很大不同。同时,由于系统抽样的所有可能样本对应于总体全部单元的某一排列顺序,而简单随机抽样所有可能样本则对应于总体全部单元的所有而非某一排列顺序,系统抽样的所有可能样本
的数目只有k 个,而简单随机抽样所有可能样本的数目有n N C 个,因而系统抽样
的所有可能样本属于简单随机抽样所有可能样本的一个特殊部分,故系统抽样又可以看成一种特殊的简单随机抽样。
总体均值:11
111
1rj rj
k n
k n
r j r j Y Y Y N
nk =====
=∑∑∑∑
总体方差;()
()
2
2
2
11
11
1111rj rj k n
k n
r j r j S Y Y Y Y N nk =====-=---∑∑∑∑ 总体“群”平均:r r Y Y ⋅=()1
11,2,,n
rj j Y r k n ===∑L
样本“群”平均:11
11n n
r rj rj r j j y y Y Y n n =====∑∑ (r=1,2,…,k )
注意:这里隐含着抽样类文献的一个普遍假设,变量值的取得过程即实地调查环节不产生任何误差。如果缺乏这一假设,根据误差公理rj rj y Y =,因而r r y Y =是根本不可能的 。
二、下面通过一个例子
1、
表3
根据表有
总体方差:28.53S =
平均群(行)内方差:2r S =1
3(9.17+9.17+9.17)=9.17
平均层(列)内方差:()21
000010
j S ⋅=+++=L
计算每种抽样的总体均值估计量的方差。
(1)以行为群的整体抽样或者以行为“系统样本”的系统抽样:k=3,n=10,
2
2221(1)1(1)()0wsy sy r N k n N k n V y S S S S N N N N
----=
-=-≈
(2)以列为群(系统样本)的整体抽样或者以列为“系统样本”的系统抽样:k=3,n=10,
22221(1)1(1)()8.25wsy sy j N k n N k n V y S S S S N N N N
⋅----=
-=-≈
(3)以行为层的分层随机抽样(每层抽一个单元):L=3,n=3,f=3/30
22
1
11() 2.75L
st h h r h f
f V y W S S n
n
=--=
=
≈∑
(4) 以列为层的分层随机抽样(每层抽一个单元):L=10,n=10,f=10/30
221
11()0j L
st h h h f
f
V y W S S n
n
⋅=--=
=
=∑
(5)简单随机抽样:n=10,f=10/30。
2
1()0.57f V y S n
-=
≈
(6)简单随机抽样:n=3,f=3/30。
2
1() 2.56f V y S n
-=
≈ 2、 下面将表3中的总体单元的顺序重新排列形成表4