抽样学

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1、等距抽样有哪些特点?

(1)将总体各单元按一定的顺序排列后再抽样,使得样本单元的分布更加均匀,因而样本也就更具代表性,比简单随机抽样更精确,在某些场合下甚至可以不用抽样框。并且如果能够利用好样本的相应顺序在总体中均匀分布这一特点,则容易形成一个按比例样本。

(2)等距抽样简单明了,快速经济,操作灵活方便,使用面广,是单阶段抽样中变化最多的一种抽样技术。等距抽样最初用于森林和土地使用情况的调查,后来经过汉森、麦多、科克伦等学者的努力,使其成为当今家计调查、记录抽样、空间抽样、工业抽样和为普查取得附加信息及估计非抽样误差的一种常用方法。在我国,等距抽样已成了最主要、最基本的抽样方式,一些大规模的抽样调查,如农产量抽样调查、城乡住户调查、产品质量抽样检查中都普遍采用了等距抽样。

(3)当N=nK时,等距抽样就等同于每层只抽一个单元的分层抽样或群的大小相等时只抽一个群的整群抽样。

因为,这时,总体各单元可排列成如下方式:

y11y21…yi1yk1

y12y22…yi2yk2

┋┋┋┋┋

y1n y2n…yin ykn

(4)等距抽样的样本常被视为一个集体单元,一般不计算样本调查变量的方差,所以它只能抽象地进行理论分析,而不能对抽样方差进行估计。

(5)若总体中的单元呈周期性的变化,等距抽样的精度可能很高也可能很差。这时要慎重地选择K。

2、等距抽样的实施方法有哪些?

一、随机起点等距抽样二、循环等距抽样三、中点等距抽样四、对称等距抽样法

五、两端修正法六、总体有周期性变化时的等距抽样七、累计和等距抽样

3、何为周期性总体?如何提高周期性总体的等距抽样估计效果?

有一些总体,其单元的标志值在随时间的自然排列顺序中,会呈现某种明显或不明显的周期变化趋势。如季节性消费商品的销售量,随一年四季的变化而呈现出周期变化。还有些总体,反映出不明显的周期影响。对有周期变化趋势的总体进行等距抽样时,抽样间隔K 的选择,对估计效率的影响是极为重要的。为了说明问题,我们不妨假定总体单元标志值的变化为一正弦曲线。

2、多阶段抽样有哪些特点?

(一)便于组织抽样;

(二)抽样方式灵活,有利于提高抽样的估计效率;

(三)多阶段抽样对基本调查单元的抽选不是一步到位的;

(四)多阶段抽样实质上是分层抽样与整群抽样的有机结合;

(五)多阶抽样在抽样时并不需要二阶或更低阶单元的抽样框;

(六)多阶抽样还可用于“散料”的抽样,即散料抽样。

3、二阶段抽样与分层抽样及整群抽样的区别?

4、什么是二重抽样?其作用如何?

二重抽样也称二相抽样。其基本做法是:对于一个大总体,先从总体中随机抽取一个较大的样本(第一重样本),由此估计有关总体的结构或辅助指标以及其他有关信息,为第二重抽样估计提供条件;然后再从第一重样本中随机抽取一个较小的样本(第二重样本),利用这第二重样本,对总体所研究变量进行抽样推断。在某些情况下,也可在第二重样本中再抽第三重、第四重样本,由此形成多重抽样。其中二重抽样是最为常用的。

二重抽样的作用

在社会经济抽样调查中,二重抽样的主要作用有下列几方面:

第一,用于从总体所有基本单元中筛选确定出主调查对象。

第二,用于经常性调查。对于诸如居民的某些收入、居民基本生活支出、某些商品价格等指标,统计部门需经常了解。

第三,用于了解陌生总体内在结构或分布的大致情况,为抽样方法和抽样组织形式的选择提供依据。

第四,为分层抽样推断提供层权资料。分层抽样推断的前提是总体各单元能按分层标志进行归类并事先已知各层的层权。

第五,为比率估计和回归估计提供辅助资料。

第六,在经常性的多项目抽样调查中,用于解决不同调查项目需要不同样本容量的问题。

第七,用于研究样本轮换中的某些问题。

5、二重抽样与二阶段抽样的区别?

11、有一个总体含40个单位,各单位标志值大体上按由大到小顺序排队,总体均值

X =18.175。现将总体分为四层,每层含10个单位,见下表:

要求:按随机起点等距抽样和对称等距抽样计算等距抽样方差,并比较抽样效果。 (1)用系统抽样方差的定义来计算方差,并和简单随机抽样进行比较。 用系统抽样方差的定义:

62.11)(1)(2

1

=-=∑=Y Y K y V K i i sy

用简单随机抽样:

25.136)(1111

22

=--=∑∑==K i n

j ij Y Y N S 样本 层 1 2 3 4 5 6 7 8 9 10 Ⅰ Ⅱ Ⅲ Ⅳ

0 1 1 2 5 4 7 7 8 6 6 8 9 10 13 12 15 16 16 17 18 19 20 20 24 23 25 28 29 27 26 30 31 31 33 32 35 37 38 38 样本i x

12.5 14.5 15.25 15.75 18.75 17.75 20.5 22 22.75 22

66.30)40

41(425.136)1()(2=-=-=f n S y V srs 由于系统抽样按有关标志排队,其抽样方差小于简单随机抽样。

(2)用系统样本内的方差来表示系统抽样的方差。 系统样本内的方差: 62.161)()1(11

1

2=--=∑∑==i n

j ij

K

i wsy

y y

n K S

62.1162.16140

3

1025.1364039)1(1)(22=⨯⨯-⨯=---=

wsy sy S N n K S N N y V 计算结果与按系统抽样方差的定义计算的结果一致。同时也验证了由于

62.1612

=wsy S >25.1362=S ,因此系统抽样方差小于简单随机抽样。

12、欲调查4月份100家企业的某项指标,首先从100家企业中抽取了一个含有5家样本企业的简单随机样本,由于填报一个月的数据需要每天填写流水账,为了减轻样本企业的负担,调查人员对这5家企业分别在调查月内随机抽取3天作为调查日,要求样本企业只填写这3天的流水账。调查结果如下:

样本企业

第一日 第二日 第三日 1 2 3 4 5

57 38 51 48 62

59 41 60 53 55

64 50 63 49 54

要求:根据这些数据推算100家企业该指标的总量,并给出估计的95%的置信区间。 解:N=100;M=30;n=5;m=3。05.01005N n f 1===;1.030

3M m f 2===

样本企业

i y

22i s

1 2 3 4 5

60

43 58 50 57

13 39 39 7 19

==∑=n 1i i y n 1y 53.6; 2n 1i i 21)y y (1n 1s --=∑==49.3; ∑==n 1

i 22i 22s n 1s =23.4 2212211s f )1(s 1)(nm f n f y V -+-=

=3

523.4

05.0)1.01(3.49505.01⨯⨯-+⨯-=9.4372 计算Y

ˆ和)Y ˆ(v : 1608006.5330100y NM Y

ˆ=⨯⨯==

相关文档
最新文档