最新抽样调查期末复习题

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1、简答题

1. 为什么分层抽样常在全国范围抽样调查中被采用? 答:(1)分层抽样不仅能对全国指标进行推算,还可以对各省、自治区、直辖市的指标进行推算。 (3分)

(2)各个层中分别独立地进行抽样,便于抽样工作的组织实施。(3分)

(3)由于各个地区发展不均衡,导致全国范围内差异较大,分层抽样的层间方差不进入估计误差,而层内的差异相对小一些,因此分层抽样可以提高估计精度,抽样效率较高。(2分)

(4)样本的分布更均匀,代表性更强,不会出现偏颇的情况。

2. 整群抽样的优缺点是什么?

答:整群抽样可以简化抽样框的编制。

样本单元比较集中,实施调查便利,且能节约费用。缺点是:当群内具有一定的相似性,而不同群之间的差别比较大时,相同样本量下整群抽样的抽样效率比简单随机抽样差。

3. 简述分层的原则及如何选择分层标志?

答:分层的原则是:一种是为了满足估计各层指标的需要或为了组织实施的便利。此时,应以需估计的子总体为层或单位自然构成的系统或类为层;另一种是尽可能提高抽样精度,分层应做到“层内差异大,层间差异小”。

最好直接以调查指标的数值作为选择分层标志,若做不到通常选择一个与调查指标有较大线性相关的指标作为分层标志。这个标志可以是调查指标的前期指标,也可以完全是另一个变量。

4. 为什么多阶抽样常在大型抽样调查中被采用? 答:(1)多阶抽样一方面保持了整群抽样的样本比较集中、便于调查、节省费用等优点,同时又避免了对小单元过多调查造成的浪费,充分发挥抽样调查的优点。(2)由于多阶抽样是分阶段实施的,因此,抽样框也可以分级进行准备,只需编制初级单元的抽样框,对抽中的初级单元再准备二阶抽样单元的抽样框,以此类推,对抽中的单元再准备下一级抽样单元的抽样框,从而大大降低了编制抽样框的工作量。所以多阶抽样常用于大范围的且抽样单元为各级行政单位的情况。对于大型调查中,抽样框变动非常频繁的情况,特别适合用多阶抽样。

2、 简单随机抽样

【例1.1】 我们从某个N=100的总体中抽出一个大小为n=10的简单随机样本,要估计总体平均水平并给出置信度为95%的区间估计。如表

解:依题意。N=100,n=10,1.0100

10

==

f

计算样本均值及样本方差为:

510

50

11==

=∑=n i i y n y 11.199

172)(11122

≈=--=∑=n i i

y y n s 因此对总体平均水平的估计为:

5ˆ==y Y

对的方差及标准差的估计为:

3115.1ˆ)ˆ(72.111.19101.011ˆ2≈=≈⨯-=-=)()(Y v Y

s S n f Y v

由置信度95%对应的t=1.96,因此,可以以95%的把握说总体平均水平大约在

3115.196.15⨯±之间,即2.4295~7.570之间。

【例1.2】(续例1.1)如果采取放回抽样,则相应结果为多少?

解:由上例知5105011===∑=n i i y n y ,11.199

172)(1112

2≈=--=∑=n i i

y y n s 3824

.1)(911.111.19101

12===⨯==

)()(y v y s S n y v

由置信度95%对应的1/2 1.96u α-=,因此,可以以95%的把握说总体平均水平大约在3824.196.15⨯±即[2.2905,7.7095]之间。

【例1.3】某销售公司希望了解全部3 000家客户对该公司的综合满意程度,决定用电话来调查一个简单随机样本。这时,销售公司希望以95%的把握保证客户满意的总体比例P 在样本比例p ±10%的范围内,但对总体比例P 无法给出一个大致的范围。这时,应该调查多少个客户,才能保证对总体比例估计的要求?(P30)

解:由该问题给出的条件:N=3 000,d=10%=0.1,置信度95%,对应的1/2 1.96u α-=,由于无法得到P 的初始估计值,因此取使方差达极大值的P=0.5,得到最保守的n :

221/2221.960.50.5960.1

u S n d α-⨯⨯≈=≈ 【例1.4】某居民区共10000户,欲估计该居民区的用水量。采用简单随机抽样抽选了100户,得样本均值为12.5吨,样本方差为1252吨。

(1)估计该居民区的总用水量的置信度95%的置信区间。

(2)若次年再进行调查,要求置信度95%的估计相对误差不超过20%,试问应抽多少户作样本?(P31) 解:(1)

25

.352061)(ˆ125000ˆ=-====s n

f N y Ns Y s y N Y

)( []25.19400475.55995ˆˆˆˆ%952121,)(),(的置信区间为:

的置信度为=⎥⎦⎤⎢⎣⎡+---Y s u Y Y s u Y Y α

α 或

612

.353831)(ˆ125000ˆ=≈-====n s N s n f N y Ns Y s y N Y

)( (2)

[]88.19435112.55648ˆˆˆˆ%952121,

)(),(的置信区间为:

的置信度为=⎥⎦

⎤⎢⎣⎡+---Y s u Y Y s u Y Y αα 715

9.71417705.76900

2

2

2

2/10≈=+

=≈==-N

n n n y r s u n )

(α

3、不等概率抽样

【例2.1】 某县农业局要调查全县养猪专业户全年生猪的出栏头数,并有全县365个养猪专业户上年末的生猪存栏数,各养猪专业户的饲养规模相差较大,决定以放回方式按与各养猪专业户上年末生猪存栏头数成正比的概率从中抽取30户进行调查,调查结果见表6.3。已知全县养猪专业户上年末生猪存栏数为9542头,试估计该县养猪专业户生猪出栏总头数

某县养猪专业户年生猪出栏头数调查样本资料 (单位: 头)

相关文档
最新文档