抽样调查习题集 - 360文档中心

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

抽样调查》复习题
一概述
1.1结合以下所列情况讨论哪些适合用全面调查，哪些适合用抽样调查，并说明理由；
1.研究居住在某城市所有居民的食品消费结构；
2.调查一个县各村的粮食播种面积和全县生猪的存栏头数；
3.为进行治疗，调查一地区小学生中患沙眼的人数；
4.调查一地区结核病的发生率；
5.估计一个水库中草鱼的数量；
6.某企业想了解其产品在市场的占有率；
7.调查一个县中小学教师月平均工资。

1.2结合习题 1.1 的讨论，你能否概括在什么场合作全面调查，什么场合适合做抽样调查。

1.3讨论以下所列情况是否属于概率抽样，并说明理由：
1.从一个包含有100只兔子的实验室大笼子里抓10 只兔子做实验。

研究人员不经任何挑选抓到哪只就算那一只，抓满10 只为止。

2•将笼中的100只兔子编上1〜100号，任意列出10个不重复的数字（为1〜100之间的整数），以相应的兔子作为抽中作试验的样本；
3.从钱包中随便抽出一纸币，凡兔子号码尾数与该纸币编号尾数相同者及作为抽中的样本。

1.4某刊物对其读者进行调查，调查表随刊物送到读者手中，对寄回的调查表进行分析。

试问这是不是一项抽样调查？样本抽取是不是属于概率抽样？为什么？
1.5结合习题 1.3 与 1.4 的讨论，根据你的理解什么是概率抽样？什么是非概率抽样？它们各有什么优点？
1.6怎样理解抽样调查的科学性?
1.7抽样调查基础理论及其意义；
1.8抽样调查的特点。

二抽样调查基本原理
2.1试说明以下术语或概念之间的关系与区别；
1.总体、样本与个体；
2.总体与抽样框；
3.个体、抽样单元与抽样框。

2.2试说明以下术语或概念之间的关系与区别；
1.均方误差、方差与偏倚；
2.方差、标准差与标准误；
3.无偏估计、祥和估计量与可用估计量；
4.绝对误差限、置信限（置信区间）与置信度。

2.3样本可能数目及其意义；
2.4影响抽样误差的因素；
2.5抽样分布及其意义；
2.6抽样估计的基本原理；
2.7置信区间的确定。

三简单随机抽样
3.1设总体N=5，其指标值为{3 , 5, 6, 7, 9}
2 2
1•计算总体方差和S ；
2•从中抽取n=2的随机样本，分别计算放回抽样和不放回抽样的方差
V®）；
3•按不放回抽样列出所有可能的样本并计算 y ，验证E （y ） =Y ；
4.
按不放回抽样的所有可能的样本，计算其方差 v
（y ），并与公式计算的结果进行比较；
5•对所有的可能样本计算样本方差
S 2,并验证在不放回的情况下： E （S 2） = s 2。

3.2 在一森林抽样调查中，某林场共有1000公顷林地，随机布设了 50块面积为0.06公顷的方形样
地，测得这 50块样地的平均储蓄量为 9m 3,标准差为1.63卅，试以95%勺置信度估计该林场的木材储蓄量。

3.3某居民区共有10000户，现用抽样调查的方法估计该区居民的用水量。

采用简单随机
抽样抽选了 100户，得y=12.5 , S 2
=1252。

估计该居民区的总用水量 95%的置信区间。

若要求估计的相对误差不超过 20%,试问应抽多少户做样本？
3.4
某工厂欲制定工作定额，估计所需平均操作时间，从全厂 98名从事该项作业的工人
中随机抽选8人，其操作时间分别为 4.2, 5.1 , 7.9, 3.8, 5.3, 4.6, 5.1 , 4.1 （单位：分），
试以95%的置信度估计该项作业平均所需时间的置信区间。

3.6某县采用简单随机抽样估计粮食、棉花、大豆的播种面积，抽样单元为农户。

根据以往资料其变量
的变异系数为
名称粮食棉花大豆变异系数 0.38
0.39 0.44
若要求以上各个项目的置信度为
95%相对误差不超过 4%需要抽取多少户？若用这一样
本估计粮食的播种面积，其精度是多少？
3.7
假设总体中每个单元有两个指标值 Y 和X , i=1，…，N,记y,为相应的简单随机样
本的均值。

试证：
（1）样本均值y =1 J y i 是总体均值的无偏估计; n y
1 - f
2 2
⑵ Var(y) S 2
,其中，S 2
n
3.8 简单随机抽样在抽样技术中的地位；
3.9
简单随机抽样中样本量确定的原则及主要考虑因素。

N _
"(Y i -Y)2.
i =1
四分层抽样
4.1 一公司希望估计某一个月内由于事故引起的工时损失。

因工人、技术人员及行政管
若样本量n=30，试用Neyman分配确定各层的样本量。

4.2 上题中若实际调查了18个工人，10个技术人员，2个行政人员，其中损失的工时数如下：
试估计总的工时损失数并给出它的置信度为95%勺置信区间。

4.3调查某个地区的养牛头数，以村作为抽样单元。

根据村的海拔高度和人口密度划分成四层，每层取
(1)估计该地区养牛总头数Y及其估计量的相对标准误差s(Y?). Y?
(2)讨论分层抽样与不分层抽样比较效率有否提高。

(3)若样本量不变采用Neymar分配可以减少方差多少？
4.4怎样分层能提高精度？
4.5总样本量在各层间分配的方法有哪些？
4.6分层的原则及其意义。

五比估计与回归估计
5.1 N=6
(1)n=2R R
无偏的？若有偏，偏倚多大？
⑵若用n=2的简单样本去估计总体总量Y，试比较比估计与简单估计的方差。

5.2 欲估计某小区居民的食品支出占总收入的比重，该地区共有150户，现用简单随机
抽样抽取14户为样本，经调查每户的食品支出y i与总收入X i的数据如下表：
要求估计食品支出占收入比重的95%置信度的置信区间。

5.3 某养兔专业户购进100只兔子，平均重量为3.1磅，随机抽取了10只兔子为样本，记录其重量，经过两个月的饲养，现欲了解其平均重量，经过称重，其资料如下：
要求：
（1）用回归估计法估计每只兔现有的重量，并计算其方差的近似估计量。

（2）若每只兔的平均重量允许最大误差为0.05磅，置信度为95%，应该取多少只兔为样本？
5.4 某县欲调查某种农作物的产量，由于平原和山区的产量有差别，故拟划分平原和山区
两层采用分层抽样。

同时当年产量与去年产量之间有相关关系，故还计划采用比估计方法。

已知平原共有120个村，去年总产量为24500（百斤），山区共有180个村，去年总产为21200
（百斤）。

现从平原用简单随机抽样抽取6个村，从山区抽取9个村，两年的产量资料如下：
山区
试用分别比估计与联合比估计分别估计当年的总产量，给出估计量的标准误，并对上述两种结果进行比较和分析。

5.5 回归估计、比估计与简单估计间的区别； 5.6
辅助变量的选择原则；
六整群抽样
6.1若欲调查城市的猪肉人均消费量，讨论下列情况下采用街道作为群的整群抽样是否合适，如果不合
适你认为采用什么抽样方式好。

（1）少数民族的居住比较集中；
（2）少数民族比较均匀得分布在各街道；（3）少数民族分散在各街道但比重不同。

6.2汽车运输公司抽样检查在使用的车辆中不安全轮胎的比例，
在175辆车中抽取了 25辆,
其不安全轮胎数如下：
七多阶抽样
7.1苗圃职工用二阶抽样方法估计树苗的平均高度，该苗圃共有
N=50块地，先从中抽取
10块地，再从每块抽中的地块中抽 ___ 10%的树苗，对抽中的苗木测量其高度取得资料如下：地块（
i ） |秧苗数（MJ |抽样数（mJ |苗木高度y j
1 5
2 5 12,11,12,10,1
3 2 56 6 10,9,7,9,8,10 3 60 6 6,5,7,5,6,
4 4 46
5 7,8,7,7,
6 5 49 5 10,11,13,12,12 6 51 5 14,15,13,12,13
7 50 5 6,7,6,8,7,
8 61 6 9,10,8,9,9,10
9 60 6 7,10,8,9,9,10 10
45
6
12,11,12,13,12,,12
已知共有M 0=2600株苗木
试证：若Sf 0，则上述简单随机样本比直接从全体次级单元中抽取的样本量为 n 的简单
随机样本更有效，如果 n /N 忽略不计，则两组样本同样有效。

7.3多阶抽样与单阶抽样的关系；
7.4二阶抽样与整群抽样和分层抽样的关系。

(1)
若两阶抽样都是简单随机的，调查结果用加权平均数
匕「M i y i 来估计
M 0n i =1
(2)
s
总体均值，求估计值 Y ⑴，并计算
? 1 n 抽样方法同(1),但估计量不加权，即用丫⑵=1
a y i ，求估计值并计算 n 7
v(Y?⑵)
(3) 抽样方法不变，使用比估计，即丫?(3)=晋，求估计值及其标准误差心
(4)
讨论上述三种方法的适用条件
7.2假设总体初级单元的大小均为 M 。

为了估计总体均值
Y (按次级单元)，采用如下的二
阶抽样法，先随机地抽取 n 个初级单元，然后从每个初级单元中抽取一个次级单元。

记
其中
S 12
(Y i -丫)2
S ；
N(M -1) i d j d (Y j
-丫
i
)。