抽样调查习题集
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样调查》复习题
一概述
1.1结合以下所列情况讨论哪些适合用全面调查,哪些适合用抽样调查,并说明理由;
1.研究居住在某城市所有居民的食品消费结构;
2.调查一个县各村的粮食播种面积和全县生猪的存栏头数;
3.为进行治疗,调查一地区小学生中患沙眼的人数;
4.调查一地区结核病的发生率;
5.估计一个水库中草鱼的数量;
6.某企业想了解其产品在市场的占有率;
7.调查一个县中小学教师月平均工资。
1.2结合习题 1.1 的讨论,你能否概括在什么场合作全面调查,什么场合适合做抽样调查。
1.3讨论以下所列情况是否属于概率抽样,并说明理由:
1.从一个包含有100只兔子的实验室大笼子里抓10 只兔子做实验。
研究人员不经任何挑选抓到哪只就算那一只,抓满10 只为止。
2•将笼中的100只兔子编上1〜100号,任意列出10个不重复的数字(为1〜100之间的整数),以相应的兔子作为抽中作试验的样本;
3.从钱包中随便抽出一纸币,凡兔子号码尾数与该纸币编号尾数相同者及作为抽中的样本。
1.4某刊物对其读者进行调查,调查表随刊物送到读者手中,对寄回的调查表进行分析。
试问这是不是一项抽样调查?样本抽取是不是属于概率抽样?为什么?
1.5结合习题 1.3 与 1.4 的讨论,根据你的理解什么是概率抽样?什么是非概率抽样?它们各有什么优点?
1.6怎样理解抽样调查的科学性?
1.7抽样调查基础理论及其意义;
1.8抽样调查的特点。
二抽样调查基本原理
2.1试说明以下术语或概念之间的关系与区别;
1.总体、样本与个体;
2.总体与抽样框;
3.个体、抽样单元与抽样框。
2.2试说明以下术语或概念之间的关系与区别;
1.均方误差、方差与偏倚;
2.方差、标准差与标准误;
3.无偏估计、祥和估计量与可用估计量;
4.绝对误差限、置信限(置信区间)与置信度。
2.3样本可能数目及其意义;
2.4影响抽样误差的因素;
2.5抽样分布及其意义;
2.6抽样估计的基本原理;
2.7置信区间的确定。
三简单随机抽样
3.1设总体N=5,其指标值为{3 , 5, 6, 7, 9}
2 2
1•计算总体方差和S ;
2•从中抽取n=2的随机样本,分别计算放回抽样和不放回抽样的方差
V®);
3•按不放回抽样列出所有可能的样本并计算 y ,验证E (y ) =Y ;
4.
按不放回抽样的所有可能的样本,计算其方差 v
(y ),并与公式计算的结果进行比较;
5•对所有的可能样本计算样本方差
S 2,并验证在不放回的情况下: E (S 2) = s 2。
3.2 在一森林抽样调查中, 某林场共有1000公顷林地,随机布设了 50块面积为0.06公顷 的方形样
地,测得这 50块样地的平均储蓄量为 9m 3,标准差为1.63卅,试以95%勺置信度 估计该林场的木材储蓄量。
3.3某居民区共有10000户,现用抽样调查的方法估计该区居民的用水量。
采用简单随机
抽样抽选了 100户,得y=12.5 , S 2
=1252。
估计该居民区的总用水量 95%的置信区间。
若要 求估计的相对误差不超过 20%,试问应抽多少户做样本?
3.4
某工厂欲制定工作定额,估计所需平均操作时间,从全厂 98名从事该项作业的工人
中随机抽选8人,其操作时间分别为 4.2, 5.1 , 7.9, 3.8, 5.3, 4.6, 5.1 , 4.1 (单位:分),
试以95%的置信度估计该项作业平均所需时间的置信区间。
3.6某县采用简单随机抽样估计粮食、棉花、大豆的播种面积,抽样单元为农户。
根据以 往资料其变量
的变异系数为
名称 粮食 棉花 大豆 变异系数 0.38
0.39 0.44
若要求以上各个项目的置信度为
95%相对误差不超过 4%需要抽取多少户?若用这一样
本估计粮食的播种面积,其精度是多少?
3.7
假设总体中每个单元有两个指标值 Y 和X , i=1,…,N,记y,为相应的简单随机样
本的均值。
试证:
(1)样本均值y =1 J y i 是总体均值的无偏估计; n y
1 - f
2 2
⑵ Var(y) S 2
,其中,S 2
n
3.8 简单随机抽样在抽样技术中的地位;
3.9
简单随机抽样中样本量确定的原则及主要考虑因素。
N _
"(Y i -Y)2.
i =1
四分层抽样
4.1 一公司希望估计某一个月内由于事故引起的工时损失。
因工人、技术人员及行政管
若样本量n=30,试用Neyman分配确定各层的样本量。
4.2 上题中若实际调查了18个工人,10个技术人员,2个行政人员,其中损失的工时数如下:
试估计总的工时损失数并给出它的置信度为95%勺置信区间。
4.3调查某个地区的养牛头数,以村作为抽样单元。
根据村的海拔高度和人口密度划分成四层,每层取
(1)估计该地区养牛总头数Y及其估计量的相对标准误差s(Y?). Y?
(2)讨论分层抽样与不分层抽样比较效率有否提高。
(3)若样本量不变采用Neymar分配可以减少方差多少?
4.4怎样分层能提高精度?
4.5总样本量在各层间分配的方法有哪些?
4.6分层的原则及其意义。
五比估计与回归估计
5.1 N=6
(1)n=2R R
无偏的?若有偏,偏倚多大?
⑵若用n=2的简单样本去估计总体总量Y,试比较比估计与简单估计的方差。
5.2 欲估计某小区居民的食品支出占总收入的比重,该地区共有150户,现用简单随机
抽样抽取14户为样本,经调查每户的食品支出y i与总收入X i的数据如下表:
要求估计食品支出占收入比重的95%置信度的置信区间。
5.3 某养兔专业户购进100只兔子,平均重量为3.1磅,随机抽取了10只兔子为样本,记录其重量,经过两个月的饲养,现欲了解其平均重量,经过称重,其资料如下:
要求:
(1)用回归估计法估计每只兔现有的重量,并计算其方差的近似估计量。
(2)若每只兔的平均重量允许最大误差为0.05磅,置信度为95%,应该取多少只兔为样本?
5.4 某县欲调查某种农作物的产量,由于平原和山区的产量有差别,故拟划分平原和山区
两层采用分层抽样。
同时当年产量与去年产量之间有相关关系,故还计划采用比估计方法。
已知平原共有120个村,去年总产量为24500(百斤),山区共有180个村,去年总产为21200
(百斤)。
现从平原用简单随机抽样抽取6个村,从山区抽取9个村,两年的产量资料如下:
山区
试用分别比估计与联合比估计分别估计当年的总产量,给出估计量的标准误,并对上述两 种结果进行比较和分析。
5.5 回归估计、比估计与简单估计间的区别; 5.6
辅助变量的选择原则;
六整群抽样
6.1若欲调查城市的猪肉人均消费量,讨论下列情况下采用街道作为群的整群抽样是否合 适,如果不合
适你认为采用什么抽样方式好。
(1) 少数民族的居住比较集中;
(2) 少数民族比较均匀得分布在各街道; (3) 少数民族分散在各街道但比重不同。
6.2汽车运输公司抽样检查在使用的车辆中不安全轮胎的比例,
在175辆车中抽取了 25辆,
其不安全轮胎数如下:
七多阶抽样
7.1苗圃职工用二阶抽样方法估计树苗的平均高度,该苗圃共有
N=50块地,先从中抽取
10块地,再从每块抽中的地块中抽 ___ 10%的树苗,对抽中的苗木测量其高度取得资料如下: 地块(
i ) |秧苗数(MJ |抽样数(mJ |苗木高度y j
1 5
2 5 12,11,12,10,1
3 2 56 6 10,9,7,9,8,10 3 60 6 6,5,7,5,6,
4 4 46
5 7,8,7,7,
6 5 49 5 10,11,13,12,12 6 51 5 14,15,13,12,13
7 50 5 6,7,6,8,7,
8 61 6 9,10,8,9,9,10
9 60 6 7,10,8,9,9,10 10
45
6
12,11,12,13,12,,12
已知共有M 0=2600株苗木
试证:若Sf 0,则上述简单随机样本比直接从全体次级单元中抽取的样本量为 n 的简单
随机样本更有效,如果 n /N 忽略不计,则两组样本同样有效。
7.3多阶抽样与单阶抽样的关系;
7.4二阶抽样与整群抽样和分层抽样的关系。
(1)
若两阶抽样都是简单随机的,调查结果用加权平均数
匕「M i y i 来估计
M 0n i =1
(2)
s
总体均值,求估计值 Y ⑴,并计算
? 1 n 抽样方法同(1),但估计量不加权,即用丫⑵=1
a y i ,求估计值并计算 n 7
v(Y?⑵)
(3) 抽样方法不变,使用比估计,即丫?(3)=晋,求估计值及其标准误差 心
(4)
讨论上述三种方法的适用条件
7.2假设总体初级单元的大小均为 M 。
为了估计总体均值
Y (按次级单元),采用如下的二
阶抽样法,先随机地抽取 n 个初级单元,然后从每个初级单元中抽取一个次级单元。
记
其中
S 12
(Y i -丫)2
S ;
N(M -1) i d j d (Y j
-丫
i
)。