抽样调查习题集.doc
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《抽样调查》复习题
一概述
1.1 结合以下所列情况讨论哪些适合用全面调查,哪些适合用抽样调查,并说明理由;
1.研究居住在某城市所有居民的食品消费结构;
2.调查一个县各村的粮食播种面积和全县生猪的存栏头数;
3.为进行治疗,调查一地区小学生中患沙眼的人数;
4.调查一地区结核病的发生率;
5.估计一个水库中草鱼的数量;
6.某企业想了解其产品在市场的占有率;
7.调查一个县中小学教师月平均工资。
1.2结合习题1.1的讨论,你能否概括在什么场合作全面调查,什么场合适合做抽样调查。
1.3讨论以下所列情况是否属于概率抽样,并说明理由:
1.从一个包含有100只兔子的实验室大笼子里抓10只兔子做实验。研究人员不经任何挑选抓到哪只就算那一只,抓满10只为止。
2.将笼中的100只兔子编上1~100号,任意列出10个不重复的数字(为1~100之间的整数),以相应的兔子作为抽中作试验的样本;
3.从钱包中随便抽出一纸币,凡兔子号码尾数与该纸币编号尾数相同者及作为抽中的样本。
1.4 某刊物对其读者进行调查,调查表随刊物送到读者手中,对寄回的调查表进行分析。试问这是不是一项抽样调查?样本抽取是不是属于概率抽样?为什么?
1.5 结合习题1.3与1.4的讨论,根据你的理解什么是概率抽样?什么是非概率抽样?它们各有什么优点?
1.6怎样理解抽样调查的科学性?
1.7抽样调查基础理论及其意义;
1.8抽样调查的特点。
二抽样调查基本原理
2.1 试说明以下术语或概念之间的关系与区别;
1.总体、样本与个体;
2.总体与抽样框;
3.个体、抽样单元与抽样框。
2.2试说明以下术语或概念之间的关系与区别;
1.均方误差、方差与偏倚;
2.方差、标准差与标准误;
3.无偏估计、祥和估计量与可用估计量;
4.绝对误差限、置信限(置信区间)与置信度。
2.3样本可能数目及其意义;
2.4影响抽样误差的因素;
2.5抽样分布及其意义;
2.6抽样估计的基本原理;
2.7置信区间的确定。
三 简单随机抽样
3.1 设总体N=5,其指标值为{3,5,6,7,9} 1.计算总体方差2
σ和S 2;
2.从中抽取n=2的随机样本,分别计算放回抽样和不放回抽样的方差)(y V ;
3.按不放回抽样列出所有可能的样本并计算y ,验证)(y E =Y ;
4. 按不放回抽样的所有可能的样本,计算其方差)(y V ,并与公式计算的结果进行比较;
5.对所有的可能样本计算样本方差s 2,并验证在不放回的情况下:E (s 2)= S 2。 3.2 在一森林抽样调查中,某林场共有1000公顷林地,随机布设了50块面积为0.06公顷
的方形样地,测得这50块样地的平均储蓄量为9m 3,标准差为1.63 m 3
,试以95%的置信度估计该林场的木材储蓄量。
3.3 某居民区共有10000户,现用抽样调查的方法估计该区居民的用水量。采用简单随机抽样抽选了100户,得ý=12.5,s 2=1252。估计该居民区的总用水量95%的置信区间。若要求估计的相对误差不超过20%,试问应抽多少户做样本?
3.4 某工厂欲制定工作定额,估计所需平均操作时间,从全厂98名从事该项作业的工人中随机抽选8人,其操作时间分别为
4.2,
5.1,7.9,3.8,5.3,4.6,5.1,4.1(单位:分),试以95%的置信度估计该项作业平均所需时间的置信区间。
3.6 某县采用简单随机抽样估计粮食、棉花、大豆的播种面积,抽样单元为农户。根据以往资料其变量的变异系数为
名称 粮食 棉花 大豆 变异系数 0.38 0.39 0.44
若要求以上各个项目的置信度为95%,相对误差不超过4%,需要抽取多少户?若用这一样本估计粮食的播种面积,其精度是多少?
3.7 假设总体中每个单元有两个指标值Y i 和X i ,i=1,…,N ,记y,为相应的简单随机样本的均值。试证:
(1)样本均值∑==n
i i y n y 1
1是总体均值的无偏估计;
(2),1)(2S n
f y Var -= 其中,.)(11122
∑=--=N i i Y Y N S 3.8 简单随机抽样在抽样技术中的地位;
3.9 简单随机抽样中样本量确定的原则及主要考虑因素。
四 分层抽样
4.1 一公司希望估计某一个月内由于事故引起的工时损失。因工人、技术人员及行政管理人员的事故率不同,因而采用分层抽样。已知下列资料:
4.2 上题中若实际调查了18个工人,10个技术人员,2个行政人员,其中损失的工时数
4.3 调查某个地区的养牛头数,以村作为抽样单元。根据村的海拔高度和人口密度划分成
(1) 估计该地区养牛总头数Y 及其估计量的相对标准误差Y Y
s ˆ)ˆ( (2) 讨论分层抽样与不分层抽样比较效率有否提高。
(3) 若样本量不变采用Neyman 分配可以减少方差多少? 4.4 怎样分层能提高精度?
4.5 总样本量在各层间分配的方法有哪些? 4.6 分层的原则及其意义。
五 比估计与回归估计
5.1 对以下假设总体(N=6)
无偏的?若有偏,偏倚多大?
(2) 若用n=2的简单样本去估计总体总量Y ,试比较比估计与简单估计的方差。
5.2 欲估计某小区居民的食品支出占总收入的比重,该地区共有150户,现用简单随机抽样抽取14户为样本,经调查每户的食品支出y i 与总收入x i 的数据如下表: