应用抽样技术期末复习题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样调查
一、选择题
1.抽样调查的根本功能是( C )
A. 获取样本资料 B 。
计算样本资料
C 。
推断总体数量特征 D. 节约费用
2。
概率抽样与非概率抽样的根本区别是( B )
A 。
是否能保证总体中每个单位都有完全相同的概率被抽中
B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C 。
是否能减少调查误差
D 。
是否能计算和控制抽样误差
3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( A ) A 。
所考虑的抽样设计比简单随机抽样效率低
B 。
所考虑的抽样设计比简单随机抽样效率高
C 。
所考虑的抽样设计与简单随机抽样效率相同
D 。
以上皆对
4.优良估计量的标准是( B )
A.无偏性、充分性和一致性
B.无偏性、一致性和有效性
C 。
无误差性、一致性和有效性
D 。
无误差性、无偏性和有效性
5.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。
试采用比率估计方法估计今年该地区小麦总产量( B ) A 。
12820.63 B 。
14593。
96 C.12817。
83 D.14591.49
6.抽样标准误差的大小与下列哪个因素无关( C )
A .样本容量
B .抽样方式、方法
C .概率保证程度
D .估计量
7.抽样标准误差与抽样极限误差之间的关系是( B ) A.θθ
)ˆ(SE =∆ B 。
)ˆ(θtSE =∆ C 。
θθ)ˆ(tSE =∆ D.t
SE )ˆ(θ=∆ 8.应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量之间大致成( A )关系
A 。
正比例
B 。
反比例
C 。
负相关
D 。
以上皆是
9。
能使)2(1)(222YX X Y lr S S S n
f y V ββ-+-=达到极小值的β值为( B ) A.YX X Y S S S ⋅ B 。
2X YX S S C.2Y
YX S S D.X YX S S 2 10。
( B ) 是总体里最小的、不可再分的单元.
A 。
抽样单元 B.基本单元 C.初级单元 D 。
次级单元
11. 下面哪种抽样方法是最简单的概率抽样方法( A )。
A.简单随机抽样 B 。
分层随机抽样 C.系统抽样 D 。
整群抽样
12. 下面关于各种抽样方法的设计效应,表述错误的是( B )。
A 。
简单随机抽样的deff=1 B.分层随机抽样的deff ﹥1
C.整群随机抽样的deff ﹥1 D 。
机械随机抽样的deff ≈1
13. 假设考虑了有效回答率之外所有其他因素后的初始样本量为400,而预计有效回答率为80﹪,那么样本量则应定为( B ).
A.320 B。
500 C。
400 D.480
14. 在要求的精度水平下,不考虑其他因素的影响,若简单随机抽样所需要的样本量为300,分层随机抽样的设计效应deff=0.8,那么若想达到相同的精度,分层随机抽样所需要的样本量为( C )。
A.375 B。
540 C。
240 D。
360 15。
分层抽样设计效应满足( B )。
A.deff=1B。
deff﹤1C。
1deff≈1 D.deff﹥1
16。
针对总体每一单元都进行信息搜集的调查是( D )
A。
抽样调查B。
典型调查C。
重点调查 D.全面调查17。
调查费是用一个与样本容量有关的函数,若0C为固定费用,c为每一个单元的调查费用,则最简单的线性费用函数为( D )
A。
C
t = C
+n B. C
t
= C+C
n C. C
t
= (C
+C)
n
D。
C
t
= C
+Cn
18。
抽样框最直接反映的是( C )
A。
目标总体B。
实际总体C。
抽样单元D。
基本单元19. 在给定费用下使估计量的方差达到最小,或者对于给定的估计量方差使得总费用达到最小的样本量分配为( C )
A. 常数分配
B.比例分配C。
最优分配D。
梯次分配
20。
分层抽样也常被称为( D )
A。
整群抽样 B.系统抽样 C.组合抽样 D.类型抽样
21。
整群抽样中群的划分标准为( A ).
A。
群的划分尽可能使群间差异小,群内的差异大
B.群的划分尽可能使群间差异大,群内的差异小
C.群的划分尽可能使群间差异大,群内的差异大
D。
群的划分尽可能使群间差异小,群内的差异小
22。
某班级共有六十名学生,要以直线等距抽样选出15个学生为样本,调查学生的到课率,则下列做法正确的是( D )。
A.将60名学生依次编为1~60
B.计算抽样间距为4
C。
从1~4随机抽取一个数,作为抽样的起始单元号,按每隔4个单元抽取一个,直至抽出15个样本 D。
以上都正确
23。
初级单元大小不等的多阶段抽样中,无偏估计量满足自加权的条件是( C )
A.第一阶段每个单元被抽中的概率相等
B。
第二阶段每个单元被抽中的概率相等
C.每个基本单元最终被抽中的概率相等
D. 每个基本单元最终被抽中的概率不等
24。
相对于直线等距抽样,圆形等距抽样的优点为( C )
A。
不用对单元进行编号B。
随机起点选择范围小
C。
保证每个单元被抽中的概率严格相等 D.操作更加简单
25。
某学院共有500名学生,依次编号为1~500,要从中抽取50名学生调查学生的到课率,首先从1~10号中随机抽取一个数,作为抽样的起始单元号,然后每隔10个单元抽取一个,直到抽足50个单元.这种抽样方法是(C )
A。
简单随机抽样 B。
分层抽样 C. 系统抽样 D。
整群抽样
26. 非概率抽样与概率抽样的主要区别为( D )
A. 适用的场合不同
B. 总体特征值的估计不同
C。
样本量的确定不同 D。
抽样时是否遵循随机原则
27. 下面关于各种抽样方法的设计效应,表述错误的是( B )
A. 简单随机抽样的deff=1
B. 分层随机抽样的deff〉1
C。
整群抽样的deff〉1 D。
系统抽样的deff 1
28. 某工厂实行流水线连续生产,为检验产品质量,在每天24小时中每隔1小时抽取一分钟的产量作全面检查,这是( C ).
A。
简单随机抽样 B。
分类抽样 C.等距抽样 D。
整群抽样
29。
为了解1200名学生对学校教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔k为( A )
A.40
B.30 C。
20 D.12
30. 分层抽样中的层的划分标准为( B )。
A.尽可能使层间的差异小,层内的差异大
B.尽可能使层间的差异大,层内的差异小
C.尽可能使层间的差异大,层内的差异大
D。
尽可能使层间的差异小,层内的差异小
二、判断题
×1。
总体比率R与总体比例P两者是一样的概念,只是符号不同。
√2。
比估计量是有偏估计量。
×3。
分层抽样在划分层时,要求层内差异尽可能大,层间差异尽可能小。
×4.对于同一总体,样本容量同抽样标准误差之间是正相关关系。
×5.整群抽样设计总是比简单随机抽样效率低。
×6。
其他条件相同时,重复抽样的误差小于不重复抽样的误差。
×7.设总体容量为N,样本容量为n,采用有顺序放回简单随机抽样,样本配合C。
种数为n
N
×8.一个调查单位只能对接与一个抽样单位。
√9。
营业员从笼中抓取最靠近笼门的母鸡,该种抽样方式属于非概率抽样。
√10。
当调查单位的抽样框不完整时,无法直接实施简单随机抽样。
√11 分层抽样不仅能对总体指标进行推算,而且能对各层指标进行推算。
×12 分层的基本原则是尽可能地扩大层内方差,缩小层间方差。
√13 分层抽样的效率较简单随机抽样高,但并不意味着分层抽样的精度也比简单随机抽样高。
√14 分层抽样克服了简单随机抽样可能出现极端的情况。
√15 分层抽样的样本在总体中分布比简单随机抽样均匀。
×16 分层后各层要进行简单随机抽样.
√17 分层抽样的主要作用是为了提高抽样调查结果的精确度,或者在一定的精确度的减少样本的单位数以节约调查费用.
√18分层后总体各层的方差是不同的,为了提高估计的精度,通常的做法是在方差较大的层多抽一些样本。
√19在不同的层中每个单位的抽样费用可能是不等的。
×20 在分层抽样的条件下,样本容量的确定与简单随机抽样的共同点都是取决于总体的方差。
√21 多主题抽样中,不同的主题对样本量大小的要求不同。
在费用允许的情况下,应尽可能地选择较大的样本量.
√22 有时在抽样时无法确定抽样单位分别属于哪一层,只有在抽取样本之后才能区分。
×23 比例分配指的是按各层的单元数占样本单元数的比例进行分配。
×24 等容量分配时各层的样本单元数与各层的层权是相同的。
√25 所谓最优分配是指给定估计量方差的条件下,使总费用最小。
√26 在奈曼分配时,如果某一层单元数较多,内部差异较大,费用比较省,则对这一层的样本量要多分配一些.
√27 在实际工作中如果第k层出现kn超过kN,最优分配是对这个层进行100%的抽样。
√28 在实际工作中,如果要给出估计量方差的无偏估计,则每层至少2个样本单元,层数不能超过n/2.
×29 无论层的划分与样本量的分配是否合理,分层抽样总是比简单随机抽样的精度要高.
×30 即使层权与实际情况相近,利用事后分层技术也难以达到提高估计精度的目的。
×31.在任何条件下,估计量的方差都与估计量的均方差相等,因此一般所讲的估计误差也就是指估计量的方差。
×32.在多阶段抽样中,各阶段只能采用同一种抽样方法。
×33.总样本量在各层间按内曼分配的结果可以形成自加权的估计量。
×34.估计抽样误差时,在各种抽样技术条件下都可以用样本方差代替总体方差。
×35.比估计就是比例估计.
×36.随机原则就是要使得总体中的每一个抽样单元都有相等的可能性被抽中。
√37.整群抽样可以被理解为是第二阶段抽样比为100%时的一种特殊的两阶段抽样。
×38.分层抽样可被理解为是第二阶段抽样比为100%时的一种特殊的两阶段抽样。
×39.比估计与回归估计都充分利用了有关辅助变量,因此一般情况下都较简单估计的精度要高。
√40.当第一重样本量等于总体容量时,二重分层抽样与一般分层抽样具有相同的估计精度。
三、名词解释
1.滚雪球抽样
答:滚雪球抽样是指利用样本点(构成样本的单元)寻找样本点,即由目前的受访者去寻找新的具有新的具有某一特征的受访者.
2。
分别比估计
答:分别比估计是指利用将比率估计的思想和技术用于分层随机样本时,两种可行的办法之一:对每层样本分别考虑比估计量,然后对各层的比估计量进行加权平均,此时所得的估计量称为分别比估计。
3.PPS抽样
答:
4。
配额抽样
5.概率抽样
6。
不等概率抽样
7。
PS π抽样的Brewer 方法
8. 最优分配
9. 比率估计
四、计算题
1、(简单随机抽样的均值、比例估计和样本量的确定)某住宅区调查居民的用水情况,该区共有N =1000户,调查了n =100户,得y =12。
5吨,2
s =1252,有40户用水超过了规定的标准。
要求计算:
错误!该住宅区总的用水量及95%的置信区间;
错误!若要求估计的相对误差不超过10%,应抽多少户作为样本?
错误!以95%的可靠性估计超过用水标准的户数;
2
设1000 n
错误!采用按比例分层抽样的方法估计Y 和P 并计算其标准误;
错误!采用奈曼分配的方法估计Y 和P 并计算标准误; 3、(两阶段抽样)某市为了了解职工收入情况,从该市的630个企业中随机抽取了5
其中,i M 为企业职工数,i m 为样本量;i y 为样本均值,22i s 为样本方差.
试估计该市职工平均收入及标准差。
4、(比率估计)某养兔场共有100只兔子,上月末称重一次对每只兔的重量作了纪录,并计算平均重量为3.1磅,一个月后随机抽取10只兔子标重如下:
○2估计现有兔子的平均重量及其标准误差;
错误!将比估计方法与均值估计法进行比较,哪一种方法效率高?分析其原因。
5、为调查某5443户城镇居民服装消费情况,采用简单随机不重复抽样调查了36户进行调查,得到平均消费支出72.649=y 元,3048032=s 试根据此估计:
(1)该地区居民服装消费支出总额,并给出置信水平为95%的置信区间。
(2)如果希望服装平均消费支出的相对误差限不超过5%,则样本量至少应为多少?
6、某地区10000名群众,现欲估计在拥有本科学历及以上的群众所占的比例,随机不重复抽取了300名群众进行调查,得到25.0=p ,试估计该地区群众拥有本科以上学历的比例,并以正态分布近似给出其95%的置信区间。
7、对某地区171 980户居民家庭收入进行调查,以居民户为抽样单位,根据城镇和乡村将居民划为2层,每层按简单随机抽样抽取300户,经整理得如下
试根据此估计:
(1)居民平均收入及其95%的置信区间。
(2)若是按比例分配和奈曼分配时,各层样本量分别应为多少?
8、某居民小区共有600个单元,每个单元均居住15户,现以单元为群进行整群抽样,随机抽取8个单元,调查每户每周的食品支出费用,调查结果经整理,
(1)该居民小区平均每户每周食品支出费用,并给出其置信水平为95%的置信区间。
(2)计算以单元为群的群内相关系数与设计效应
9、某县有300个村,小麦播种面积为23 434亩.全部村子按地势分为平原和山区两种类型,各按10%的抽样比抽样,调查亩产量,经整理得到下表结果,以
大写字母表示总体数据,小写字母表示样本数据,Y 代表调查变量,为今年的总产
试分别对全县今年的平均亩产量构建分别比率估计量和联合比率估计量。
10、一个由N=1000个人构成的总体被划分为两层:第一层由4001=N 名男性组成,第二层由6002=N 名女性组成.从中抽取一个样本量为n=250的样本,将样本等比例地分配给各层,使得两层的抽样比都等于n/N=1/4.求各层的样本量分别是多少?
11、一公司希望估计某一个月内由于事故引起的工时损失。
因工人、技术人
12、某工厂生产的新产品供应国内市场的300家用户,试销售滿一年后,现欲请用户对该厂的新产品进行评价。
现把这些用户分成本地区、本省外地区、外省
若要求估计评价成绩均值的方差1.0)(=st y V ,并且费用最省(假定费用为线性形式),求样本量n 在各层的分配。
13、某林业局欲估计植树面积,该局共辖240个林场,按面积大小分为四层,
14. 一个县内所有农场按规模大小分层,各层内平均每个年农场谷物(玉米)
现要抽出一个包含100个农场的样本,目的是估计该县平均每个农场的玉米面积,请问:
(1)按比例分配时,各层的样本量为多少?
(2)按最优分配时,各层的样本量为多少?(假定各层的单位调查费用相等)
15. 某县欲调查某种农作物的产量,由于平原、丘陵和山区的产量有差别,故拟划分为平原、丘陵和山区三层采用分层抽样.平原区共有150个村庄,丘陵区共有100个村庄,山区共有250个村庄。
按照各种地形等比例各抽取5%样本,进行实割实测产量,结果计算如下表.
(1)在95。
45%的概率保证程度下,试估计该县农作物平均每村产量的区间范围。
(2)若村庄的农作物产量低于150吨,县政府并将其归为低产量村,
从而对其加强农业补贴政策。
因此,试图在95.45%的概率保证程度下估计该县低产量村比例
16.某城市居民小区的食品消费量调查,以每个楼层为群进行整群抽样,每个楼层都有8个住户。
用简单随机抽样在N=510个楼层中抽取n=12个楼层,得到96个样本户人均食品消费额,及按楼层的平均数和标准差,如表。
请估计该小区人均食品消费额的户平均值,并给出95%置信区间。
17. 邮局欲估计每个家庭的平均订报份数,该辖区共有4000户,划分为400
群各户订报数ij y i y
1 1,2,1,3,3,2,1,4,1,1 19
2 1,3,2,2,3,1,4,1,1,2 20
3 2,1,1,1,1,3,2,1,3,1 16
4 1,1,3,2,1,5,1,2,3,1 20
试估计平均每户家庭订报份数及总的订报份数,以及估计量的方差。
18。
某工业系统准备实行一项改革措施。
该系统共有87个单位,现采用整群抽样,用简单随机抽样抽取15个单位做样本,征求入选单位中每个工人
单位总人数赞成人数
1 51 42
2 62 53
3 49 40
4 73 45
5 101 63
6 48 31
7 65 38
8 49 30
(2)在调查的基础上对方案作了修改,拟再一次征求意见,要求估计比例的允许误差不超过8%,则应抽取多少个单位做样本?
19。
某集团的财务处共有48个抽屉,里面装有各种费用支出的票据。
财务人员欲估计办公费用支出的数额,随机抽取了其中的10个抽屉,经过清点,整理
要求以95%的置信度估计该集团办公费用总支出额度置信区间(α=0.05).
20。
某高校学生会欲对全校女生拍摄过个人艺术照的比例进行调查。
全校共有女生宿舍200间,每间6人。
学生会的同学运用两阶段抽样法设计了抽样方案,从200间宿舍中抽取了10间样本宿舍,在每间样本宿舍中抽取3位同学进行
试估计拍摄过个人艺术照的女生比例,并给出估计的标准差。
计算题答案:
1、解:已知N = 1000,n = 100,
n100
f0.1
N1000
===,2
y=12.5s1252
=
,
错误!估计该住宅区总的用水量Y 为:
ˆY=Ny=100012.5=12500⨯
估计该住宅区总的用水量Y 的方差和标准差为:
22221-f 10.1ˆv(Y)=N v(y)=N s 10001252=11268000
n 100ˆ3356.7842-=⨯⨯=≈
因此,在95%的置信度下,该住宅总的用水量的置信区间估计为:
ˆˆY ts(Y)=125001.963356.7842125006579±±⨯≈±
即,我们可以以95%的把握认为该住宅总的用水量在 5921吨~19079吨之
间。
○,2根据题意,要求估计的相对误差不超过10%,即r ≤0.1,假定置信度为95%
根据公式:22202222
t s 1.961252
n 3078r y 0.112.5
⨯==≈⨯ 由于
n 3.0780.05N =>,所以需要对0n 进行修正: 00n 3078
n = 755n 1+3.0781N
=≈+
若要求估计的相对误差不超过10%,应抽不少于755户作为样本. ○3以95%的可靠性估计超过用水标准的户数;
令超过用水标准的户数为A ,样本中超过用水标准的户数为a = 40,估计超过用水标准的比例P 为:
a 40p = 40%
n 100==
估计超过用水标准的比例P 的方差和标准差为
:
1f 10.1
v(p)pq 40%60%0.002182n 11001
s(p) 4.67%--=
=⨯⨯≈--== 在95%的可靠性下,超过用水标准的比例P 的估计区间为: p ts(p)40%1.96 4.67%±=±⨯
因此,我们有95%的把握认为,超过用水标准的比例P 在30。
85%49。
15%之间,超过用水标准的户数的点估计为:100040%400⨯=户,超过用水标准的户数在100030.85%⨯户~100049.15%⨯户之间,即309户~492户之间.
2、解:错误!根据题中已知条件,采用按比例分层抽样的方法估计Y 为:
L
st h h h 1
y W y 0.35 3.10.55 3.90.17.8 4.01===⨯+⨯+⨯=∑
估计Y 的方差和标准误差为:
L
2
222st h h
h 1
st 1f 1
v(y )W S
(0.3520.55 3.30.111.3)0.0201585n 1000s(y )0.141981
=-=
≈
⨯+⨯+⨯≈=∑
估计P 及其方差和标准误差为:
L
prop h h h 1
L prop h h h
h 1prop p W p 0.350.540.550.390.10.240.4275
1f 1
v(p )W p q (0.350.540.460.550.390.610.10.240.76)0.000218n 1000s(p )0.014765
====⨯+⨯+⨯=-≈≈⨯⨯+⨯⨯+⨯⨯≈=≈∑∑
错误!采用Neyman 分配的方法估计Y 和P 的方法和与错误!是一样的,即
L
st h h h 1
L
prop h h h 1
y W y 0.35 3.10.55 3.90.17.8 4.01p W p 0.350.540.550.390.10.240.4275
====⨯+⨯+⨯===⨯+⨯+⨯=∑∑
但是采用Neyman 分配估计Y 和P 的方差的方法不同,分别为
:
L L 22
2st h h h h h 1h 1st L 2prop h 1prop 111v(y )(W S )W S (0.3520.55 3.30.111.3)0.013286
n N 1000s(y )0.115265
11v(p )(W (0.350.550.10.000236
n 1000s(p )====-≈⨯+⨯+⨯≈==≈≈≈∑∑
∑0.015362
=≈
3、解:已知:N = 630,n = 5,2
i i i 2i M ,m ,y ,s
估计该市职工的平均收入为:
n
i i
i=1
n
i
i=1
M y
520328+108400140031012003709000420
y=
398520108140012009000
M
⨯⨯+⨯+⨯+⨯=
≈++++∑∑
估计该市职工平均收入的方差及标准差为:
n n 2
212i i 2i i 1i 1
i 222221-f (1-f )11v(y) = (y y)s n n 1n m 5
1-1
630 [(328398)(400398)(310398)(370398)(420398)]5511010202011111
52010814001200 [400.056301.1341303.158510102020==-+-=-+-+-+-+-+
-----=⨯+⨯+⨯+∑
∑100190001205.7864200]
100 667.46031745.321254 = 713.781571
s(y)=26.71669
-⨯+⨯≈+≈
因此,估计该市职工平均收入为398元,标准差为26.71669元
4、解:○,1已知:N = 100 ,n = 10 ,设X ,Y 分别代表上月兔子总重量
和本月兔子总重量,则 X = 3.1,n 10
f = 0.1N 100
=
=。
由表中数据可得:
1010
i i i=1i=1102
2y i i 110
22x
i i 1
10
yx i i i 1
11y = y 4 x = x 2.97
10101s (y y)0.022210-11s (x x)0.024610-11s (x x)(y y)0.015
10-1======-≈=-≈=--=∑∑∑∑∑, 因此,对这批兔子较上月末增重的比率估计为:
y 4ˆR = 1.3468x 2.97
=≈ ˆR
方差的估计为: 2222y x yx
22
1f 10.1ˆˆˆv(R)(s R s 2Rs )(0.02221.34680.024621.34680.015)0.0002474nX 10(3.1)--≈+-=+⨯-⨯⨯≈⨯ˆR
标准误差的估计为
: ˆ0.015729=≈ 错误!对现有兔子的平均重量的比率估计为:
R ˆy = RX=1.34683.1 4.17508⨯= R y 方差的估计为:
2222R y x yx 1f 10.1ˆˆv(y )(s R s 2Rs )(0.0222 1.34680.02462 1.34680.015)0.0023775n
10
--≈+-=
+⨯-⨯⨯≈ R y 标准误差的估计为
:
R s(y 0.04876=≈
错误!对现有兔子的平均重量的均值估计为:
10
i i=11y = y 410=∑
y 方差的估计为:
2y 1f 10.1
v(y)s 0.02220.001998n 10
--=
≈⨯= 因此,得到现有兔子平均重量的比率估计量设计效应的估计为: R v(y )0.0023775
ˆdeff =
=1.1899v(y)0.001998
≈ 对于本问题,均值估计方法的效率比比率估计方法的效率要高。
原因是:比
率估计是有偏的,当样本量足够大时,估计的偏倚才趋于零,而本问题中的样本量较小,使用比率估计量时不能忽视其偏倚,所以无法保证估计的有效,使得估计效率比均值估计方法的效率低。
5、解:96.1,304803,72.649,36,54432=====t s y n N
21~ˆ
~%,66.0)1(s n
f t N y N Y N n f ⋅-⋅⋅±==
96.3536425ˆ
~=⋅=y N Y 8695.84101)(2=⋅-=s n
f y v
)()ˆ
~(2y v N Y v ⋅= 8433.499181)ˆ~(=Y SE
所以居民区总用水量的区间为:
)37.4514822,55.2558029
( 222
2000,1%,5)2(Y r s t n N
n n n r ⋅=+
=≤
根据题中相关数据可得11100≥n 户,由此可得922≥n 户
即,要满足相应的精度要求,至少得抽922户做样本。
6、解:96.1,25.0,03.0,300,10000====
==t p N
n
f n N 41008.6)1(1
1)(-⨯≈-⋅⋅--=
p p n f
p v 0247.0)(≈p SE
所以本科生中暑假参加培训班的95%的置信区间为:
)
2984.0,2016.0(0484
.0%25)0247.096.1(%25)(即±=⨯±=⋅±p SE t p
7、解:(1) 由题中相关数据资料:元)
(39.105852
1
≈⋅=∑=h h h st y W y (元)
3082.166057364.160595718.545)1()(2
2
1
2=+≈⋅-⋅=∑=h h h h h st n S
f W y v 户),
元/(86.128)(≈st Y se 96.1=t 该地区居民平均收入的95%的置信区间为:
元)96.10837,82.10332()(→⋅±st st Y se t Y
(2)按比例分配:
户)
(82137.060011=⨯=⋅=W n n 户)(518863.060022=⨯=⋅=W n n 按奈曼分配:
∑=⋅⋅⋅
=L
h h
h
h
h h S W
S W n n 1
由表中资料:362.2604,198.2197,164.407,6002
1
2211====∑=h h h S W S W S W n
由上可得根据奈曼分配,各层所需样本容量为:
94362.2604164
.4076001≈⨯=n
506362
.2604198
.21976002≈⨯=n
8、解:(1)96.1,15,013.0,8600======t M A
a
f a A ,
625.21211
=⋅=∑=a
i i y a y
7315.7199821.4715)(121
2=⨯≈-⋅-=∑=y y a M
s a
i i b
9198.51)(2
≈-=
b s aM
f y v 43.2)(≈y se ,所以该城市大学生人均月生活费支出95%的置信区间为:
)39.217,86.207()(→⋅±y se t y
(2)20.91711
2
2≈=∑=a i i w
s a s
0146.0)1(ˆ2
222-≈-+-=w
b w
b c s M s s s ρ 7956.0ˆ)1(1=-+≈c M deff ρ
9、解:全县今年的平均亩产量的分别比率估计量
由题可得:058.1ˆ,039.1ˆ,ˆ2
1===R R x y R h
h h 89.389)ˆ(2
1=⋅=∑=h
h h h Rs X R W y 全县今年的平均亩产量的联合比率估计量
由题可得:62.3892
1
==∑=h h h st y W y ,58.3712
1
==∑=h h h st x W x
049.1ˆ==st
st C
x y R 98.3712
1=⋅=∑=h h h X W X
21.390ˆ=⋅=X R y C RC
10、解:1004/1*4001==n
1504/1*6002==n
即各层的样本量分别为100和150人
11、解:3*275*926*132*
30++==∑i
i i
i i i i S N S N S N n
n 181333
*
301
11==S N n 102=n 23=n
12、解:()∑∑∑+=
2
22))(/(i
i st i i i i i i N y S N C N C N n σσσ=2806.2754.81990004
.210238.126≈=+⨯ ()∑∑+2
22)
/(i i st i i i N y S N C N σσ
∑)/(i i i C N σ=
38.1266
8
.15358.19335.1154=⨯+⨯+⨯ ∑)i i
i
C N σ
=4.21026*8.1*535*8.1*933*5.1*154=++
()st y S N 22=90001.030022=⨯
∑2
i
i
N σ
=54.81924.3*5324.3*9325.2*154=++
17059.1738
.12677
28)
//1
111≈=⨯
==∑i i
i
C N C N n
n σ
σ
742.738
.12648
.3328)
//2
222≈=⨯
==∑i i
i
C N C N n
n σ
σ
4523.338
.1269
.1528)
//3
333≈=⨯
==∑i i
i
C N C N n
n σ
σ
即各层的样本量分别为17、7、4
13、解:50696ˆ==∑h h Y N Y 506964324)ˆ(==Y
s Y
ˆ=(42048,59344) 分析:略。
14。
解:(1)比例分配:
根据表中所给的数据,利用公式h
h N n n
N
=直接可计算出各层样本量:
123456720,23,19,17,8,6,7n n n n n n n =======
(2)最优分配:
当各层的单位调查费用相等时,最优分配样本量计算公式为:
1
h h
h L
h
h
h N S n n N S
==⋅
∑
同样将表中的相关数据代入公式即可求出此时各层的样本量为:
123456710,18,17,19,12,9,15n n n n n n n =======
15。
解:(1) 24.15012
5711
.1211214755.2027=++⨯+⨯+⨯=x
样本方差:5.3374241235.47584.3672.822222
2
=⨯+⨯+⨯==
∑∑i
i i n
n σσ
抽样平均误差56.11%)51(24
5.3374)1(2
=-=-
=
N n n
u x σ 概率保证程度为95.45%,可查表获得t=2,12.2356.112=⨯==∆x x tu
在95。
45%的概率保证程度下,可得该县农作物平均每村产量的置信区间
为(150。
24-23.12, 150.24+23.12).
(2) 样本成数%67.4112
577
12=++++=
p 样本方差
21.024121251275545177572)1()1(=⨯⨯+⨯⨯+⨯⨯=-=-∑∑i
i i i n n p p p p
抽样平均误差%12.9%)51(24
21
.0)1()1(=-=--=
N n n p p u p 概率保证程度为95.45%,可查表获得t=2,%24.18%12.92=⨯==∆x x tu 在95.45%的概率保证程度下可得该县低产量村比例的置信区间为(41。
67%
—18.24%,41。
67%+18.24%)
16。
解:已知N =510,n =12,M =8,f =n/N=0.0235 故:
18
.14186)38.21838.258()38.218-188(1128)-(1-)元(38.2181238.2585.1801881221221∑
∑
=⎥⎦⎤⎢⎣⎡-++-===+++==== n i i b n
i i y y n M s y n y 0235.0-1-12
f
于是 的置信度为95%的置信区间为
17. 解:由题意得到400=N ,4=n ,10=M ,01.0400
4===
N n f 故875.14
1020
1620191ˆ1
=⨯+++=
=
=∑=n
i i
y
Mn
y Y (份)
75.18875.110=⨯=⋅=y M y (份)
7500875.140010ˆ=⨯⨯=⋅⋅=y N M Y
(份) ∑
=--=
n
i i b
y y n M s 1
22)(1
∑=---=
-=n
i i
b y y
n nM f s nM f y v 1
222)(1
111)(
14)75.1820()75.1819(10401.01222
--++-⨯⨯-=
00391875.0=
6270000391875.010400)()ˆ(2222=⨯⨯==y v M N Y
v 于是由以上的计算结果得到平均每户的订报份数为 1.875,估计量方差为
0.00391875.该辖区总的订阅份数为7500,估计量方差为62700。
18、解:已知87=N ,15=n ,87
15
=
=N n f 由已知估计同意改革的比例:
709.0911
646
ˆ1
1
≈=
=∑∑==n i i
n
i i
M
y
p
733.6011
==
∑=n
i i
M
n
M
008687.0)ˆ(1111)ˆ(122=---=∑
=n
i i i M p
y n n f M
p v 此估计量的标准差为
Y
[]218.38 1.96(12.013)194.83241.93±⨯元,
元
9321.0008687.0)ˆ()ˆ(===p v p
s 19、解:已知N=48, n=10, f=4810
=N n , 由题意得7361=∑=n i i y ,3651=∑=n
i i M ,
则办公费用的总支出的估计为8.353273610
48ˆ1=⨯==∑=n
i i y n N Y (元) 群总和均值6.73736101
11=⨯==∑=n i i y n y (元)
1
)()1()ˆ(1
2
2
--⋅-=∑=n y y
n
f N Y
v n
i i
=9
)6.7380(...)6.7362()6.7383(10)
48101(482222-++-+-⨯
-
⨯ = 182。
4⨯9
1
⨯3590.4
= 72765。
44 )ˆ(Y
v =269。
7507 则Y
ˆ的置信度为95%的置信区间为3532.8±1.96⨯269.7507,即[3004.089,4061。
511]。
20、解:已知200=N ,10=n ,6M =,3=m ,05.0200101===
N n f ,5.02==M
m
f 3.03
109
ˆ1
=⨯=
=∑=nm
y
p
n
i i
005747.0)(1111)ˆ(1
2=⋅--⋅
-⋅=∑=n
i i
m p y
n n f m
p v
0758.0005747.0)ˆ()ˆ(===p v p
s 在置信度95%下,p 的置信区间为
))ˆ(ˆ(2/p v t p
α±=)0.448568,0.151432()0758.096.13.0(=⨯±。