分层随机抽样答案

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

分层随机抽样 ( 答案 )
分层随机抽样
一、单项选择题
1、分层抽样设计效应知足(B)
A 、deff 1B、deff 1C、deff 1
D、deff 1
2、分层抽样的特色是(A)
A、层内差异小,层间差异大
B、层间差异小,层内差异大
C、层间差异小
D、层内差异大
3、下边的表达式中错误的选项是(D)
A、f h1
B、n h n
C、W h1
D、N h 1
4、在给定花费下预计量的方差V ( y st ) 达到最小,
或许对于给定的预计量方差V 使得总花费达到最
小的样本量分派称为(C)
A、常数分派
B、比率分派
C、最优分派 D 、奈曼分派
5、最优分派(V opt)、比率分派(V prop)的分层随
机抽样与相同样本量的简单随机抽样度之间的关系式为( A)
A、V V V
B、V
opt prop srs prop ( V srs)的精
V V
opt srs
C 、V
prop
V opt V srs
D
、V
srs
V prop V opt
6、下边哪一种样本量分派方式属于比率分派?
( A)
n h n
n h N h S h c h
A 、
N
B
、n
L
N h
N h S h
c h
C 、 n h N h S h
n
L
N h S h
h 1
D
、 n h W h S h
n
L
W h S h
h 1
h 1
7、下边哪一种样本量分派属于一般最优分派?
( B)
A 、
n
h
n n h
L
N h
S
h
c h N h
N
B 、n
N h S h
c h
C 、
n h N h S h
n
L
N h S h
h 1
D

n h W h S h
n
L
W h S h
h 1
h 1
二、多项选择题
1. 分层抽样又被称为 ( BC )
A. 整群抽样
B. 种类抽样
C.分
类抽样
D.
系统抽样
E.
逆抽样
2. 在分层随机抽样中, 当存在可利用的协助变量时,为了提升预计精度,能够采纳( BCD )
A. 分层比预计
B.
结合比预计
C.
分别回归预计
D.结合回归预计
E.
分别简单预计
3.样本量在各层的分派方式有 ( ABCD )
A. 常数分派
B.比率分派
C.最优
分派 D.奈曼分派 E.等比分派
4.分层抽样的长处有 ( ABCDE )
A.在检查中能够对各个子整体进行参数预计
B. 易于分工组织及逐级汇总
C. 能够提升预计量的精度
D.实行
方便 E.保证样本更拥有代表性
5.对于分层数确实定,下边说法正确的有( CE)
A. 层数多一些比较好
B.层数少一些比
较好 C. 层数一般以不超出 6 为宜
D. 层数一般以 4 层为最好
E.应当充
分考虑花费和精度要求等因向来确立层数
6.下边哪一种样本量分配方式属于奈曼分派 ?
( CD A.
)
n h n B. n h N h S h / c h C. N h N n L N
h S h / c h
h 1
n k N h S h
n L
N h S h
h 1
D. n h W h S h
E. n h W h S h / c h
n L n L
W h S h W h S h / c h
h 1 h 1
7.过后分层的合用处合有 (ABCD )
A.各层的抽样框没法获取
B.几个变量都适合于分层,而要进行预先的
多重交错分层存在必定困难
C.一个单位究竟属于哪一层要等到样本数据
采集到此后才知道
D.整体规模太大,预先分层太费事
E.一般场合都能够合用
三、名次解说
1. 分层随机抽样
2. 自加权
3. 最优分派
四、简答题
1.简述分层随机抽样相对于简单随机抽样的长处。

2.请列举出样本量在各层的三种分派方法,并
说明各样方法的主要思想。

3.如何分层能提升精度?
4.总样本量在各层间分派的方法有哪些?
5.分层的原则及其意义。

五、计算题
1.抽查一个城市的家庭,目的是评估均匀每个住户很简单变换为现款的财富金额。

住户分
为高房租和低房租的两层。

高房租这一层每家拥有的财富被看作是低房租层每家所拥有财富的9倍, S h与第h层的均值的平方根成正比。

高房租层有 4000 个住户,低房租层有 2000 个住户。

请问:
(1)包括 1000 个住户的样本应当如安在这
两层中分派?
(2)若检查的目的是预计这两层均匀每个住户拥有财富的差额,样本应如何分派(假定各层的单位检查花费相等)?
2.一个县内全部农场按规模大小分层,各层内均匀每个年农场谷物(玉米)的英亩数列在下表中。

农场规农场数均匀每一农场的标准差 S h
模(英N
h 玉米面积 Y
h
亩)
0—40 394 5.4 8.3 41—80 461 16.3 13.3 81—120 391 24.3 15.1 121—334 34.5 19.8 160 169 42.1 24.5 161—113 50.1 26.0
200 148 63.8 35.2
201—
240
241
总和或2010 26.3 --
均值
现要抽出一个包括 100 个农场的样本,目的是预计该县均匀每个农场的玉米面积,请问:(1)按比率分派时,各层的样本量为多少?
(2)按最优分派时,各层的样本量为多少?
(假定各层的单位检查花费相等)
(3)分别将比率分派、最优分派的精度与简
单随机抽样的精准度比较。

3.设花费函数拥有形式 C c0t h n h,此中c0 及 t h均为已知数,请证明当总花费固准时,为了使
V ( y st ) 达到最小值,n h必与 (W
h
2
S
h
2 )2/3成比率。

并求出
t
h
下述条件中,一个含量为1000 的样本所对应的n h。

W h S h t h

1 0.4 4 1
2 0.
3 5 2
3 0.3 6 4
4.在一个商行内, 62%的雇员是娴熟的或不娴熟的男性, 31%是做事的女性, 7%是管理人员。

从商行内抽取由 400 人构成的一个样本,目的是预计使用某些娱乐设施的人所占的比率。

依据大略的猜想,这些设施 40%到 50%是由男性使用的,20%到 30%是由女性使用的, 5%到 10%是由管
理人员使用的。

请问:
(1)你如何把样本单位分派在这三组人之
间?
(2)若真实使用者占的比率分别是 48%,21%和4%,则预计比率p st的标准误是多少?
(3)n=400 的简单随机样本算得的 p 的标准误是多少?
5.为检查某个高血压发病地域青少年与成年人高血压生病率,对 14 岁以上的人分四个年纪组进行分层随机抽样,检查结果见下表。

求整体高血压生病率 P 的预计及其标准差的预计。

高血压生病率检查数据
年纪组层权层样本p
h q h
量 n h
W h
14—25 0.281 400 0.08 0.917
岁0.322 650 3 0.826
26—40 0.213 600 0.17 0.690
岁0.814 350 4 0.536
41—60 0.31
岁0
61 岁0.46
以上 4
6.设计某一类商铺销售额的检查, n=550,三层中的两层有从前检查的资料可用来获取S h2
的较好的预计值。

第三层是一些新开设的商铺和从前检查中没有销售额的商铺,所以, S3的值只能加
以猜想。

若 S3的实质值是10,当被猜作(a)5, (b) 20 时,请分别计算一下由奈曼分派所
得的预计量的 V ( y st ) 。

并请证明在这两种状况下,
与真实的最优值对比,方差中按比率的增量稍大
于 2%。

真预计的 S h
W h S h
层值(1)(2)
1 0. 30 30 30
2 3 20 20 20
3 0. 10 5 20
6
0.
1
7.检查某个地域的养牛头数,以村作为抽样单元。

依据村的海拔高度和人口密度区分红四层,每层抽取10 个村作为样本单元,经过检查获取以下数据:
层村样本村养牛头数
总 1 2 3 4 5 6 7 8 9 1
数0
1 141 4 8 9 0 1 4 0 1 1 0
1 3 4 8 0 4
2 3
4
2 470 5 1 6 8 8 1 1 1 5 1
5 0 4 2 7 4 5 7 0
6 6
7 8 0 4 0
3 255 2 2 1 2 1 1 3 0 6 2
8 2 6 1 3 3 7 3 3 2
8 2 0 2 9 8 40
4 149 1 3 2 3 3 0 2 7 1 3
97 7 4 5 4 65 5 1
请预计该地域养牛总头数Y 及其预计量的相对标准差 s(Y) / Y 。

8.一企业希望预计某一个月内因为事故惹起的工时损失。

因工人、技术人员及行政管理人
员的事故率不一样,故采纳分层随机抽样。

已知以下资料:
工技术人行政管理
人员人员
N1=1 N 2=92 N3=27
32 S22=25 S32=9
S12=3
6
若总样本量 n=30,试用奈曼分派确立各层
的样本量。

9.上题中若实质检查了 18 个工人、 10 个技术人员、2 个行政人员,其损失的工时数以下:工人技术人行政管理人
员员
8,24,0, 4,5,0,1,8
0,16,32, 24,8,
6,0,16, 12,3,2,
7,4,4,9,1,8
5,8,18,
2,0
试预计总的工时损失数并给出它的置信度
为95%的置信区间。

10.某县欲检查某种农作物的产量,因为平原和山区的产量有差异,故拟区分为平原和山区
两层采纳分层抽样。

同时当年产量和昨年产量之
间有有关关系,故还计划采纳比预计方法。

已知平原共有120 个村,昨年总产量为24500(百斤),山区共有180 个村,昨年总产出为21200(百斤)。

现从平原用简单随机抽样抽取 6 个村,从山区抽
取9 个村,两年的产量资料列在下表中。

试用分别比预计与结合比预计分别预计当年的总产量,
给出预计量的标准误,并对上边的两种结果进
行比较和剖析。

平原
样本昨年产量当年产量(百
(百斤)斤)
1 204 210
2 14
3 160
3 82 75
4 256 280
5 275 300
6 198 190
山区
样本昨年产量当年产量(百
(百斤)斤)
1 137 150
2 189 200
3 119 125
4 63 60
5 103 110
6 10
7 100
7 159 180
8 63 75
9 87 90
11.一企业希望预计某一个月内因为事故
惹起的工时损失。

因工人、技术人员及行政管理人员的事故率不一样,因此采纳分层抽样。

已知以下资料:
工人技术人员行政管理人员
N1=132N2=92N3=27
S12=36S22=25S32=9
若样本量 n=30,试用你乃曼分派确立各层的样
本量。

12.上题中若实质检查了 18 个工人, 10 个技术人员, 2 个行政人员,此中损失的工时数以下:
工人技术人员行政管理人员8,24,0,0, 4,5,0,24,8, 1,8
16,32,12,3,2,1,8
6,0,16,7,4,
4,9,5,8,18,
2,0
试预计总的工时损失数并给出它的置信度为 95% 的置信区间。

13.在预计比率问题时:
(1)假定 P=0.5,W1=W2=0.5, 则 P1和 P2为什么值时能够使按比率分派的分层抽样精度能够受益
20%(即V(p prop)V(p srs) =0.8 )
(2) 若 P=4%,此中 W1=0.05 ,P1=45%;
W2=0.2 , P2=5%; W3=0.75, P 3=1%.则采纳按比率分派的分层抽样比简单随机抽样精度受益有多大?
14.检查某个地域的养牛头数,以村作为抽
样单元。

依据村的海拔高度和人口密度区分红四层,每层取10 个村作为样本单元,经过检查获
取以下数据
层村总数样本村养牛头数
1 2 3 4 5 6 7
8 9 10
1 1411 43 84 98 0 10 44 0
2 4705 124 1
3 0
3 2558 50 147 62 87 8
4 158 170
4 14997 104 56 160
228 262 110 232 139 178 334
0 63 220
17 34 25 34 36 0 25
7 15 31
要求:
(1)预计该地域养牛总头数 Y 及其预计量的相
对标准偏差 s(Y?) Y?
(2)议论分层抽样与不分层抽样比较效率有否
提升。

(3)若样本量不变采纳乃曼分派能够减少方差
多少?
15.用下边的工厂分组资料
按工人人数工厂数量每工厂产值标准差
分组(万元)
1—49 18260 100 80 50—99 4315 250 200 100—249 2233 500 600 250—999 1057 1760 1900 1000 人以 567 2250 2500

(1)若欲抽取 3000 个工厂作样原来预计产值,试比较以下各样分派的效率:
(2)按工厂数多少分派样本;
按最优(奈曼)分派。

16.一个样本为 1000 的简单随机样本,其结果可分为三层,相应的y2=10.2,12.6,17.1,s h2=10.82(各层相同),s2=17.66,预计的层权是 w h=0.5,0.3,0.2,已知这些权数有偏差,但偏差在5%之内,最不好的情
况是 W h
=0.525 ,0.285 ,0.190 或W h
=0.475 ,0.315 , 0.210 ,你 能否需要分 ?
17. 用函数拥有形式
L
c h n h ,
此中
C T c 0
h
1
c 0
, c h
( h=1, ⋯,L )均 已知数。

明当 的
2 2
用固定 , 了使 V ( y st ) 达到最小, n h 必与 (
W h
S h
)
c h
成比率。

18. 假 体包括大小相等的 L 个 ,且相 于 L 和 n 来 很大。

V ran 表示 随机 本均 的方差, V prop

示按比率分派的分 随机抽 的相 方差。

明以下两式近似建立:
2 3
N
( 1)
( 2)
2
1 L
2
nV ran S h
(Y h Y )
L h
1
nV prop
S h 2
此中 S h 2 表示 内的均匀方差,即 S h
2
1 L S h 2
L h 1。

相关文档
最新文档