抽样技术题目
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、 简单随机抽样
1、在简单随机抽样中,试证明比估计R y 是总体均值Y 的渐近无偏估计,并求其方差。
证明:X R Y = X x
y
X R Y y R =
==∧
∧
()
⎪⎭
⎪⎬⎫
⎪⎩⎪⎨
⎧⎥⎥⎦⎤⎢⎢⎣⎡
⎪⎪⎭⎫ ⎝⎛⎪⎪⎭
⎫
⎝
⎛-+⎪⎪⎭⎫
⎝
⎛-+⎪⎪⎭⎫ ⎝⎛--=⎥⎥⎥⎥⎥⎦
⎤⎢⎢⎢⎢⎢
⎣⎡
⎪⎪⎭⎫ ⎝
⎛-+=⎪⎪⎭⎫ ⎝⎛=2
2
11X X x o X X x X X x X y E X X X x X y
E X X x y E y E R
由于0−→−-P
X x 即0→-X X
x 所以()()
Y y E X y E X y E R ==⎪⎪⎭
⎫ ⎝⎛= 得证。 由于0−→−
-P
X x 即0→-X
X
x 所以()
()()
2
22
2
1Z R
S n f x R y Var x R y E X x R y E X y Var -=-=-=⎪⎪⎭
⎫ ⎝⎛-= 其中:RX Y Z -=故()
()()(
)[]()
2
222
1
2111X
XY Y N i i i R
S R RS S
n
f
X R Y RX Y N n f y Var +--=-----=∑= 2、对于简单随机抽样,总体均值Y 的回归估计量定义为:()lr y y X x β=+-,如β为常数(记为
β),证明
证明:
3、在简单随机抽样中,已知变量总体均值Y 的回归估计量定义为)(x X y y lr -+=β,若β为常数(记为0β),且有Y y E lr =)(, 求证:(1))2(1)(02
202xy x y lr S S S n
f y V ββ-+-=
(2)使)(lr y V 最小的0β为x
y x
xy S S S
S ρ
β==
20;其中y
x xy S S S =
ρ.
证明:(1)[]∑=--+--=N i i
i lr Y X X Y N n f y V 1
2
0)(111)(β (2)求)(lr y V 对0β的偏导数:
将0β的值代入)(lr y V ,验证其最小值存在,此时
4、研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:
编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 10
240
20
120
估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。 解析:由已知得:200=N 20=n
根据表中数据计算得:5.14420120
1
==∑=i i y y 因此该小区平均文化支出Y 的95%置信区间为:])(y [2
y V z α±即是:[ ,],故估计该小区平
均的文化支出Y =,置信水平95%的置信区间为[ ,]。
5、某地区对本地100家化肥生产企业的尿素产量进行调查,一直去年的总产量为2135吨,抽取10个企业调查今年的产量,得到25=y ,这些企业去年的平均产量为22=x 。试估计今年该地区化肥总产量。
解析:由题可知22x =,
35.211002135
===
N X X ,25y =
则,该地区化肥产量均值Y 的比率估计量为
26
.242425
35.21===∧
x y X
Y
该地区化肥产量总值Y 的比率估计量为 242626.24*100ˆˆ===R Y N Y 所以,今年该地区化肥总产量的估计值为2426吨。
二、 分层随机抽样
6、在分层随机抽样的分别比估计中:(1)试证明Y y E RS =)(;(2)求出其方差。
(1) 证明:根据题意: ∑∑∑======L
h h
h h L h h h h L
h h h h
h RS R E X W X R W E X x y W E y E 1
11)ˆ()ˆ()()(Θ
又h h h X Y R E =
)ˆ(ΘY Y W X Y E X W h L
h h L h h h
h h ===∴∑∑==1
1)(上式 综上可得:Y y E RS =)( (2) 解:由第一问可知)ˆ()ˆ()(1
21
h
h L
h h L h h h h RS X R V W X R W V y V ∑∑==== 而)2(1)()ˆ(222x yx y S R RS S n
f y V X R V +--==)2(1)(22212xh h yxh h yh h h L
h h RS S R S R S n f W y V +--⋅=∴∑= 8、调查某地区居民的奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民户划分为4层,每层按简单随机抽样抽取10户,调查后各层样本户的奶制品年消费支出的中间结果如下表所示:
请估计该地区居民奶制品的年消费总支出及其95%的置信区间。 解析:根据表中的数据可得4
_
^
1
209650()st h h h Y N y ===∑元;
估计量方差^()st V Y 的无偏估计为^
281
()()/ 5.38610L
st h h h h h h v Y N N n s n ==-≈⨯∑,
进而有23207.6()≈≈元。
^
st Y 的95%的置信区间为^0.025st Y z ±0.025z =,经计算可得
因此,可以有95%的把握认为该地区居民奶制品的年消费总支出在164163~255137元之间。 7、试述分别比估计和联合比估计的比较。
答:如果每一层都满足比率估计量有效的条件,则除非hRR ,都有分别比率估计量的方差小于联合比率估计量的方差。但当每层的样本量不太大时,还是采用联合比率估计量更可靠些,因为这时分别比率估计量的偏倚很大,从而使总的均方误差增大。
实际使用时,如果各层的样本量都较大,且有理由认为各层的比率hR 差异较大,则分别比率佑计优于联合比率估计。当各层的样本量不大,或各层比率hR 差异很小,则联合比率估计更好些。
三、 等概率整群抽样和多阶段抽样