抽样调查习题课及详解
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1
−
α
≈
P
⎪⎧ ⎨
⎪⎩
r−R E(r − R)2
≤
u1−
α 2
⎪⎫ ⎬ ⎪⎭
{=
P
r
−
u1−
α 2
E(r
−
R)2
≤
R
≤
r
+
u1−
α 2
} E(r − R)2
定理 2. 5. 1
在简单随机抽样下 , 若存在与 N无关的数
ε (> 0), M , 使ε < X i < M , Yi < M(i = 1,..., N),则有
p11 习题一 3. 假定你对一本厚厚的英文字典进行研究, 调查书中的收词总数。你认为以什么作为 抽样单元比较合理?如果被调查的书中有 大幅的插图,该如何处理?
第一、二章 习题课
1 .某校高一共有学生1000名,预调查50名 学生,英语期末考试的成绩分别如下: 现在要求在满足P{ y − Y < 2} = 0.95的条件下, 设 计一个简单随机抽样调查方案,并具体实施 抽样调查,并给出调查的结果。
1 . d =2, N =1000, s 2 =125.702
i =1
− rxi )2 )] =
1 N −1
N
(Yi
i =1
− RX i )2
+ O(n−1 ); (2.5.3)
n
n
n
n
∑ ∑ ∑ ∑ ( yi − rxi )2 =
yi2 + r 2
x
2 i
−
2r
xi yi
i =1
i =1
i =1
i =1
n
n
n
∑ ∑ ∑ = yi + r 2 xi − 2r xi yi
)]
=
2c n
(Y1
− YN
)
n N
(1 −
n N
)(1 −
−1 ) ( N − 1)
=
2c N − 1 (Y1
− YN )(1 −
f)
(2)
V( yS )
=
(1 −
f
)[S 2
/n−
2c N − 1 (YN
− Y1
− nc)]
4. 证明: (2)
Var(c(D1
−
DN
))
=
2c2
n (1− N −1
f
)[S 2
/n−
2c N − 1 (YN
− Y1
− nc)]
4. 证明: (2)
∑ ∑ 2Cov ( 1 n
N
Yi Di , c( D1
i =1
−
DN
)) =
2c n
N
YiCov ( Di , ( D1
i =1
−
DN ))
∑ =
2c N −1
n
[ YiCov ( Di , ( D1
i=2
−
DN )) + Y1Cov ( D1 , ( D1
[0.7937,0.8063]
1 − α ≈ P⎪⎨⎧
⎪⎩
r−R E(r − R)2
≤
u1−
α 2
⎪⎫ ⎬ ⎪⎭
{=
P
r
−
u1−
α 2
E(r
−
R)2
≤
R
≤
r
+
u1−
α 2
} E(r − R)2
4.设Y1, YN是总体中最小者和最大者。抽取
样本量为n的简单随机样本,定义的估计量
如下:
yS
=
⎧y+
⎪ ⎨
⎯估⎯⎯计→ E(r − R)2
n
n
n
n
∑ ∑ ∑ ∑ ( yi − rxi )2 = yi + r 2 xi − 2r xi yi
i =1
i =1
i =1
i =1
= 40 + 0.82 × 50 − 1.6 × 40
=8
∑ 1
nx 2
1 n−1
n i =1
( yi
−
rxi )2
=
10 3
8 × 0.052 × 999
= c2[Var(D1) +Var(DN ) − 2Cov(D1, DN )]
= c2[2⋅ n (1− n ) − 2⋅
−n
(1−
n )]
N N N(N −1) N
= 2c2 n (1− n )(1+ 1 ) N N N −1
= 2c2 n (1− f ) N −1
(2)
V( yS )
=
(1 −
−
DN ))
+ YN Cov ( DN , ( D1 − DN ))]
=
2c n [Y1Cov ( D1 , ( D1
−
DN
)) + YN Cov ( DN , ( D1
−
DN
))]
=
2c n [(Y1
− YN
)
n N
(1 −
n N
) − (Y1
− YN
)
− n (1 − N ( N − 1)
n N
f )+
2c N−
1
(Y1
−
YN
)(1
−
f)
=
(1−
f
)[ SY2 n
−
2c N −1(YN
−Y1
− nc)]
5.从一个有限总体中抽了一个含量为
n=n1 + n2的简单随机样本, 均值是 y , 从
这个样本中抽了一个含量为n1的子样, 均值
是 y1。 n1 y1 + n2 y2 = ny
证明: (1)
n
=
d2
(
u1−
α 2
)2
S
2
+
1 N
(
u1
−
α 2
)2
S
2
=
1
d2
(
u1−
α 2
)2
S
2
+
1 N
=
1 22 (1.96)2 × 125.7
+
1 1000
≈ 108
2.调查费用为c0+c1n , 损失与误差a E( y − Y )2 成正比。 使总费用及损失 c0 + c1n+ a E( y −Y )2 最小, 求出样本容量n.
≈
3.2 × 10−3
1
−
α
≈
P
⎪⎧ ⎨
⎪⎩
r−R E(r − R)2
≤
u1−
α 2
⎪⎫ ⎬ ⎪⎭
{=
P
r
−
u1−
α 2
E(r −
R)2
≤
R≤
r
+
u1−
α 2
} E(r − R)2
r = 0.8, E (r − R)2 ≈ 3.2 × 10−3 , u0.975 = 1.96
患者中吸烟所占比例的95% 置信区间为
(1 n
−
1 N
)
=
1 n4
n
≈
⎜⎜⎝⎛
aS 2c1
⎟⎟⎠⎞ 2 /
3
3. 某调查要估计某种疾病患者中,吸烟人 所占的比例,随机抽了1000人中,有这种 疾病的人有50人,其中有40人吸烟,试求 患者中吸烟所占比例的95% 置信区间。
3. 某调查要估计某种疾病患者中,烟民所 占的比例,随机抽了1000人中,有这种疾 病的人有50人,其中有40人吸烟,试求患 者中吸烟所占比例的95% 置信区间。
i =1
i =1
i =1
∑ ( 2) E ( r
−
R)2
≈
1− f nX 2 ( N − 1)
N i =1
(Yi
−
RX
i
)2
∑ ∑ (3)E[( 1 n−1
n
( yi
i =1
− rxi )2 )] ≈
1 N −1
N
(Yi
i =1
−
RX i )2
忽略抽样比
∑ 1
nx 2
1 n−1
n
( yi
i =1
− rxi )2
N
Yi Di
i =1
+
c( D1
−
DN
))
∑ ∑ =
Var( 1 n
N i =1
Yi Di
)
+ Var(c( D1
−
DN
)) +
2Cov( 1 n
N i =1
Yi
Di
, c(D1
−
DN
))
∑ =
1− f n
SY2
+
Var(c(
D1
−
DN
))
+
2Cov(
1 n
N
Yi Di , c(D1 − DN ))
=
n n2
E{ E[ y1 −
y 第一次抽样取定
]}
=0
E[ y1 − y 第一次抽样取定 ] = E[ y1 第一次抽样取定 ] − E[ y 第一次抽样取定 ] = y− y=0
5. 证明: (1)
y1
−
y2
=
n n2
( y1
−
y)
Var ( y1 − y2 )
=
⎜⎜⎝⎛
n n2
⎟⎟⎠⎞
2
Var
y
−
c, c,
若样本中含 Y1而不含 YN 若样本中含 YN而不含Y1
⎪⎩ y,
其他
其中c是一个常数。
试证:(1)y S 是 y 的无偏估计量;
(2)y
S
的方差是
(1 −
f
)[S 2
/n−
2c N − 1 (YN
− Y1
−
nc)]ቤተ መጻሕፍቲ ባይዱ
.
(1) E ( y S ) = Y 4. 证明: (1)
⎧ y + c,
p11 习题一 1 .普查:对研究对象的全体进行全面调查. 优点:获得全面的信息。 缺点:需投入大量的人力、物力,且时间较长。 概率抽样调查:非全面调查中运用概率统
计理论指导的抽样调查方法。 优点:1.节约人力、物力,节省时间。
2.利用已知信息,设计适宜的抽样方案, 获得有代表性的样本 , 从而对总体 的特征指标做出好的估计及误差。 缺点:获得非全面的信息。
yS
=
⎪ ⎨
y
−
c,
若样本中含 Y1而不含 YN 若样本中含 YN而不含Y1
⎪⎩ y,
其他
= y + cD1(1 − DN ) − cDN (1 − D1 )
E( yS ) = E( y) + cE[D1(1− DN )]− cE[DN (1− D1)] = Y + c( n − n(n −1) ) − c( n − n(n −1) ) N N(N −1) N N(N −1) =Y
⇒
Cov( y1
−
y, y) =
Var( y1 ) − [Var( y1 − 2
y
) + Var( y
)]
Var( y1
−
y
)=
S2( 1 n1
−
1) n
Var( y) = S 2 ( 1 − 1 ) nN
Var(
y1 )
=
S2( 1 n1
−
1 N
)
Cov ( y1 − y , y ) = 0
p11 习题一 1 .概括普查和抽样调查的优缺点。考虑确保这 些调查获得成功的前提条件和注意事项。
(
y1
−
y)
=
⎜⎜⎝⎛
n n2
⎟⎟⎠⎞2 E ( y1
−
y)2
=
⎜⎜⎝⎛
n n2
⎟⎟⎠⎞2 E[E (( y1
−
y)2
第一次抽样取定
)]
E[( y1 − y)2 第一次抽样取定 ] = ( 1 − 1 )s2
n1 n
E ( y1 − y)2
= E[( 1 − 1 )s 2 ] n1 n
= ( 1 − 1 )S2 = n2 S2
n1 n
nn1
Var (
y1
−
y2 )
=
⎜⎜⎝⎛
n n2
⎟⎟⎠⎞2 E (
y1
−
y)2
=
⎜⎜⎝⎛
n n2
⎟⎟⎠⎞ 2
⋅
n2 nn1
S2
= n S2 = ( 1 + 1 )S2
n1n2
n1 n2
5. (3) Cov ( y1 − y , y ) = 0
Var( y1 ) = Var( y1 − y ) + Var( y ) + 2Cov( y1 − y, y)
p11 习题一 2 .有人说:“只有确信样本能很好地代表总体, 调查研究人员才能肯定样本均值与总体均值相 一致。但是研究人员不能绝对地肯定样本是否 真正有代表性,他总要允许分析结果有一个较 小的误差范围。”你对这段话有何评述?
p11 习题一 2 . 样本是构成总体的一部分,这部分单元的特 征或多或少地反映了总体的特征。但是,它毕 竟是总体的一部分,而非全部,没有任何一个 人在未进行全面调查就断言:“它取得的样本能 很好的代表总体”,多数抽样的情况是:样本与 总体的特征有所偏离,即误差。我们在抽样时 利用已知信息, 设计适宜的抽样方案, 获得有代 表性的样本 , 从而对总体的特征指标做出的估计 的误差就会得到有效的控制。
(2)
V( yS )
=
(1 −
f
)[S 2
/n−
2c N − 1 (YN
− Y1
− nc)]
4. 证明: (2)
yS = y + cD1(1 − DN ) − cDN (1 − D1)
∑ =
1 n
N i =1
Yi Di
+
c( D1
−
DN
)
V ( yS ) = Var( yS )
∑ = Var( 1 n
f
)
∑ 1
2Cov ( n
N
Yi Di , c( D1 −
i=1
DN )) =
2c N − 1 (Y1
− YN )(1 −
f
)
∑ V
(
yS
)
=
1
− n
f
SY2
+Var(c(D1
−
DN
))
+
2Cov(
1 n
N
Yi Di ,c(D1 − DN ))
i =1
V
(
yS
)
=
1
− n
f
SY2
+ 2c2
n (1− N −1
2
1/ n2 1− 1
=0
nN
2.调查费用为c0+c1n , 损失与误差a E( y − Y )2 成正比。 使总费用及损失 c0 + c1n+ a E( y −Y )2
最小, 求出样本容量n.
f ′(n) =
c1
− aS
2
1/ n2 1− 1
=0
nN
2c1 aS
1− n
1 N
=
1 n2
4c12 a2S2
Var( y1
−
y2 )
=
S2( 1 n1
+
1 n2
)
(2)
Var( y1 −
y
)=
S2( 1 n1
− 1) n
(3) Cov ( y1 − y , y ) = 0 .
5. 证明: (1)
y1
−
y2
=
n n2
( y1
−
y)
E[ y1
−
y2] =
n n2
E[ y1
−
y]
n1 y1 + n2 y2 = ny
(1)E (r
−
R)
=
−
cov( r ,
x)
=
1 O(
);
(2.5.1)
X
n
∑ ( 2) E ( r
−
R)2
=
1− f nX 2 ( N − 1)
N i =1
(Yi
−
RX i )2
+
1 O( n1.5
)
= O( 1 ), 其中 f = n ; (2.5.2)
n
N
∑ ∑ (3)E[( 1
n−1
n
( yi
2.调查费用为c0+c1n , 损失与误差a E( y − Y )2 成正比。 使总费用及损失 c0 + c1n+ a E( y −Y )2 最小, 求出样本容量n.
f (n) = c0 + c1n+ a E( y −Y )2
= c0 + c1n+ aS
1− 1 nN
f ′(n) = c1
− aS
i =1
(2)
V( yS )
=
(1 −
f
)[S 2
/n−
2c N − 1 (YN
− Y1
− nc)]
4. 证明: (2)
∑ V
(
yS
)
=
1
− n
f
SY2
+
Var(c(
D1
−
DN
))
+
2Cov(
1 n
N
Yi Di ,c(D1
i =1
− DN ))
Var(c(D1 − DN )) = c2Var((D1 − DN ))