应用抽样技术课后习题答案
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 f N n 1750 30 0.03276 b2 4ac n n N 30 1750
v( y ) 0.03276 798.73 26.168
se( y ) v( y ) 5.115
因此,对该校学生某月的人均购书支出额的估计为56.07 (元),由于置信度 95%对应的 t=1.96, 所以,可以以95%的把 , 握说该学生该月的人均购书支出额大约在56.07±1.96×5.115, 即50.96--61.19元之间。
N1 的95%的置信区间为: (159,776)
(3)N=1750,n=30,n1=8, t=1.96, p=0.267, q=1-0.267=0.733 由此可计算得: t 2 q 1.962 0.733 n0 2 1054.64 r p 0.01 0.267
n = n0/[1+(n0—1)/N] = 1054.64/[1+1053.64/1750]=658.2942 = 659
4.6 解 已知W1=0.2,W2=0.3,W3=0.5, P1=0.1,P2=0.2,P3=0.4 P=ΣhWhPh=0.28,Q=1—P=0.72 n=100的简单随机抽样估计方差:
V(Psrs) ≈ [(1—f ’)/100]PQ ≈ 0.28*0.72/100
= 0.002016 按比例分配的分层抽样的估计方差:
﹥0
5.4 解:
V(YR)≈[(1—f)/n]Y2[CY2+CX2—2rCYCX] V(Ysrs)=[(1—f)/n]SY2
故
=[(1—f)/n] CY2Y2
V(YR)/V(Ysrs) = 1—[2rCX/CY—CX2/CY2]
= 1-[2*0.696*1.054/1.063-1.0542/1.0632]
C X 时用第一种方法,当 2CY
CX 2CY时用第二种
2CY y 1 f 2 2 1 f 2 2 1 f 2 1 f 2 2, V ( ) Y CY R CY 2 V ( y) SY Y CY X nX n n n
,
若
y ˆ ) 1 f R 2 (C 2 C 2 2 C C ) V ( ) V (R Y X Y X x n y y 1 f 2 CX
(1 f ) pq 0.03389 0.1957 0.08144 n 1
1 0.0167 2n
P
的95%的置信区间为:
1
p (u
2
(1 f ) pq 1 ) 0.267 (1.96 0.08144 0.0167) n 1 2n
=(0.0907,0.4433)
故估计量 ylr 虽然与
一样都是 Y 的无偏估计, ylr
百度文库
但方差不小于 ylr 的方差,
当 0时 V ( ylr ) V ( ylr ) ,
故 ylr 不优于
ylr。
第六章 不等概率抽样
6.1假设对某个总体,事先给定每个单位的与 规模成比例的比值 Zi ,如下表,试用代码 法抽出一个n=3的 PPS 样本。
Mi
98 102 57 251 67 48 154 223
累计Mi
98 200 257 508 575 623 777 1000
代码
1~98 99~200 201~257 258~508 509~575 576~623 627~777 778~1000
应用抽样技术答案
第二章 抽样技术基本概念
2.7(1)抽样分布: 3 3.67 4.33 5 5.67 6.33 7 1/10 1/10 2/10 2/10 2/10 1/10 1/10 (2)期望为5,方差为4/3 (3)抽样标准误1.155 (4)抽样极限误差2.263 (5)置信区间(3.407,7.933)
= 25149054
se(Ysrs)= 5014.883
面积/ 产量/ 亩 斤 3 1400 2.5 1120 4.2 1710 3.6 1500 1.8 720 5.2 1980 3.2 1310 2.4 1080 2.6 1300 1.2 480 29.7 12600
5.6 解 (3) 回归估计:
V(Pprop) ≈ΣhWh2 [(1—fh)/nh] Ph Qh
≈ n-1ΣhWh Ph Qh = n-1[0.2*0.1*0.9+0.3*0.2*0.8+0.5*0.4*0.6]
= 0.186 n-1
故 n ≈ 92.26 ≈93
4.8 解 已知W1=0.7,W2=0.3,p1=1/43,p2=2/57 (1)简单随机抽样 Psrs=(1+2)/100=0.03 V(P)=PQ/(n-1)=0.03*0.97/99=0.0002937
(2)事后分层
Ppst=ΣhWhph=0.7*1/43+0.3*2/57=0.0268 V(Ppst) =ΣhWh2[(1—fh)/(nh—1)]phqh =0.72*[1/42](1/43)(42/43)+0.32*[1/56](2/57)(55/57) =0.00031942
第五章 比率估计与回归估计
回归系数 b = Sxy/Sxx2= 370.5965 ylr=x—b(x—X)=1260—370.5965*(2.97—460/140)=1377.089
Ylr=Nylr=192792.47(斤)
v(Ylr)=[N2(1—f)/n] *∑i=1n [yi—y—b(xi—x)]2/(n--2) =[1402(1—10/140)/80]*89480.59 = 20356834 se(Ylr)= 4511.855
t=1.96 (2)易知,N=1750,n=30, n1 8 n 8 1 f N n 1750 30 p 1 0.267 0.03389 n 1 (n 1) N 29 1750 n 30
pq p(1 p) 0.267 0.733 0.1957
第三章 简单随机抽样
3.3为调查某中学学生的每月购书支出水平,在全校 名学生中,用不放回简单随机抽样的方法抽得一 个的样本。对每个抽中的学生调查其上个月的购 书支出金额 yi (如表1所示)。 (1)在95%的置信度下估计该校学生该月平均购书支 出额; (2)试估计该校学生该月购书支出超出70元的人数; (3)如果要求相对误差限不超过10%,以95%的置信 度估计该校学生该月购书支出超出70元的人数比 例,样本量至少应为多少。
计算结果说明,至少应抽取一个样本量为659的简单随机 样本,才能满足95%置信度条件下相对误差不超过10%的精度 要求。
3.5要调查甲乙两种疾病的发病率,从历史资料得知, 甲种疾病的发病率为8%,乙种疾病的发病率为5 %,求: (1)要得到相同的标准差0.05,采用简单随机抽样各 需要多大的样本量? (2)要得到相同的变异系数0.05,又各需要多大的样 本量?
2CY C = X 2CY C X 2CY
则
V(
) V ( ) X x
n
R C X (2 CY C X )<0
V(
V(
y y 1 f 2 ) V ( ) R C X (2 CY C X ) 0 X x n
y y 1 f 2 ) V ( ) R C X (2 CY C X ) X x n
1-f 1 N 1 n [Yi 2 B( X i X ) Y ]2 V ( y ) V { [ yi 2 B( xi X )]} = n N 1 i 1 n i 1
1 f 2 1 f 2 2 2 ( S Y 4 B S X 4 BS YX ) [ S Y 4 B( BS x2 S YX )] n n 1-f 2 1 f 2 SY S Y (1 2 ) V ( ylr ) n n
样本 序号
21 22 23 24 25 26 27 28 29 30
支出额 (元)
49 45 95 36 25 45 128 45 29 84
3.3解:(1)依据题意和表1的数据,有:
1682 2 56.07(元), s y (118266 16822 / 30) / 30 798.73 yi 1682, y 30
^ ^
5.6 解 (2) 比率估计: R =∑i=1n Yi/ ∑i=1n Xi = 12600/29.7
= 424.2424
YR= XR = 460*424.2424 = 195151.5(斤) v(YR)=[N2(1—f)/n] *∑i=1n (yi—RXi )2/(n--1) =[1402(1—10/140)/90]*124363.5
2 d
5.6 解 (1) 简单估计:
总产量: Ysrs=(N/n)∑i=1n Yi=(140/10)[1400+1120+…+480]
^
=176400(斤)
v(Ysrs)=[N2(1—f)/n]SY2 =[1402(1—10/140)/10]*194911.1 = 354738222 se(Ysrs)= 18834.496
= 1-0.397076 = 0.602924
5.5 证明:由(5.6)得:
V ( yR ) 1 f n
2 ( Y RX ) i i i 1 N
N 1
N n 2 Sd Nn
N n 2 令 Sd V , Nn
则n( NV S ) NS ,
2 d 2 d
S 2 NS d V 从而n 2 2 NV S d Sd 1 NV
表1 总体单位规模比值
i
1
zi
0.098
i
6
zi
0.067
2
3 4
0.102
0.057 0.251
7
8 9
0.048
0.154 0.223
6.1解:令 M 0 1000 ,则可以得到下表,从1-1000中 产生n=3个随机数,设为108,597,754,则第二、 第六和第七个单位入样。 i
1 2 3 4 5 6 7 8
5.7解:
n 1 n ylr ylr B( X x ) y 2 B( X x ) [ yi 2 B( xi X )] n i 1 E ( ylr ) E ( ylr ) B[ X E ( x )] Y
lr
E ( ylr ) Y , V ( ylr ) 1 f SY2 (1 2 )
5.2 N=2000, n=36, 1-α =0.95, t=1.96, ˆ ) 0.000015359, f = n/N=0.018, v( R ˆ ) =0.00392 se( R 置信区间为[40.93%,42.47%]。
第五章 比率估计与回归估计
5.3当 方法,当 = C X 时两种方法都可使用。这是因为:
表1
样本 序号
1 2 3 4 5 6 7 8 9 10
30名学生某月购书支出金额的样本数据
支出额 (元)
85 62 42 15 50 39 83 65 32 46
样本 序号
11 12 13 14 15 16 17 18 19 20
支出额 (元)
20 75 34 41 58 63 95 120 19 57
3.5解:已知
PQ (1) 由 n0 得: V ( p)
1 0
P1= 0.08, Q1= 1-P1 = 0.92; P2= 0.05, Q2 = 1– P2 = 0.95; V(p) = 0.05*0.05
,
0.08 0.92 n 30 2 0.05 Q (2 得: 由 n0 2 ) Cv ( p) P
0.92 n 4600 2 0.05 0.08
1 0
0.05 0.95 n 19 2 0.05
2 0
0.95 n 7600 2 0.05 0.05
2 0
第四章 分层抽样
4.3解:
s( yst ) 3.08 (元) (元) (1) yst 20.07 , (2)按比例分配 n=186,n1=57,n2=92,n3=37 (3)Neyman分配 n=175,n1=33,n2=99,n3=43 4.5 yst 75.79 ,置信区间(60.63,90.95)元。 (元)
v( y ) 0.03276 798.73 26.168
se( y ) v( y ) 5.115
因此,对该校学生某月的人均购书支出额的估计为56.07 (元),由于置信度 95%对应的 t=1.96, 所以,可以以95%的把 , 握说该学生该月的人均购书支出额大约在56.07±1.96×5.115, 即50.96--61.19元之间。
N1 的95%的置信区间为: (159,776)
(3)N=1750,n=30,n1=8, t=1.96, p=0.267, q=1-0.267=0.733 由此可计算得: t 2 q 1.962 0.733 n0 2 1054.64 r p 0.01 0.267
n = n0/[1+(n0—1)/N] = 1054.64/[1+1053.64/1750]=658.2942 = 659
4.6 解 已知W1=0.2,W2=0.3,W3=0.5, P1=0.1,P2=0.2,P3=0.4 P=ΣhWhPh=0.28,Q=1—P=0.72 n=100的简单随机抽样估计方差:
V(Psrs) ≈ [(1—f ’)/100]PQ ≈ 0.28*0.72/100
= 0.002016 按比例分配的分层抽样的估计方差:
﹥0
5.4 解:
V(YR)≈[(1—f)/n]Y2[CY2+CX2—2rCYCX] V(Ysrs)=[(1—f)/n]SY2
故
=[(1—f)/n] CY2Y2
V(YR)/V(Ysrs) = 1—[2rCX/CY—CX2/CY2]
= 1-[2*0.696*1.054/1.063-1.0542/1.0632]
C X 时用第一种方法,当 2CY
CX 2CY时用第二种
2CY y 1 f 2 2 1 f 2 2 1 f 2 1 f 2 2, V ( ) Y CY R CY 2 V ( y) SY Y CY X nX n n n
,
若
y ˆ ) 1 f R 2 (C 2 C 2 2 C C ) V ( ) V (R Y X Y X x n y y 1 f 2 CX
(1 f ) pq 0.03389 0.1957 0.08144 n 1
1 0.0167 2n
P
的95%的置信区间为:
1
p (u
2
(1 f ) pq 1 ) 0.267 (1.96 0.08144 0.0167) n 1 2n
=(0.0907,0.4433)
故估计量 ylr 虽然与
一样都是 Y 的无偏估计, ylr
百度文库
但方差不小于 ylr 的方差,
当 0时 V ( ylr ) V ( ylr ) ,
故 ylr 不优于
ylr。
第六章 不等概率抽样
6.1假设对某个总体,事先给定每个单位的与 规模成比例的比值 Zi ,如下表,试用代码 法抽出一个n=3的 PPS 样本。
Mi
98 102 57 251 67 48 154 223
累计Mi
98 200 257 508 575 623 777 1000
代码
1~98 99~200 201~257 258~508 509~575 576~623 627~777 778~1000
应用抽样技术答案
第二章 抽样技术基本概念
2.7(1)抽样分布: 3 3.67 4.33 5 5.67 6.33 7 1/10 1/10 2/10 2/10 2/10 1/10 1/10 (2)期望为5,方差为4/3 (3)抽样标准误1.155 (4)抽样极限误差2.263 (5)置信区间(3.407,7.933)
= 25149054
se(Ysrs)= 5014.883
面积/ 产量/ 亩 斤 3 1400 2.5 1120 4.2 1710 3.6 1500 1.8 720 5.2 1980 3.2 1310 2.4 1080 2.6 1300 1.2 480 29.7 12600
5.6 解 (3) 回归估计:
V(Pprop) ≈ΣhWh2 [(1—fh)/nh] Ph Qh
≈ n-1ΣhWh Ph Qh = n-1[0.2*0.1*0.9+0.3*0.2*0.8+0.5*0.4*0.6]
= 0.186 n-1
故 n ≈ 92.26 ≈93
4.8 解 已知W1=0.7,W2=0.3,p1=1/43,p2=2/57 (1)简单随机抽样 Psrs=(1+2)/100=0.03 V(P)=PQ/(n-1)=0.03*0.97/99=0.0002937
(2)事后分层
Ppst=ΣhWhph=0.7*1/43+0.3*2/57=0.0268 V(Ppst) =ΣhWh2[(1—fh)/(nh—1)]phqh =0.72*[1/42](1/43)(42/43)+0.32*[1/56](2/57)(55/57) =0.00031942
第五章 比率估计与回归估计
回归系数 b = Sxy/Sxx2= 370.5965 ylr=x—b(x—X)=1260—370.5965*(2.97—460/140)=1377.089
Ylr=Nylr=192792.47(斤)
v(Ylr)=[N2(1—f)/n] *∑i=1n [yi—y—b(xi—x)]2/(n--2) =[1402(1—10/140)/80]*89480.59 = 20356834 se(Ylr)= 4511.855
t=1.96 (2)易知,N=1750,n=30, n1 8 n 8 1 f N n 1750 30 p 1 0.267 0.03389 n 1 (n 1) N 29 1750 n 30
pq p(1 p) 0.267 0.733 0.1957
第三章 简单随机抽样
3.3为调查某中学学生的每月购书支出水平,在全校 名学生中,用不放回简单随机抽样的方法抽得一 个的样本。对每个抽中的学生调查其上个月的购 书支出金额 yi (如表1所示)。 (1)在95%的置信度下估计该校学生该月平均购书支 出额; (2)试估计该校学生该月购书支出超出70元的人数; (3)如果要求相对误差限不超过10%,以95%的置信 度估计该校学生该月购书支出超出70元的人数比 例,样本量至少应为多少。
计算结果说明,至少应抽取一个样本量为659的简单随机 样本,才能满足95%置信度条件下相对误差不超过10%的精度 要求。
3.5要调查甲乙两种疾病的发病率,从历史资料得知, 甲种疾病的发病率为8%,乙种疾病的发病率为5 %,求: (1)要得到相同的标准差0.05,采用简单随机抽样各 需要多大的样本量? (2)要得到相同的变异系数0.05,又各需要多大的样 本量?
2CY C = X 2CY C X 2CY
则
V(
) V ( ) X x
n
R C X (2 CY C X )<0
V(
V(
y y 1 f 2 ) V ( ) R C X (2 CY C X ) 0 X x n
y y 1 f 2 ) V ( ) R C X (2 CY C X ) X x n
1-f 1 N 1 n [Yi 2 B( X i X ) Y ]2 V ( y ) V { [ yi 2 B( xi X )]} = n N 1 i 1 n i 1
1 f 2 1 f 2 2 2 ( S Y 4 B S X 4 BS YX ) [ S Y 4 B( BS x2 S YX )] n n 1-f 2 1 f 2 SY S Y (1 2 ) V ( ylr ) n n
样本 序号
21 22 23 24 25 26 27 28 29 30
支出额 (元)
49 45 95 36 25 45 128 45 29 84
3.3解:(1)依据题意和表1的数据,有:
1682 2 56.07(元), s y (118266 16822 / 30) / 30 798.73 yi 1682, y 30
^ ^
5.6 解 (2) 比率估计: R =∑i=1n Yi/ ∑i=1n Xi = 12600/29.7
= 424.2424
YR= XR = 460*424.2424 = 195151.5(斤) v(YR)=[N2(1—f)/n] *∑i=1n (yi—RXi )2/(n--1) =[1402(1—10/140)/90]*124363.5
2 d
5.6 解 (1) 简单估计:
总产量: Ysrs=(N/n)∑i=1n Yi=(140/10)[1400+1120+…+480]
^
=176400(斤)
v(Ysrs)=[N2(1—f)/n]SY2 =[1402(1—10/140)/10]*194911.1 = 354738222 se(Ysrs)= 18834.496
= 1-0.397076 = 0.602924
5.5 证明:由(5.6)得:
V ( yR ) 1 f n
2 ( Y RX ) i i i 1 N
N 1
N n 2 Sd Nn
N n 2 令 Sd V , Nn
则n( NV S ) NS ,
2 d 2 d
S 2 NS d V 从而n 2 2 NV S d Sd 1 NV
表1 总体单位规模比值
i
1
zi
0.098
i
6
zi
0.067
2
3 4
0.102
0.057 0.251
7
8 9
0.048
0.154 0.223
6.1解:令 M 0 1000 ,则可以得到下表,从1-1000中 产生n=3个随机数,设为108,597,754,则第二、 第六和第七个单位入样。 i
1 2 3 4 5 6 7 8
5.7解:
n 1 n ylr ylr B( X x ) y 2 B( X x ) [ yi 2 B( xi X )] n i 1 E ( ylr ) E ( ylr ) B[ X E ( x )] Y
lr
E ( ylr ) Y , V ( ylr ) 1 f SY2 (1 2 )
5.2 N=2000, n=36, 1-α =0.95, t=1.96, ˆ ) 0.000015359, f = n/N=0.018, v( R ˆ ) =0.00392 se( R 置信区间为[40.93%,42.47%]。
第五章 比率估计与回归估计
5.3当 方法,当 = C X 时两种方法都可使用。这是因为:
表1
样本 序号
1 2 3 4 5 6 7 8 9 10
30名学生某月购书支出金额的样本数据
支出额 (元)
85 62 42 15 50 39 83 65 32 46
样本 序号
11 12 13 14 15 16 17 18 19 20
支出额 (元)
20 75 34 41 58 63 95 120 19 57
3.5解:已知
PQ (1) 由 n0 得: V ( p)
1 0
P1= 0.08, Q1= 1-P1 = 0.92; P2= 0.05, Q2 = 1– P2 = 0.95; V(p) = 0.05*0.05
,
0.08 0.92 n 30 2 0.05 Q (2 得: 由 n0 2 ) Cv ( p) P
0.92 n 4600 2 0.05 0.08
1 0
0.05 0.95 n 19 2 0.05
2 0
0.95 n 7600 2 0.05 0.05
2 0
第四章 分层抽样
4.3解:
s( yst ) 3.08 (元) (元) (1) yst 20.07 , (2)按比例分配 n=186,n1=57,n2=92,n3=37 (3)Neyman分配 n=175,n1=33,n2=99,n3=43 4.5 yst 75.79 ,置信区间(60.63,90.95)元。 (元)