抽样技术课后习题答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样技术课后习题答案
第⼆章习题
2.1判断下列抽样⽅法是否是等概的:
(1)总体编号
1~64,在0~99中产⽣随机数r ,若0或r>64则舍
弃重抽。
(2)总体编号
1~64,在0~99中产⽣随机数r ,r 处以64的余数
作为抽中的数,若余数为0则抽中64.
(3)总体
20000~21000,从1~1000中产⽣随机数r 。
然后⽤19999
作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有⼀些⼏个特点:第⼀,按照⼀定的概率以随机原则抽取样本。
第⼆,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当⽤样本对总体⽬标进⾏估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?
解析:抽样理论和数理统计中关于样本均值的定义和性质的不同
抽样理论
概率统计
定义 ∑==n
i i y n y 1
1
∑==n
i i
y n y 1
1
性质
1.期望()
()()()Y C P E N
N C N C ===∑∑==n n
1
i n i 1i i i 1
y y y
2.⽅差()()()[]()i
i
P y E y y V n N
2
1
∑=-=
=()()[]
n N
C i i
i
C y E y n N
12
1
∑=- ()21S n
f -=
1.期望()
??=∑=n i i y n E y E 11()∑==n
i y E 1
i n 1
[]µµ==
n n
1
2.⽅差()[]
2
µ-=i y E y V
2
11
-=∑=n i i y n E µ
()n
y n 122
i σµ=-=E
2.3为了合理调配电⼒资源,某市欲了解50000户居民的⽇⽤电量,从中简单随机抽取了300户进⾏,现得到其⽇⽤电平均值=y 9.5(千⽡时)
,=2s 206.试估计该市居民⽤电量的95%置信区
间。
如果希望相对误差限不超过10%,则样本量⾄少应为多少?
解:由已知可得,50000,300,5.9y =,2062
1706366666206*300
50000300
1500001)()?(222=-
=-==s n
f N y N v Y
V 19.413081706366666(==)y v
该市居民⽤电量的95%置信区间为
[])(y [2
y V z N α
±=[475000±1.96*41308.19]
即为(394035.95,555964.05)由相对误差公式y
)
(v u 2y α≤10%
可得%10*5.9206*n
50000
n 1*
96.1≤-
即n ≥862
欲使相对误差限不超过10%,则样本量⾄少应
为862
2.4某⼤学10000名本科⽣,现欲估计爱暑假期间参加了各类英语培训的学⽣所占的⽐例。
随机抽取了两百名学⽣进⾏调查,得到0.35,是估计该⼤学所有本科⽣中暑假参加培训班的⽐例的95%置信区间。
解析:由已知得:10000=N 200=n 35.0=p 02.0==
N
n
f ⼜有:35.0)()(===∧p p E p E 0012.0)1(1
1)(=---=∧p p n f
p V
该⼤学所有本科学⽣中暑假参加培训班的⽐例95%的置信区间为:])()([2
∧
∧
±P V Z P E α
代⼊数据计算得:该区间为[0.2843,0.4157]
2.5研究某⼩区家庭⽤于⽂化⽅⾯(报刊、电视、⽹络、书籍等)的⽀出,200,现抽取⼀个容量为20的样本,调查结果列于下表:
200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 10 240
20
120
估计该⼩区平均的⽂化⽀出Y ,并给出置信⽔平95%的置信区间。
解析:由已知得:200=N 20=n
根据表中数据计算得:5.14420120
1
==∑=i i y y
()
06842.827120120
1
22
=--=∑=i i y y s
21808.37)1(1)(2=-=s N
n n y V
10015.6)(=y V
∴该⼩区平均⽂化⽀出Y 的95%置信区间为:])(y [2
y V z
α
±即是:
[132.544 ,156.456]
故估计该⼩区平均的⽂化⽀出Y =144.5,置信⽔平95%的置信区间为[132.544 ,156.456]。
2.6某地区350个乡为了获得粮⾷总产量的估计,调查了50个乡当年的粮⾷产量,得到y =1120(吨),25602=S ,据此估计该地区今年的粮⾷总产量,并给出置信⽔平95%的置信区间。
解析:由题意知:y =1120 1429.0350
50
n ===
N f 25602=S ?160=s 置信⽔平95%的置信区间为:]1y [2
s n
f z -±α代⼊数据得:
置信⽔平95%的置信区间为:[1079.872,1160.872]
2.7某次关于1000个家庭⼈均住房⾯积的调查中,委托⽅要求绝对误差限为2平⽅千⽶,置信⽔平95%,现根据以前的调查结果,认为总体⽅差682=S ,是确定简单随机抽样所需的样本量。
若预计有效回答率为70%,则样本量最终为多少?
解析:简单随机抽样所需的样本量2
2
2
S
Z Nd S NZ n αα+=
%
701
2n n = 由题意知:1000=N 2=d 682
=S
96
.12
=αZ
代⼊并计算得:613036.611≈=n
87142.87%701
2≈==
n n
故知:简单随机抽样所需的样本量为61,若预计有效回答率为70%,则样本量最终为87
2.8某地区对本地100家化肥⽣产企业的尿素产量进⾏调查,⼀直去年的总产量为2135吨,抽取10个企业调查今年的产量,得到25=y ,这些企业去年的平均产量为22=x 。
试估计今年该地区化肥总产量。
解析:由题可知22x =,
35.211002135
===
N X X ,25y =
则,该地区化肥产量均值Y 的⽐率估计量为26
.242425
35.21===∧
x y X
Y
该地区化肥产量总值
Y 的⽐率估计量为
242626.24*100??===R Y N Y
所以,今年该地区化肥总产量的估计值为2426吨。
2.9如果在解决习题2.5的问题时可以得到这些家庭⽉总⽀出,得到如下表:单位:元
编号⽂化⽀出总⽀出编号⽂化⽀出总⽀出 1
200
1600
2 150 1700 12 160 1700
3 170 2000 13 180 2000
4 150 1500 14 130 1400
5 160 1700 15 150 1600
6 130 1400 16 100 1200
7 140 1500 17 180 1900
8 100 1200 18 100 1100
9 110 1200 19 170 1800 10
140
1500
20
120
1300
全部家庭的总⽀出平均为1600元,利⽤⽐估计的⽅法估计平均⽂化⽀出,给出置信⽔平95%的置信区间,并⽐较⽐估计和简单估计的效率。
解析:由题可知1580
130017002300201
x n 1x n 1i i =+++==∑=)(
5.144y =
091.015805.144?=≈===x y r R
⼜
329.14615805.144*1600x y y ===X
R
053.826)(111
22
=--=∑=n
i i y y n S
158.3463))((111
=---=∑=n
i i i xy
x x y y n S
579.8831)(111
=--=∑=n i i x
x x n S
故平均⽂化⽀出的95%的置信区间为
,)??2(1[2222
x yx R S R S R S n f Z y +---α])??2(1222
2x
yx R S R S R S n f Z y +--+α
代⼊数据得(146.329±1.96*1.892)即为[142.621,150.037]
2.10某养⽜场购进了120头⾁⽜,购进时平均体重100千克。
现从中抽取10头,记录重量,3个⽉后再次测量,结果如下:单位:千克
编号原重量现重量 1 95 150 2 97 155 3 87 140 4 120 180 5 110 175 6 115 185 7 103 165 8 102 160 9 92 150 10
105
170
⽤回归估计法计算120头⽜现在的平均重量,计算其⽅差的估计,并和简单估计的结果进⾏⽐较。
解:由题可知,6.1021059510
1
x n 1x n 1i i =++==∑=)
( 16317015010
1
y n 1y n 1i i =+==∑=)
( 222.2121910*9
1)(1112
2
==--=∑=n i i
y y n S 333.1461317*91))((111==---=∑=n i i
i xy x x y y n S 933.1064.926*9
1)(11122
==--=∑=n i i
x
x x n S 故有368.1933
.106333
.1462
0==
=
x
xy S S β
所以总体均值Y 的回归估计量为 443.159)6.102100(*368.1163)(0=-+=-+=x X y y lr β
其⽅差估计为:
)2(1)(?02202xy
x lr S S S n
f y V ββ-+-=
=
)333.146*368.1*2933.106*368.1222.212(10
12010
12-+-
=1.097
⽽2
1y (?S n
f V
-=) =
222.212*10
12010
1- =19.454
显然)(?)(?y V y V lr
< 所以,回归估计的结果要优于简单估
第三单元习题答案(仅供参考)
1解:(1)不合适
(2)不合适
(3)合适
(4)不合适
2.将800名同学平均分成8组,在每⼀级中抽取⼀名“幸运星”。
3.根据表中调查数据,经计算,可得下表:
h
1 10 256 0.3033 0.0391 11.
2 2867.2 94.4
2 10 420 0.4976 0.0238 25.5 10710 302.5
3 10 168 0.1991 0.0595 20 3360 355.6
总计30 844 1 16937.2
==20.1
V()=-
=9.7681-0.2962
=9.4719
=3.0777
(2)置信区间为95%相对误差为10%,则有按⽐例分配的总量:=185.4407185
=56,=92,=37
按内曼分配:=175
=33,=99,=43
4.根据调查数据可知:
h
1 0.18 0.9
2 0.21 0.933
3 0.1
4 0.9
4 0.08 0.867
5 0.1
6 0.933
6 0.22 0.967
==0.924
根据各层层权及抽样⽐的结果,可得
()==0.000396981
=1.99%
估计量的标准差为1.99%,⽐例为9.24%
按⽐例分配:2663
=479,=559,=373,=240,=426,=586
内曼分配:2565
=536,=520,=417,=304,=396,=392
5.解:由题意,有
==75.79
购买冷冻⾷品的平均⽀出为75.79元
⼜由V()=+
⼜
V()=53.8086
=7.3354
95%的置信区间为[60.63,90.95]。
7.解:(1)对
(2)错
(3)错
(4)错
(5)对
8.解:(1)差错率的估计值=70300.027估计的⽅差v()==3.1967
标准差为S()=0.0179。
(2)⽤事后分层的公式计算差错率为
==0.03
估计的⽅差为;v()=-=2.5726 9.解:(1)所有可能的样本为:
第⼀层第⼆层
3,5 0,3 8,15 6,9
3,10 0,6 8,25 6,15
5,10 3,6 15,25 9,15
(2)⽤分别⽐估计,有=0.4,=0.65,所以⽤分别⽐估计可
计算得=6.4。
⽤联合⽐估计,有=0.5,=0.625,所以⽤联合⽐估计可计算
得=6.5。
第四章习题
4.1邮局欲估计每个家庭的平均订报份数,该辖区共有4000户,
划分为400个群,每群10户,现随机抽取4个群,取得资料如下表所⽰:群各户订报数ij y
i y
1 1,2,1,3,3,2,1,4,1,1 19
2 1,3,2,2,3,1,4,1,1,2 20
3 2,1,1,1,1,3,2,1,3,1 16 4
1,1,3,2,1,5,1,2,3,1
20
试估计平均每户家庭订报份数及总的订报份数,以及估计量的⽅差。
解:由题意得到400=N ,4=n ,10=M ,01.0400
4===
N n f
故875.14
1020
1620191
1
=?+++=
==∑
=n
i i y Mn
y Y (份)
75.18875.110=?=?=y M y (份) 750040010?=?=??=y N M Y
(份) ∑=--=
n M s 1
22)(1
∑=---=
-=n
i i
b y y
n nM f s nM f y v 1
222)(1
111)(
14)75.1820()75.1819(10401.012
22
--++-??-=
00391875.0=
6270000391875.010400)()?(2222=??==y v M N Y
v 于是由以上的计算结果得到平均每户的订报份数为 1.875,估计量⽅差为0.00391875。
该辖区总的订阅份数为7500,估计量⽅差为62700。
4.2
某⼯业系统准备实⾏⼀项改⾰措施。
该系统共有87个单位,现采⽤整群抽样,⽤简单随机抽样抽取15个单位做样本,征求⼊选单位中每个⼯⼈对政策改⾰措施的意见,结果如下:
单位总⼈数赞成⼈数 1
51 42 2 62 53 3 49 40 4 73 45 5 101 63 6 48 31 7 65 38 8 49 30 9 73 54 10 61 45 11 58 51 12 52 29 13 65 46 14 49 37 15 55
42
(1)
估计该系统同意这⼀改⾰⼈数的⽐例,并计算估计标准误差。
(2)
在调查的基础上对⽅案作了修改,拟再⼀次征求意见,要求估计⽐例的允许误差不超过8%,则应抽取多少个单位做样本?
解:题⽬已知87=N ,15=n ,87
15
=
=
N n f
1
≈=
=∑∑==n i i
n
i i
M
y
p
733.6011
==
∑=n
i i
M
n
M
008687.0)?(1111)?(1
22=---=∑=n
i i i
M p
y
n n f M
p
v 此估计量的标准差为
9321.0008687.0)?()?(===p v p
s
4.3
某集团的财务处共有48个抽屉,⾥⾯装有各种费⽤⽀出的票据。
财务⼈员欲估计办公费⽤⽀出的数额,随机抽取了其中的10个抽屉,经过清点,整理出办公费⽤的票据,得到下表资料:
抽屉编号票据数i M
费⽤额(i y ,百元)
1
42 83 2 27 62 3 38 45 4 63 112 5 72 96 6 12 58 7 24 75 8 14 58 9 32 67 10
要求以95%的置信度估计该集团办公费⽤总⽀出额度置信区间(α=0.05)。
解:已知48, 10, 4810
=N n , 由题意得7361
=∑=n
i i y ,3651=∑=n i i M ,
则办公费⽤的总⽀出的估计为8.353273610
48
1
=?=
=∑=n
i i y n
N Y
(元)群总和均值6.7373610
1
11=?==∑=n i i y n y (元)
1
)()1()?(1
2
2
--?-=∑=n y y
n
f N Y
v n
i i
=9
)6.7380(...)6.7362()6.7383(10)
48101(482222-++-+-?
-
= 182.491
3590.4
= 72765.44
)?(Y
v=269.7507
为了便于管理,将某林区划分为386个⼩区域。
现采⽤简单随机抽样⽅法,从中抽出20个⼩区域,测量树的⾼度,得到如下资料:
区域编号数⽬株数
i M
平均⾼度i
y (尺)区域编号数⽬株数
i M
平均⾼度i
y (尺) 1 42 6.2 11 60 6.3 2 51 5.8 12 52 6.7 3 49 6.7 13 61 5.9 4 55 4.9 14 49 6.1 5 47 5.2 15 57 6.0 6 58 6.9 16 63 4.9 7 43 4.3 17 45 5.3 8 59 5.2 18 46 6.7 9 48 5.7 19 62 6.1 10 41
6.1
20
58
7.0
估计整个林区树的平均⾼度及95%的置信区间。
解:由已知得386=N ,20=n ,0518.0386
20
===N n f
整体的平均⾼度909.51046
8
.6180y Y ?
1
-i n
1i ==
=
=∑∑=n i
i
i
M
y M
3.5211
==
∑=n
i i
⽅差估计值1
)(1)()?
(1
2
2
---==∑=n y M y
M
n f y v Y v n
i i i
02706.0=
标准⽅差1644.002706.0)?
()?
(===
Y v Y s
在置信度95%下,该林区的树⽊的平均⾼度的置信区间为
)2312.6,5868.5()1644.096.1909.5()Y ?(t Y ?/2=?±=?±)(s α
4.5
某⾼校学⽣会欲对全校⼥⽣拍摄过个⼈艺术照的⽐例进⾏调查。
全校共有⼥⽣宿舍200间,每间6⼈。
学⽣会的同学运⽤两阶段抽样法设计了抽样⽅案,从200间宿舍中抽取了10间样本宿舍,在每间样本宿舍中抽取3位同学进⾏访问,两个阶段的抽样都是简单随机抽样,调查结果如下表:
样本宿舍
拍照⼈数
样本宿舍拍照⼈数
1
2 6 1 2 0 7 0
3 1 8 1
4 2 9 1 5
1
10
试估计拍摄过个⼈艺术照的⼥⽣⽐例,并给出估计的标准差。
解:题⽬已知200=N ,10=n ,6M =,
3=m ,05.0200101===N n f ,5.02==M
m
f 3.03
=∑=nm
y
p
n
i i
005747.0)(1111)?(1
2=?--?
-?=∑=n
i i
m p y
n n f m
p v
0758.0005747.0)?()?(===p v p
s 在置信度95%下,p 的置信区间为
))?(?(2/p v t p
α±=)0.448568,0.151432()0758.096.13.0(=?±。