抽样技术课后习题参考答案金勇进
抽样技术课后习题答案
12
160
1700
3
170
2000
13
180
2000
4
150
1500
14
130
1400
5
160
1700
15
150
1600
6
130
1400
16
100
1200
7
140
1500
17
180
1900
8
100
1200
18
100
1100
9
110
1200
19
170
1800
10
140
1500
20
120
1300
20
试估计平均每户家庭订报份数及总的订报份数,以及估计量的方差。
解:由题意得到 , , ,
故 (份)
(份)
(份)
于是由以上的计算结果得到平均每户的订报份数为1.875,估计量方差为0.00391875。该辖区总的订阅份数为7500,估计量方差为62700。
4.2
某工业系统准备实行一项改革措施。该系统共有87个单位,现采用整群抽样,用简单随机抽样抽取15个单位做样本,征求入选单位中每个工人对政策改革措施的意见,结果如下:
1
42
6.2
11
60
6.3
2
51
5.8
12
52
6.7
3
49
6.7
13
61
5.9
4
55
4.9
14
49
6.1
5
47
5.2
15
57
6.0
抽样技术课后习题答案
抽样技术课后习题答案第⼆章习题2.1判断下列抽样⽅法是否是等概的:(1)总体编号1~64,在0~99中产⽣随机数r ,若0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产⽣随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产⽣随机数r 。
然后⽤19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有⼀些⼏个特点:第⼀,按照⼀定的概率以随机原则抽取样本。
第⼆,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当⽤样本对总体⽬标进⾏估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?解析:抽样理论和数理统计中关于样本均值的定义和性质的不同抽样理论概率统计定义 ∑==ni i y n y 11∑==ni iy n y 11性质1.期望()()()()Y C P E NN C N C ===∑∑==n n1i n i 1i i i 1y y y2.⽅差()()()[]()iiP y E y y V n N21∑=-==()()[]n NC i iiC y E y n N121∑=- ()21S nf -=1.期望()??=∑=n i i y n E y E 11()∑==ni y E 1i n 1[]µµ==n n12.⽅差()[]2µ-=i y E y V211-=∑=n i i y n E µ()ny n 122i σµ=-=E2.3为了合理调配电⼒资源,某市欲了解50000户居民的⽇⽤电量,从中简单随机抽取了300户进⾏,现得到其⽇⽤电平均值=y 9.5(千⽡时),=2s 206.试估计该市居民⽤电量的95%置信区间。
抽样技术:第2章课后答案
第2章2.1 M: (I)这种抽样方法是等機率的・在毎次抽取川本敢尤时.冊未被抽中的编号为1〜64的这兰单元中毎一个m兀被抽刮的槪率都足亠.100(2)这种抽杆方法不艮等嵐略的.利用这种方法.任每次抽収样本恥尤时.尚未被抽中的編号为1-35 U及编号为64的这36个嘏元中毎个敏元的入—.而尚木被捕中的编号为36~63的毎100个唯元的入样執丰祁足丄•100(3)这艸抽样方法是零怨率的.在邰次抽取样木单元时.尚未被抽中的编号为20 000〜21 000中的毎个服元的入样駅率都是詁亦・所以这种抽祥是等槪率的・2.2 W:2.3解:许先(Ail i^iUKKH用电凰的95%的KWK何.根撫中心极RI定理可知.在大样本的条件卜.[升和讣卩药]=[升1・96 皿灯+ 1・96风可•向叫亍)=上上$2中总体的方差S ,是未知的.用样本方差 /来代fh ?¥(SkM 为由聽盘知道.y = 9.5,52= 206 •而且样木址为“ = 300,N = 50 000・代入对以求刁严6)= 乎/二上驾铲°°°x206 = 0.682 5 •将它幻代入上面的式「町能该山居民日用电虽的95%置信区何为[7.880 8,11.119 2].下一步汁舒样木址.绝対谋船Bid和郴対的关系为d = Fp ・ 根区何的求解方注町卸把y = 9.5,s 2= 206.r = 10%,AT = 50 000 代入上式町阳.H = 861.75 ^862 .所以杆木 18至少为2.4 解:总体中套加培训班的比例为P.强么这次简眾閤机抽样紂到的P 的估计ffip 的方溢 1-f N “、 n-PP(l-P)・利用中心极国迷理可得+—在人杆木的条件F 近似眼从标准正念分布.V 的l-a=95%的B!怙区何为v-r> 1 —a根据正念分布的分位数町以知适P庄和g中.样木盘足够大.从m何typ的1-0=95%的置伉区何为]卩・讣卩莎P+Z^JF⑹卜丽这眼的叫P)是未妹的.我们便用它的估计(ftr(p)=v(p)=^p(l-p)=9.652xl0-\所以总体比例P的l-a = 95%的置仃区何可以写为["-二呻庶门“ +兀喘応孑}将p = O.35^ = 2OO.y = IOOOO代入町得K信区何为〔0.284 4.0.4156].2.5解:利用衍到的样木.计ma样本均值为歹=2 890/20 = 144.5.从ifiH占计小区的平均文化支出为144.5 7U.总体均(ftV的l-a = 95%的迓仃区何为卩-二皿灰冰歹匕曲丁^药]用二乎,来估计样本均值的方筮卩@)・计算斜到F =826.025 6,则卩(刃=匕上T =匕巴丄只826・025 6 = 37」72 •n20£/:丿卩(刃=1 %xj37.172 71.95 •代入数W可紂总体肉值的95%的置佰区何为[132.55J 56.45].2.6M:根据样木位息估计对衍毎个乡的平均产诫为1120吨.该地区今年的粮伐总产虽丫的佔计值为X = 350> = 350xl 120 =3.92xl05(吨)•)S2.总体总(ft 的I・a = 95%的盘伉区何为总体总(ft估计值的方差为rM= W•把y = 3.92X10\S2 = 25 600,n = 50,^ = 350,= 1.96代入.可須粮伏总产虽的l-a=95%的置信区何为[377 629.406 371]./ = ^.za/:解:泞先计外简腋皈机抽样条什下所需耍的祥本虽・把N = l 000,d = 2」-a = 95%S'=68 帯入公式%如果彩电到仃效河猝率的问題・亦仃效冋??率为70%时・样本虽应该加终确定为/70% = 88.57 *89./i = no2.8 M:去年的化肥总产虽和今邻的总产量Z何存在较強的WXfte iliifl这种相关关系较为楼定.所以引入去年的化肥产址作为辅助变虽・「•建我的采用比申估计址的形式*估计今年的化肥总产虽•去年化肥总广虽为X = 2I35・利用£年的化肥总严虽・今年的化肥总产虽的估计(ft为y/?X=^X = 2 426.14< =■X2.9駢:木JS中.简險估计址的方羞的估计(ft为v(y)=^L S2 =37.17.n利用比率估itfit进行估计时.我们引入了家庭的总支出作为辅助变fit.记为X・文化支出届F总支岀的一部分.这个上箜变st与辅助变st之何存在较強的相关关系.面11它m之何的关系是比较住定的.11全部家庭的总支出是已知的虽・文化支出的比率估计就为y^RX^X.通过if■算彻到y = 2 890/20 = 144.5・ifijx = l 580.則' V 144 5 ・/? = 1 = 2_£O,O915.文化支岀的比率佔计址的值为儿= 146.3 (元人=•I现在考Jg比率佔计fit的方差.在样木足牧大的条件几卩(耳片MSE(耳片乎(S j2RpS・S,+用S:)・通过计件吋以得到两个变fit的样本方羞为A?=826,.<=9.958xl0\『和X之何的相关系数的佔计值为p = 0.974.代入上面的公式.可U得到比半估计虽的方差的佔计備为v耳=1.94・这个数值比简的方羌佔计值耍小很个部家庭的平均文化支出的l-a = 95%的盘估X何为[斤・%应订•齐+ %応「卜“96^面•齐+1 %応J]・把具体的敌值代入可得置仃区何为[143.57.149.03].y[yA彳元)接下来比较比佔汁和简腋佔计的效札亠亠2 = :^ = 0・052・这是比佔计的设计效应v(y)呛)37.17值,从这里可以看岀比佔计駅比简乐佔计虽的效率史高.2.10 利用简爪佔计址町紂戸=》比/” = 1 630/10二163・样本方澄为? =212.222, AT = 120・样本均值的方左佔计值为v(y)=52 = ^1^120 x212.222 = 19.453 7.利用回贮估计的方注.在这里选取肉牛的KiRfi为辅助变址.迭擇原電虽为緬助矢St是合理的.因为肉牛的很大程皮上彩响荷肉牛的现任的車虽・二折Z何“庄牧冬的相关性.郴关系数的估计血为2 = 0.971 •临II 这种相关关瑕是稳定的.这觇肉牛的原載虽的8(值已经衍到.所以选好肉牛的廉載ft为辅助妞.* * |4 CAQ何粉估计SMM度加高的冋•垠敌“的伕计ffi为/7 = p—= 0.971x^^- = 1.368.现在何以衍到$. 10.341肉牛fltiF.fi 的回归佔计fit 为无=戸+ 0 X^x .代入数值町以月到畀=159.44.囚为恋在肉牛股秋fit 这个牧好的辅助变足,所以冋$1佔计虽的箱度耍好「简冋归估计fit 入的方差为打兀)=MSE (人方差的佔计位为仏卜•代入柿应的敷值・单估计就・。
抽样调查理论与方法 金勇进(第二版)-第2章-简单随机抽样
X
2
n
N
1
i 1
(Y i R X i )
2
定理 的方差为:
Y 2.7:对于简单随机抽样,n较大时, R N y R
N 1 2 1 f 2 V (Y R ) N (Yi R X i ) n N 1 i 1
推论 2.12:对于简单随机抽样,n较大时, Y y 的方差为:
n N
n N
【例2.1】
设总体有5个单元(1、2、3、4、5), 按不放回简单随机抽样的方式抽取2个单 元,则所有可能的样本为个:
1,2
1,3 1,4 1,5
2,3
2,4 2,5
3,4
3,5
4,5
【例2.2】
设总体有5个单元(1、2、3、4、5),按放回 简单随机抽样的方式抽取2个单元,则所有可 能的样本为25个(考虑样本单元的顺序):
i
Y X
Y X
r
n
yi xi
i 1
y x
i 1
i 1
简单估计量
1 Y y n
n
yi
y1 y 2 y n n
i 1
N Y Ny n
n
yi
i 1
a 1 P p n n
n
yi y Y
i 1
ˆ R
【例2.5】
根据例【2.4】的数据和结果,比较两种思路下对应的 方差估计结果。
2.4 回归估计量及其性质
属于简单估计量,不属于比率估计量。
引理 的期望为:
2.3:对于简单随机抽样,n较大时, R r
抽样技术课后习题_参考答案_金勇进
第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。
解析:由已知得:10000=N 200=n 35.0=p 02.0==Nnf 又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。
金勇进教授《抽样调查中的权数问题》
表A13
A2 A3 A4 Total
B1
B2
B3 Total
35.00 迭7代0.0第0 一步70.00 175.00
55.00 154.00 341.00 550.00
215.00 107.50 107.50 430.00
一般,目标1通过计算样本单元设计权数实现;目 标2通过对设计权数的事后分层调整体现。
二. 计算权数步骤
设计权数表现为样本入样概率的倒数,概率抽样
特征是每个样本单元入样概率是可以计算的。抽样 框信息是计算权数的重要依据,能否计算出权数也 是概率抽样和非概率抽样的根本区别。
如采用二阶段抽样,设计权数
Wd
68.51
公办 高中 4.48 17.49 0.69
22.66
完中 3.86 0.71 0.22
4.78
初中 0.00 2.65 0.68
3.33
民办 高中 0.00 0.00 0.00
0.00
完中 0.00 1.05 0.00
1.05
总计 12.82 41.30 46.22
100.33
调整前民办所占比例为1.18%, 调整后民办所占比例为4.38%, 总体民办所占比例为8.53%
330
470
1000
表2 基于辅助变量A和B的原始加权的总体联合分布
B1
B2
B3
Total
A1
80
40
55
175
A2
60
150
340
550
A3
170
60
抽样技术金勇进第三版
5个黑球,3个白球,大小相同,一次随机地摸取4个球,其中恰有3个白球的概率为A .83B .485C C .81)83(5D .81)83(348C2. 任何一个连续型随机变量的概率密度)(x f 一定满足A .1)(0≤≤x fB .在定义域内单调不减C .()1f x dx +∞-∞=⎰D .0)(>x f3. 设随机变量X 、Y 相互独立,分布函数分别是)(x F 、)(x G ,min{,}Z X Y =,则Z 的分布函数()Z F z =A .()()F z G zB .()()()()F z G z F z G z +-C .[]2()F z D .1(1())(1())F z G z ---4. 设人的体重为随机变量X ,且()E X a =,()D X b =,10个人的平均体重为Y ,则下面成立的是A .()E Y a =B .()0.1E Y a =C .()D Y b = D .b Y D 2.0)(= 5. 设A n 为n 次独立重复试验中A 出现的次数,p 是事件A 在每次试验中的出现概率,ε为大于零的数,则lim A n n P p n ε→∞⎧⎫-<=⎨⎬⎩⎭A .0B . 1C .12 D.21⎛Φ- ⎝6. 设)(~),(~22221221n n χχχχ,2221,χχ独立,则 A .)(~22221n χχχ+ B .~2221χχ+)1(2-n χ C .~2221χχ+()t n D .~2221χχ+212()n n χ+7. 由来自正态总体2~(,2)X N μ容量为400的简单随机样本,样本均值为45,则未知参数μ的置信度为0.95的置信区间是0.025( 1.96,Z =其中 0.05 1.645)Z =A .(44.8355,45.1645)B .(44,46)C .(44.804,45.196)D .(44.9,45.1) 8. 在假设检验中,设1H 为备择假设,那么犯第一类错误的概率为A. 1H 真,接受1HB. 1H 不真,接受1HC. 1H 真,拒绝1HD. 1H 不真,拒绝1H有两批零件,其合格率分别为0.9和0.8,在每批零件中随机地任取一件,则至少有一件是合格品的概率为__________________.2. 设)2.0,2(~2N X ,若9938.0)5.2(=Φ,5.0)0(=Φ,则=<<}5.22{X P ___.3. 设X 的概率密度为23,02()80,x x f x ⎧<<⎪=⎨⎪⎩其它,则2)1(-=X Y 的概率密度函数为 .4. 设随机变量X 与Y 相互独立,且~(0,2),X U Y 服从参数为3的指数分布,则()E XY = .5. 设从总体2(52,6.3)N 中随机抽取容量为36的样本,X 表示样本均值,则X 服从的分布为 . 6. 设是来自正态总体2(,)N μσ的样本, 其中参数μ和2σ未知,若计算出162120,()60,i i x x x ==-=∑则假设0:15H μ=的t 检验选用的T统计量的值t = .7. 设总体),(~2σμN X ,其中2σ未知,容量为n 的样本均值和方差分别为X 、2S ,则参数μ的置信度为α-1)10(<<α的双侧置信区间为 .8. 单因素方差分析中,各个水平(1,2,,)j A j s = 下的样本12,,,j j j n j X X X 均来自2(,),j j N μσμ与2σ未知,,T E A S S S =+称T S 为总偏差平方和,E S 和A S 分别为 .设总体N=4,其变量值分别为(2,5,6,9)。
抽样技术 第三版 全部课后答案 金勇进共28页
第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+20199作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?机抽取了300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。
解析:由已知得:10000=N 200=n 35.0=p 02.0==Nnf又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。
抽样调查理论与方法 金勇进(第二版)第3章-分层随机抽样
分别比估计量要求每一层的样本量都比较大,如果达不 到这个要求,则它的偏差可能比较大,这时要使用联合 比估计量。
3.3.1 分别比估计
定义 3.4 总体均值 Y 和总体总量 Y 的分别比估计为:
y RS Wh y Rh yh Wh Xh xh
ˆ Ny yh X Y ˆ YRS RS h Rh xh
E (YRS ) Y
MSE (YRS ) V (YRS )
2 N h (1 f h ) 2 2 2 (S yh Rh S xh 2Rh S yxh ) nh h 1 L
3.3.2 联合比估计
定义 3.5 总体均值 Y 和总体总量 Y 的联合比估计为:
y RC y st ˆ X RC X x st
居民 户总 数
层
样本户拥有家庭电脑情况 1 0 0 1 1 2 0 1 1 0 3 0 0 0 0 4 1 0 0 0 5 0 0 0 0 6 0 0 0 0 7 0 0 1 0 8 1 0 0 0 9 0 1 1 0 10 0 0 0 0
1 2 3 4
200 400 750 1500
2013-8-10
L
N h Yh
h 1
L
分层随机样本,总体均值 Y 的简单估计
1 y st Wh y h N h 1
L
N
h 1
L
h
yh
7
2013-8-10
Y 定理 3.1:对于分层随机抽样,st 是 Y 的无偏估计。
定理 3.2:对于分层随机抽样,有
V Yst Wh2V Yh
1 yh nh
y
i 1
nh
金勇进:《抽样技术(第2版)》课后习题参考答案
1 但:曾有实验,欲检验人列数字果随机 10 100
(等可能选取各数字)否。结果表明,各有偏好, P p 实未给定。 (3)之U 、 S s 、 P p 皆未定。 1 . 3 [ 以下资料引译自 “STATISTICAL ESTIMATION METHODS IN VOLUNTEER PANEL WEB SURVEYS”,Sunghee Lee, Ph.D., 2004] 网络调查(Web surveys)并非互联网调查(Internet surveys)之同义语,通常所谓互联网调 查包括网络调查与电子邮件调查(e-mail surveys) ,而网络调查则仅指通过 WWW 浏览器呈 现的调查,故也称网页调查。由于存储与软件兼容性方面的局限性,电子邮件调查远不及网 页调查应用广泛,故对互联网调查的研究主要集中于网页调查。
什么是收视率调查 收视率调查最早是用于了解节目的收视情况,为媒体决策和广告主的媒体选择提供依据。后来由于收视率 调查技术的革新பைடு நூலகம்一种叫做 Audimeter 视听记录仪在调查中的运用,使广告收视率调查变得简单化。 在电视收视率调查方面比较著名的市场调研公司有美国的尼尔逊公司( Nielsen ) 、日本的电通、英国的 TNSOFRES 集团等。它们都能以每分钟为单位来记录分析电视节目的收视情况。所以收视率调查便成为一 种电视广告传播效果的测量方法。 收视率调查的步骤 收视率调查过程包括以下几个步骤: 1、随机抽出一定量的观众样本户构成相对稳定的调查网(观众小组) 。样本大小视研究精度和地区规模而 定。例如台湾益利市场研究顾问公司,在台湾地区建立的调查网样本户是 245 个。 2、在样本户家中的电视机上装上 Audimeter 这种仪器,它能自动地记录受调查对象家中收看电视节目的时 间和频道。 3、每隔一段时间(如一周)把自动记录仪内的软片或磁带取下带回公司分析,就可以算出每日全部节目每 一分钟的收视率。现在由于技术的进步,研究机构甚至可以通过电话连线随时从被调查户提取记录信息。 一般来说,收视率愈高,说明广告的传播效果愈好。
抽样技术课后习题答案
抽样技术课后习题答案第⼆章习题2.1判断下列抽样⽅法是否是等概的:(1)总体编号1~64,在0~99中产⽣随机数r ,若0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产⽣随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产⽣随机数r 。
然后⽤19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有⼀些⼏个特点:第⼀,按照⼀定的概率以随机原则抽取样本。
第⼆,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当⽤样本对总体⽬标进⾏估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?解析:抽样理论和数理统计中关于样本均值的定义和性质的不同抽样理论概率统计定义 ∑==ni i y n y 11∑==ni iy n y 11性质1.期望()()()()Y C P E NN C N C ===∑∑==n n1i n i 1i i i 1y y y2.⽅差()()()[]()iiP y E y y V n N21∑=-==()()[]n NC i iiC y E y n N121∑=- ()21S nf -=1.期望()??=∑=n i i y n E y E 11()∑==ni y E 1i n 1[]µµ==n n12.⽅差()[]2µ-=i y E y V211-=∑=n i i y n E µ()ny n 122i σµ=-=E2.3为了合理调配电⼒资源,某市欲了解50000户居民的⽇⽤电量,从中简单随机抽取了300户进⾏,现得到其⽇⽤电平均值=y 9.5(千⽡时),=2s 206.试估计该市居民⽤电量的95%置信区间。
抽样调查理论与方法 金勇进(第二版)第5章-不等概抽样
ˆ Y HH
M n
0
2 0
n
yi mi
i 1
3676 10926 10926 1024 510 38 . 23 38 . 23 13 . 70 6 . 2 30
75757 087(百元)
ˆ v Y HH
M
n n 1
n
i 1
2
5.2.3 有放回不等概整群抽样
根据汉森-赫维茨(Hansen-hurwitz)估 计量,PPS整群抽样的总体总值估计量为:
1 Y n
n
yi Zi
1 n
N
M n
0
i 1
n
yi M
i
M0y
i 1
估计量的方差:
ˆ V (YHH )
Zi (
i 1
Yi Zi
n
Y )
对于放回不等概抽样,对总体总量的估计 是汉森-赫维茨(Hansen-hurwitz)估计:
ˆ Y HH 1 n
n
yi zi
M n
0
i 1
n
yi mi
i 1
总体总值的无偏估计量
PPS抽样:
1 YHH n
n
yi Zi
M n
0
i 1
n
yi M
i
i 1
ˆ V (YHH )
第5章 不等概抽样
例:欲调查某城市住院病人对于某项医疗服务的偏好。 目标总体:某一时段该城市所有医院的病人。 等概率两阶段抽样:第一阶段中拥有20个病床的医 院和拥有1000个病床的医院被抽中的概率是一样的 ;第二阶段若采用等概抽样,20个病床的医院抽取2 个,1000个病床的医院需要抽取100个。 抽样误差较大; 不同规模医院的病人样本调查难易度和单位成本 不同; 抽样前大医院样本数量未知,容易给调查的管理 造成困难;
抽样技术第三版全部课后答案金勇进
第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s1706366666206*300500003001500001)()ˆ(222=-=-==s nf N y N v YV 19.413081706366666(==)y v 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
《抽样技术(第二版)金勇进等编著》习题解答
《抽样技术(第二版)金勇进等编著》习题解答第二章2.22.3 解:已知2ˆ9.5,206,50000,300500009.5475000y s N n Y Ny ====∴==⨯=, 222211300/50000ˆ()50000206500000.6825170636666730041308.19128,80964.05491f v YN s n --∴==⨯⨯=⨯===所以居民日用电量的95%的置信区间为 ˆˆ[[47500080964.05491,47500080964.05491] [394035.9451,555964.0549]YY -+=-+=相对误差为ˆd Y Y r Y-=2.4 解:ˆ0.35Pp == , 11200/1000010000()(1)0.35(10.35)0.0011512009999f N V p P P n N --=-=⨯⨯⨯-=-0.03339=∴P 的95%置信区间为:[[0.35 1.960.03339,0.35 1.960.03339][0.2846,0.4154]p p -+=-⨯+⨯=2.5 解:已知200,20N n ==,根据已知数据计算得:2144.5,826.0526,() 6.096915y s v y ==∴== ∴Y 的95%置信区间为:[[144.5 1.96 6.096915,144.5 1.96 6.096915][132.55,156.45]y y -+=-⨯+⨯=2.6 解:已知2ˆ1120,25600,350,503501120392000y S N n Y Ny ====∴==⨯=,2221150/350ˆ()350256003840000506196.773,12145.68f V YN S n --∴==⨯⨯===∴ˆY的95%置信区间为:ˆˆ[[379854.3,404145.7]Y Y -+= 2.7 解:已知21000,2,68,10.95N d S α===-=,222022221000 1.966861.3010002 1.9668Nt S n Nd t S ⨯⨯∴===+⨯+⨯0161.387.571430.7n n r === 样本量最终为88个家庭。
抽样技术课后习题答案
该市居民用电量的95%置信区间为
[ =[475000±1.96*41308.19]
即为(394035.95,555964.05)
由相对误差公式 ≤10%
可得
即n≥862
欲使相对误差限不超过10%,则样本量至少应为862
2.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。
因此(1)中只有1~64是可能被抽中的,故不是等概的。(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值 的定义和性质有哪些不同?
解析:抽样理论和数理统计中关于样本均值的定义和性质的不同
抽样理论
概率统计
定义
性质
1.期望
2.方差
1.期望
2.方差
2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值 9.5(千瓦时), 206.试估计该市居民用电量的95%置信区间。如果希望相对误差限不超过10%,则样本量至少应为多少?
20
试估计平均每户家庭订报份数及总的订报份数,以及估计量的方差。
解:由题意得到 , , ,
故 (份)
(份)
(份)
于是由以上的计算结果得到平均每户的订报份数为1.875,估计量方差为0.00391875。该辖区总的订阅份数为7500,估计量方差为62700。
4.2
某工业系统准备实行一项改革措施。该系统共有87个单位,现采用整群抽样,用简单随机抽样抽取15个单位做样本,征求入选单位中每个工人对政策改革措施的意见,结果如下:
抽样调查理论与方法 金勇进(第二版)第4章等概率整群抽样和多阶段抽样
S
2
故 又可写为:
2
N
(Y
M
ij
Y )( Y ik Y )
2
( NM 1 )( M 1 ) S
用简单随机抽样方法抽取n个群,每个群内的M个 单元全部进入样本,则等群抽样均值估计量 y 的方 差可用群内相关系数近似表示
1 M
2
V (y)
V (y)
1 f nM
1567.9 39.6( 万 公 斤 )
评价:虽是无偏估计量,但方差估计与 y i 之 间的差异有关,适合于 y i 之间差异不大的整 群抽样。
(2 ) 等概抽样,比率估计
Yˆ M
t
n i 1 n i 1
yi
i
2
726
n
2 5 7 .1 209
8 9 3 .0 8
M
v ( Yˆ ) s ( Yˆ )
v( y ) 1 f nM
Yˆ NM y
2 2 V ( Yˆ ) V ( NM y ) N M V ( y )
sb
2
总体总值 的估计量 及其方差
ˆ ) N 2 M 2v( y ) v (Y
【例4.1】
在一次对某中学在校零花钱的调查中, 以宿舍作为群进行整群抽样。每个宿舍 都有M=6名学生。用简单随机抽样在全 部N=315间宿舍中抽取n=8个宿舍。全 部48个学生上周每人的零花钱 y ij 及相关 计算数据如表4-2所示。试估计该学校学 生平均每周的零花钱 Y ,并给出其95% 的置信区间。
整群抽样的效率分析
群内相关系数 表达式为:
E ( Y ij Y )( Y ik Y ) E ( Y ij Y )
抽样检验-抽样技术金勇进 精品
• 要估计渔网中长度长于12cm的鱼的总数,抽取 一个鱼的随机样本,估计长度长于12cm的鱼所 占的比例,用鱼的总数N乘以这个比例即可得 到,但如果N未知不能使用。
• 能称量渔网中鱼的总重量。鱼的长度与其重量
相关。
t
^
yr
y
tx
x
• 调整来自样本的估计量以便它们反映人 口统计学的总量。
• 比率估计、回归估计需要有足够的样本量才能
保证估计的有效。
–有偏估计:当样本量足够大时,估计的偏倚趋于0。
• 简单地想要估计一个比率 :假定总体由面
积不同农业用地构成, yi =i地谷物的产 量, xi :i地的面积,B=每亩谷物的平均 产量
^
ty Ny
• 想要估计一个总体总数,但总体大小N是未 知的。但是我们知道,于是可以通过来估计N,
Chapter 4 Ratio and Regression Estimator
• 1802年,拉普拉斯想要估计法国的人口数目。他获得 了一个遍布全国范围的30commune的样本,截至1802 年9月23日总共有2,037615居民。在包括1802年9月23 日以前的三年中,215599个新生儿在30个commune。
• 设抽取一个行业的样本:令yi为i行业花费在健
y
康保险上的金额,xi为i行业的雇员数。假定对
x
总体中的每个行业xi均已知。我们希望一个行
业花费在健康保险上的金额与雇员数相关。某
些行业在调查中可能涉及不到。估计保险费用
的总花销时调整无回答的方法之一是用总体数
X 乘以比率 y
x
一、
在 srs
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。
解析:由已知得:10000=N 200=n 35.0=p 02.0==Nnf又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。
解析:由已知得:200=N 20=n根据表中数据计算得:5.144201201==∑=i i y y∴ 该小区平均文化支出Y 的95%置信区间为:])(y [2y V zα±即是:[132.544,156.456] 故估计该小区平均的文化支出Y =144.5,置信水平95%的置信区间为[132.544 ,156.456]。
2.6某地区350个乡为了获得粮食总产量的估计,调查了50个乡当年的粮食产量,得到y =1120(吨),225600S =,据此估计该地区今年的粮食总产量,并给出置信水平95%的置信区间。
解析:由题意知:y =1120 1429.035050n ===N f 225600S =⇒160=s置信水平95%的置信区间为:]1y [2s nfz -±α代入数据得: 置信水平95%的置信区间为:[1079.872,1160.872]*350 2.7某次关于1000个家庭人均住房面积的调查中,委托方要求绝对误差限为2平方千米,置信水平95%,现根据以前的调查结果,认为总体方差682=S ,是确定简单随机抽样所需的样本量。
若预计有效回答率为70%,则样本量最终为多少?解析:简单随机抽样所需的样本量22222122S Z Nd S NZ n αα+=%7012n n =由题意知:1000=N 2=d 682=S 96.12=αZ代入并计算得:613036.611≈=n87142.87%7012≈==n n故知:简单随机抽样所需的样本量为61,若预计有效回答率为70%,则样本量最终为872.8某地区对本地100家化肥生产企业的尿素产量进行调查,一直去年的总产量为2135吨,抽取10个企业调查今年的产量,得到25=y ,这些企业去年的平均产量为22=x 。
试估计今年该地区化肥总产量。
解析:由题可知22x =,35.211002135===N X X ,25y =则,该地区化肥产量均值Y 的比率估计量为26.24242535.21===∧x y XY该地区化肥产量总值Y 的比率估计量为 242626.24*100ˆˆ===R Y N Y 所以,今年该地区化肥总产量的估计值为2426吨。
2.9如果在解决习题2.5的问题时可以得到这些家庭月总支出,得到如下表:全部家庭的总支出平均为1600元,利用比估计的方法估计平均文化支出,给出置信水平95%的置信区间,并比较比估计和简单估计的效率。
解析:由题可知1580130017002300201x n 1x n 1i i =+++==∑=)(Λ又329.14615805.144*1600x y y ===XR故平均文化支出的95%的置信区间为代入数据得(146.329±1.96*1.892) 即为[142.621,150.037]2.10某养牛场购进了120头肉牛,购进时平均体重100千克。
现从中抽取10头,记录重量,3个月后再次测量,结果如下:进行比较。
解:由题可知,6.10210595101x n 1x n 1i i =++==∑=)(Λ 故有368.1933.106333.14620===xxy S S β所以总体均值Y 的回归估计量为 其方差估计为:)2(1)(ˆ02202xyx lr S S S n f y V ββ-+-==)333.146*368.1*2933.106*368.1222.212(101201012-+-=1.097 而21y (ˆS nf V -=)=222.212*10120101- =19.454显然)(ˆ)(ˆy V y V lr< 所以,回归估计的结果要优于简单估第三单元习题答案(仅供参考) 1解:(1)不合适(2)不合适 (3)合适 (4)不合适2.将800名同学平均分成8组,在每一组中抽取一名“幸运星”。
∴Y ̅st =1N∑N h y ̅h 3h=1=20.1V (y ̅̂st )=∑W h 2s h 2n hL h=1-∑W h s h 2NL h=1=9.7681-0.2962=9.4719∴√V (y ̅̂st )=3.0777 (2)置信区间为95%相对误差为10%,则有按比例分配的总量:n=∑W h s h2L h=1V+N V ∑W h sh2L h=1=185.4407≈185∴n 1=n W 1=56,n 2=92,n 3=37按内曼分配:n=(∑W h s h 2)2L h=1V+1N∑W h s h h=1=175∴n 1=33,n 2=99,n 3=43P st =∑W h P h L h=1=0.924根据各层层权W h 及抽样比f h 的结果,可得V ̂(P st )=1N∑N h2(1−f h )p n q n n h −14h=1=0.000396981 ∴√V̂(P st )=1.99% ∴估计量的标准差为1.99%,比例为9.24%按比例分配:n=2663∴n 1=479,n 2=559,n 3=373,n 4=240,n 5=426,n 6=586内曼分配:n=2565∴n 1=536,n 2=520,n 3=417,n 4=304,n 5=396,n 6=3925.解:由题意,有Y ̅=∑y̅W n L h=1=75.79 ∴购买冷冻食品的平均支出为75.79元又由V (y ̅)=1−f n∑W h s h 2L h=1+1n 2∑(1−W h )s h 2L h=1又n=∑n h /W h L h=1∴V (y ̅)=53.8086 √V (y ̅)=7.3354∴95%的置信区间为[60.63,90.95]。
7.解:(1)对(2)错 (3)错 (4)错 (5)对8.解:(1)差错率的估计值y ̅=143×70%+257×30%=0.027估计的方差v (y ̅)=∑W h2L h=11−f h n h s h2=3.1967×10−4标准差为S(y ̅)=0.0179。
(2)用事后分层的公式计算差错率为y ̅=∑W h (1m h∑y hi )m hi=1L h=1=0.03估计的方差为;v (y ̅)=∑W h 2S h 2m hh-1N∑W h S h 2h =2.5726×10−4(2)用分别比估计,有r 1=0.4,r 2=0.65,所以用分别比估计可计算得Y ̅=6.4。
用联合比估计,有r 1=0.5,r 2=0.625,所以用联合比估计可计算得Y ̅=6.5。
第四章习题4.1 邮局欲估计每个家庭的平均订报份数,该辖区共有4000户,划分为400个群,每群解:由题意得到400=N ,4=n ,10=M ,01.04004===N n f 故875.1410201620191ˆ1=⨯+++===∑=ni i y Mny Y (份)75.18875.110=⨯=⋅=y M y (份) 750040010ˆ=⨯=⋅⋅=y N M Y(份) 于是由以上的计算结果得到平均每户的订报份数为 1.875,估计量方差为0.00391875。
该辖区总的订阅份数为7500,估计量方差为62700。
4.2 某工业系统准备实行一项改革措施。
该系统共有87个单位,现采用整群抽样,用简单随机抽样抽取15个单位做样本,征求入选单位中每个工人对政策改革措施的意(2) 在调查的基础上对方案作了修改,拟再一次征求意见,要求估计比例的允许误差不超过8%,则应抽取多少个单位做样本?解:题目已知87=N ,15=n ,8715==N n f 1)由已知估计同意改革的比例 此估计量的标准差为4.3 某集团的财务处共有48个抽屉,里面装有各种费用支出的票据。
财务人员欲估计办公费用支出的数额,随机抽取了其中的10个抽屉,经过清点,整理出办公费用的票)。
解:已知N=48, n=10, f=4810=N n , 由题意得7361=∑=n i i y ,3651=∑=ni i M ,则办公费用的总支出的估计为8.35327361048ˆ1=⨯==∑=ni i y nN Y(元) 群总和均值6.7373610111=⨯==∑=n i i y n y (元)=9)6.7380(...)6.7362()6.7383(10)48101(482222-++-+-⨯-⨯ = 182.4⨯91⨯3590.4= 72765.44 )ˆ(Yv =269.7507 则Yˆ的置信度为95%的置信区间为3532.8±1.96⨯269.7507,即[3004.089,4061.511].4.4 为了便于管理,将某林区划分为386个小区域。