应用抽样技术课后习题答案
抽样技术课后习题_参考答案_金勇进
第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。
解析:由已知得:10000=N 200=n 35.0=p 02.0==Nnf 又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。
抽样技术:第2章课后答案
第2章2.1 M: (I)这种抽样方法是等機率的・在毎次抽取川本敢尤时.冊未被抽中的编号为1〜64的这兰单元中毎一个m兀被抽刮的槪率都足亠.100(2)这种抽杆方法不艮等嵐略的.利用这种方法.任每次抽収样本恥尤时.尚未被抽中的編号为1-35 U及编号为64的这36个嘏元中毎个敏元的入—.而尚木被捕中的编号为36~63的毎100个唯元的入样執丰祁足丄•100(3)这艸抽样方法是零怨率的.在邰次抽取样木单元时.尚未被抽中的编号为20 000〜21 000中的毎个服元的入样駅率都是詁亦・所以这种抽祥是等槪率的・2.2 W:2.3解:许先(Ail i^iUKKH用电凰的95%的KWK何.根撫中心极RI定理可知.在大样本的条件卜.[升和讣卩药]=[升1・96 皿灯+ 1・96风可•向叫亍)=上上$2中总体的方差S ,是未知的.用样本方差 /来代fh ?¥(SkM 为由聽盘知道.y = 9.5,52= 206 •而且样木址为“ = 300,N = 50 000・代入对以求刁严6)= 乎/二上驾铲°°°x206 = 0.682 5 •将它幻代入上面的式「町能该山居民日用电虽的95%置信区何为[7.880 8,11.119 2].下一步汁舒样木址.绝対谋船Bid和郴対的关系为d = Fp ・ 根区何的求解方注町卸把y = 9.5,s 2= 206.r = 10%,AT = 50 000 代入上式町阳.H = 861.75 ^862 .所以杆木 18至少为2.4 解:总体中套加培训班的比例为P.强么这次简眾閤机抽样紂到的P 的估计ffip 的方溢 1-f N “、 n-PP(l-P)・利用中心极国迷理可得+—在人杆木的条件F 近似眼从标准正念分布.V 的l-a=95%的B!怙区何为v-r> 1 —a根据正念分布的分位数町以知适P庄和g中.样木盘足够大.从m何typ的1-0=95%的置伉区何为]卩・讣卩莎P+Z^JF⑹卜丽这眼的叫P)是未妹的.我们便用它的估计(ftr(p)=v(p)=^p(l-p)=9.652xl0-\所以总体比例P的l-a = 95%的置仃区何可以写为["-二呻庶门“ +兀喘応孑}将p = O.35^ = 2OO.y = IOOOO代入町得K信区何为〔0.284 4.0.4156].2.5解:利用衍到的样木.计ma样本均值为歹=2 890/20 = 144.5.从ifiH占计小区的平均文化支出为144.5 7U.总体均(ftV的l-a = 95%的迓仃区何为卩-二皿灰冰歹匕曲丁^药]用二乎,来估计样本均值的方筮卩@)・计算斜到F =826.025 6,则卩(刃=匕上T =匕巴丄只826・025 6 = 37」72 •n20£/:丿卩(刃=1 %xj37.172 71.95 •代入数W可紂总体肉值的95%的置佰区何为[132.55J 56.45].2.6M:根据样木位息估计对衍毎个乡的平均产诫为1120吨.该地区今年的粮伐总产虽丫的佔计值为X = 350> = 350xl 120 =3.92xl05(吨)•)S2.总体总(ft 的I・a = 95%的盘伉区何为总体总(ft估计值的方差为rM= W•把y = 3.92X10\S2 = 25 600,n = 50,^ = 350,= 1.96代入.可須粮伏总产虽的l-a=95%的置信区何为[377 629.406 371]./ = ^.za/:解:泞先计外简腋皈机抽样条什下所需耍的祥本虽・把N = l 000,d = 2」-a = 95%S'=68 帯入公式%如果彩电到仃效河猝率的问題・亦仃效冋??率为70%时・样本虽应该加终确定为/70% = 88.57 *89./i = no2.8 M:去年的化肥总产虽和今邻的总产量Z何存在较強的WXfte iliifl这种相关关系较为楼定.所以引入去年的化肥产址作为辅助变虽・「•建我的采用比申估计址的形式*估计今年的化肥总产虽•去年化肥总广虽为X = 2I35・利用£年的化肥总严虽・今年的化肥总产虽的估计(ft为y/?X=^X = 2 426.14< =■X2.9駢:木JS中.简險估计址的方羞的估计(ft为v(y)=^L S2 =37.17.n利用比率估itfit进行估计时.我们引入了家庭的总支出作为辅助变fit.记为X・文化支出届F总支岀的一部分.这个上箜变st与辅助变st之何存在较強的相关关系.面11它m之何的关系是比较住定的.11全部家庭的总支出是已知的虽・文化支出的比率估计就为y^RX^X.通过if■算彻到y = 2 890/20 = 144.5・ifijx = l 580.則' V 144 5 ・/? = 1 = 2_£O,O915.文化支岀的比率佔计址的值为儿= 146.3 (元人=•I现在考Jg比率佔计fit的方差.在样木足牧大的条件几卩(耳片MSE(耳片乎(S j2RpS・S,+用S:)・通过计件吋以得到两个变fit的样本方羞为A?=826,.<=9.958xl0\『和X之何的相关系数的佔计值为p = 0.974.代入上面的公式.可U得到比半估计虽的方差的佔计備为v耳=1.94・这个数值比简的方羌佔计值耍小很个部家庭的平均文化支出的l-a = 95%的盘估X何为[斤・%应订•齐+ %応「卜“96^面•齐+1 %応J]・把具体的敌值代入可得置仃区何为[143.57.149.03].y[yA彳元)接下来比较比佔汁和简腋佔计的效札亠亠2 = :^ = 0・052・这是比佔计的设计效应v(y)呛)37.17值,从这里可以看岀比佔计駅比简乐佔计虽的效率史高.2.10 利用简爪佔计址町紂戸=》比/” = 1 630/10二163・样本方澄为? =212.222, AT = 120・样本均值的方左佔计值为v(y)=52 = ^1^120 x212.222 = 19.453 7.利用回贮估计的方注.在这里选取肉牛的KiRfi为辅助变址.迭擇原電虽为緬助矢St是合理的.因为肉牛的很大程皮上彩响荷肉牛的现任的車虽・二折Z何“庄牧冬的相关性.郴关系数的估计血为2 = 0.971 •临II 这种相关关瑕是稳定的.这觇肉牛的原載虽的8(值已经衍到.所以选好肉牛的廉載ft为辅助妞.* * |4 CAQ何粉估计SMM度加高的冋•垠敌“的伕计ffi为/7 = p—= 0.971x^^- = 1.368.现在何以衍到$. 10.341肉牛fltiF.fi 的回归佔计fit 为无=戸+ 0 X^x .代入数值町以月到畀=159.44.囚为恋在肉牛股秋fit 这个牧好的辅助变足,所以冋$1佔计虽的箱度耍好「简冋归估计fit 入的方差为打兀)=MSE (人方差的佔计位为仏卜•代入柿应的敷值・单估计就・。
抽样技术课后习题_参考答案_金勇进
第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。
解析:由已知得:10000=N 200=n 35.0=p 02.0==Nnf 又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。
应用抽样技术课后习题答案.
第二章 抽样技术基本概念
2.7(1)抽样分布: 3 3.67 4.33 5 5.67 6.33 7
1/10 1/10 2/10 2/10 2/10 1/10 1/10 (2)期望为5,方差为4/3 (3)抽样标准误1.155 (4)抽样极限误差2.263 (5)置信区间(3.407,7.933)
第三章 简单随机抽样
3.3为调查某中学学生的每月购书支出水平,在全校 名学生中,用不放回简单随机抽样的方法抽得一 个的样本。对每个抽中的学生调查其上个月的购 书支出金额 (如表1所示)。
(1)在95%的置信度下估计该校学生该月平均购书支 出额;
(2)试估计该校学生该月购书支出超出70元的人数;
(3)如果要求相对误差限不超过10%,以95%的置信 度估计该校学生该月购书支出超出70元的人数比 例,样本量至少应为多少。
故 n ≈ 92.26 ≈93
4.8 解 已知W1=0.7,W2=0.3,p1=1/43,p2=2/57 (1)简单随机抽样 (1+2)/100=0.03 V(P)(1)=0.03*0.97/99=0.0002937 (2)事后分层 Σ0.7*1/43+0.3*2/57=0.0268 V() =Σ2[(1—)/(—1)] =0.72*[1/42](1/43)(42/43)+0.32*[1/56](2/57)(55/57) =0.00031942
由此可计算得:
n0
t2q r2 p
1.962 0.733 0.01 0.267
1054.64
n = n0/[1+(n0—1)] = 1054.64/[1+1053.64/1750]=658.2942 = 659
计算结果说明,至少应抽取一个样本量为659的简单随机样本,才能 满足95%置信度条件下相对误差不超过10%的精度要求。
抽样技术课后习题_参考答案_金勇进
第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。
解析:由已知得:10000=N 200=n 35.0=p 02.0==Nnf 又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。
应用抽样技术练习题答案
应用抽样技术练习题答案应用抽样技术练习题答案抽样技术是统计学中一项重要的技术,它可以帮助我们从一个大的总体中选择一部分样本,以便对总体进行推断和分析。
在实际应用中,抽样技术经常被用于市场调研、社会调查、医学研究等领域。
本文将以应用抽样技术练习题答案为标题,探讨抽样技术的应用和意义。
首先,抽样技术可以帮助我们更加高效地进行数据收集。
在进行大规模调查时,往往无法对整个总体进行调查,这时候抽样技术就派上了用场。
通过合理地选择样本,我们可以在保证数据的准确性和代表性的前提下,节省大量的时间和资源。
例如,一家市场调研公司要对某个产品的受众进行调查,如果直接对所有人进行问卷调查,成本和时间都是不可忽视的。
而通过抽样技术,他们可以选择一部分具有代表性的受众进行调查,从而更加高效地获取数据。
其次,抽样技术可以帮助我们进行统计推断。
在抽样过程中,我们往往会使用一些统计指标来描述样本的特征,例如平均值、标准差等。
通过对样本的统计指标进行分析,我们可以推断出总体的一些特征。
这在实际应用中具有重要的意义。
例如,一家医药公司想要了解某种新药的疗效,他们可以通过抽样技术选择一部分患者进行试验,然后根据样本的统计指标来推断总体的疗效。
这样可以节省大量的成本和时间,同时也可以减少对患者的风险。
此外,抽样技术还可以帮助我们发现隐藏在数据中的规律和趋势。
在大规模数据中,往往存在着大量的噪声和无关信息。
通过抽样技术,我们可以选择一部分具有代表性的样本进行分析,从而减少噪声的干扰,发现数据中的真实规律。
例如,一家电商平台想要了解用户的购物习惯,他们可以通过抽样技术选择一部分用户进行分析,从而找出用户的偏好和需求,进而优化产品和服务。
综上所述,抽样技术在实际应用中具有重要的意义。
它可以帮助我们更加高效地进行数据收集,进行统计推断,发现隐藏在数据中的规律和趋势。
在统计学和数据分析领域,抽样技术是一项不可或缺的工具。
通过合理地应用抽样技术,我们可以更好地理解和分析数据,为决策提供科学依据。
抽样技术课后习题-参考答案-金勇进
抽样技术课后习题-参考答案-金勇进第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s1706366666206*300500003001500001)()ˆ(222=-=-==s nf N y N v YV 19.413081706366666(==)y v 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
抽样技术课后习题-参考答案-金勇进
抽样技术课后习题-参考答案-金勇进第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s1706366666206*300500003001500001)()ˆ(222=-=-==s nf N y N v YV 19.413081706366666(==)y v 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
应用抽样技术答案.doc
第一章1.1判断题:(1)对;(2)对;(3)对;(4)对;(5)错;(6)错;(7)错;(8) 错;(9)错;(10)对•;(11)对。
1.2试分析以下几种抽样属于何种抽样(概率或非概率):(1)概率抽样;(2)非概率抽样;(3)非概率抽样;(4)非概率抽样;(5)非概率抽样;(6)非概率抽样。
1.3选择题:(1) c; (2) c; (3) b; (4) co第二章2.1判断题:(1)错;(2)错;(3)对;(4)错;(5)错;(6)错;(7)错;(8) 错;(9)对;(10)对;(11)错;(12)错;(13)错。
2.3选择题:(2)期望为5,方差为4/3(3)抽样标准误=I,= 1.155(4)抽样极限误差= 1.96*1.155 = 2.263(5)置信区间=(5.67-2.263, 5.67+2.263) = (3.407, 7.933)。
若区间两端只考虑抽样分布的可能性取值,则可得该抽样分布作为离散分布的置信区间为[3,7]第三章3.1判断题是否为等概率抽样:(1)是;(2)否;(3)是;(4)否。
3.2p = — == 0.267 n 30 m=g=°°g30-1⑴歹=土£匕=5.5『=§£(匕_区)2=6.2552 =-^—y(K-r)2 =8.33 N-\- 1(2)样本:(2,5) (2,6) (2,9) (5,6) (5,9) (6,9)此=空(3.5 + 4 + 5.5 + 5.5 + 7 + 7.5)= 5.5 8何)=?Z(4.5 + 8 + 24.5 + 0.5 + 84-4.5) = 8.333.3⑴ £叫=1682 Yy,.2 =118266 上£ =上四登= 0.03276 乙’n 30y = 1682/30 = 56.0672 1 -.2 1 fv -2) H8266-30x50.067A2s =—>()',—)') =—7 L H ~ny = ------------------------------ —— ------------ = 826.271 〃一1旨)30-1*时=上匚2 =0.03276x826.271 = 27.07 nse(项)=0(顼)=5.203△ =,x se(项)=1.96 x 5.203 = 10.19895%置信度下置信区间为(56.067-10.198, 56.067+10.198) = (45.869,66.265). 因此,对该校学生某月的人均购书支出额的估计为56.07 (元),由于置信度95% 对应的『= 1.96,所以,可以以95%的把握说该学生该月的人均购书支出额大约在45.87〜66.27元之间。
应用抽样技术课后习题答案
se(Ysrs)= 5014.883
面积/ 产量/ 亩斤 3 1400 2.5 1120 4.2 1710 3.6 1500 1.8 720 5.2 1980 3.2 1310 2.4 1080 2.6 1300 1.2 480 29.7 12600
第三章 简单随机抽样
3.3为调查某中学学生的每月购书支出水平,在全校 名学生中,用不放回简单随机抽样的方法抽得一 个的样本。对每个抽中的学生调查其上个月的购 书支出金额 yi (如表1所示)。
(1)在95%的置信度下估计该校学生该月平均购书支 出额;
(2)试估计该校学生该月购书支出超出70元的人数;
(2)易知,N=1750,n=30, n1 8 t=1.96
p n1 8 0.267 n 30
1 f N n 1750 30 0.03389 n 1 (n 1)N 29 1750
pq p(1 p) 0.267 0.733 0.1957
(1 f ) pq 0.03389 0.1957 0.08144 n 1
表1
i
1 2 3 4
总体单位规模比值
zi
i
0.098
6
0.102
7
0.057
8
0.251
9
zi
0.067 0.048 0.154 0.223
6.1产解生:n令=3个M 0随机10数00,,设则为可1以08得,到59下7表,,75从4,1-则1第00二0、中 第六和第七个单位入样。
应用抽样技术练习题答案
应用抽样技术练习题一、选择题1. 下列哪种抽样方法属于非概率抽样?A. 简单随机抽样B. 分层抽样C. 方便抽样D. 系统抽样2. 在简单随机抽样中,每个个体被抽中的概率是:A. 不相等B. 相等C. 逐渐增大D. 逐渐减小A. 总体标准差B. 抽样误差C. 置信水平A. 确定总体B. 划分层次C. 确定各层样本量5. 系统抽样中,抽样间隔的计算公式是:A. N/nB. N/(n+1)C. n/ND. (N1)/n二、填空题1. 抽样技术分为两大类:______抽样和______抽样。
2. 在______抽样中,每个个体被抽中的概率是相等的。
3. 抽样误差的大小与样本量成______比,与总体标准差成______比。
4. 在分层抽样中,各层的样本量应与各层的______成比例。
5. 系统抽样的第一步是确定______。
三、简答题1. 简述简单随机抽样的步骤。
2. 何为抽样误差?它受哪些因素影响?3. 简述分层抽样的优点。
4. 系统抽样与简单随机抽样有何区别?5. 如何确定样本量?四、计算题1. 某企业有员工1000人,采用简单随机抽样方法抽取50人进行调查。
计算每个员工被抽中的概率。
2. 某地区居民收入总体标准差为500元,要求抽样误差不超过50元,置信水平为95%。
计算所需样本量。
3. 某学校有学生2000人,分为四个年级,每个年级人数分别为400、450、500和650人。
现采用分层抽样方法抽取200人进行调查,求每个年级应抽取的样本量。
4. 某生产线共有1000个产品,采用系统抽样方法抽取100个产品进行质量检验。
计算抽样间隔。
5. 某企业对员工满意度进行调查,总体标准差为10%,要求抽样误差不超过2%,置信水平为90%。
计算所需样本量。
五、判断题1. 在抽样调查中,总体的大小对于抽样误差没有影响。
()2. 非概率抽样不能提供总体参数的估计。
()3. 在系统抽样中,第一个样本单元可以随机选择。
抽样技术课后习题-参考答案-金勇进
抽样技术课后习题-参考答案-金勇进第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s1706366666206*300500003001500001)()ˆ(222=-=-==s nf N y N v YV 19.413081706366666(==)y v 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
抽样技术课后习题答案
抽样技术课后习题答案第⼆章习题2.1判断下列抽样⽅法是否是等概的:(1)总体编号1~64,在0~99中产⽣随机数r ,若0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产⽣随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产⽣随机数r 。
然后⽤19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有⼀些⼏个特点:第⼀,按照⼀定的概率以随机原则抽取样本。
第⼆,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当⽤样本对总体⽬标进⾏估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?解析:抽样理论和数理统计中关于样本均值的定义和性质的不同抽样理论概率统计定义 ∑==ni i y n y 11∑==ni iy n y 11性质1.期望()()()()Y C P E NN C N C ===∑∑==n n1i n i 1i i i 1y y y2.⽅差()()()[]()iiP y E y y V n N21∑=-==()()[]n NC i iiC y E y n N121∑=- ()21S nf -=1.期望()??=∑=n i i y n E y E 11()∑==ni y E 1i n 1[]µµ==n n12.⽅差()[]2µ-=i y E y V211-=∑=n i i y n E µ()ny n 122i σµ=-=E2.3为了合理调配电⼒资源,某市欲了解50000户居民的⽇⽤电量,从中简单随机抽取了300户进⾏,现得到其⽇⽤电平均值=y 9.5(千⽡时),=2s 206.试估计该市居民⽤电量的95%置信区间。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
=(0.0907,0.4433)
N1的95%的置信区间为: (159,776) 95%的置信区间为 (159, 的置信区间为:
(3)N=1750,n=30, (3)N=1750,n=30,n1=8, t=1.96, p=0.267, q=1q=1-0.267=0.733 由此可计算得: t 2q 1.962 × 0.733 n0 = 2 = =1054.64 r p 0.01× 0.267 n = n0/[1+(n0—1)/N] = 1054.64/[1+1053.64/1750]=658.2942 = 659 计算结果说明,至少应抽取一个样本量为659的简单随机 样本,才能满足95%置信度条件下相对误差不超过10%的精度 要求。
t=1.96 (2)易知,N=1750,n=30, n = 8 1 n 8 N − n 1750 − 30 1− f p= 1 = = 0.267 = = = 0.03389 n −1 (n −1)N 29 ×1750 n 30
pq = p(1 − p) = 0.267 × 0.733 = 0.1957
5.5 证明:由(5.6)得:
V ( yR ) ≈ 1− f n (Yi − RX i )2 ∑
i =1 N
N −n 2 令 Sd = V , Nn
2 d
N −1
=
N −n 2 Sd Nn
则n(NV + S ) = NS ,
2 d
S 2 NSd 从而n = = V 2 2 NV + Sd Sd 1+ NV
第五章 比率估计与回归估计
5.2 N=2000, n=36, 1-α=0.95, t=1.96, ˆ f = n/N=0.018, v(R) = 0.000015359, ˆ se(R) =0.00392 置信区间为[40.93%,42.47%]。 置信区间为[40.93%,42.47%]。
第五章 比率估计与回归估计
,
PQ (1) 由 n0 = 得: V ( p)
1 0
0.08 × 0.92 n = = 30 2 0.05 Q 得: (2) 由 n0 = 2 Cv ( p)P
0.92 n = = 4600 2 0.05 × 0.08
1 0
0.05 × 0.95 n = = 19 2 0.05
2 0
0.95 n = = 7600 2 0.05 × 0.05
面积/ 产量/ 面积/ 产量/ 亩 斤 3 1400 1120 2.5 4.2 1710 3.6 1500 1.8 720 5.2 1980 3.2 1310 2.4 1080 2.6 1300 1.2 480 29.7 12600
回归估计: 5.6 解 (3) 回归估计 回归系数 b = Sxy/Sxx2= 370.5965 ylr=x—b(x—X)=1260—370.5965*(2.97—460/140)=1377.089 Ylr=Nylr=192792.47(斤) 斤 v(Ylr)=[N2(1—f)/n] *∑i=1n [yi—y—b(xi—x)]2/(n--2) =[1402(1—10/140)/80]*89480.59 = 20356834 se(Ylr)= 4511.855
表1
样本 序号 1 2 3 4 5 6 7 8 9 10
30名学生某月购书支出金额的样本数据
支出额 (元) 85 62 42 15 50 39 83 65 32 46 样本 序号 11 12 13 14 15 16 17 18 19 20 支出额 (元) 20 75 34 41 58 63 95 120 19 57 样本 序号 21 22 23 24 25 26 27 28 29 30 支出额 (元) 49 45 95 36 25 45 128 45 29 84
2 d
简单估计: 5.6 解 (1) 简单估计 总产量: 总产量: Ysrs=(N/n)∑i=1n Yi=(140/10)[1400+1120+…+480] =176400(斤) 斤 v(Ysrs)=[N2(1—f)/n]SY2 =[1402(1—10/140)/10]*194911.1 = 354738222 se(Ysrs)= 18834.496
3.5要调查甲乙两种疾病的发病率,从历史资料得知, 甲种疾病的发病率为8%,乙种疾病的发病率为5 %,求: (1) (1)要得到相同的标准差0.05,采用简单随机抽样各 0.05 需要多大的样本量? (2)要得到相同的变异系数0.05,又各需要多大的样 本量?
3.5解:已知
P1= 0.08, Q1= 1-P1 = 0.92; P2= 0.05, Q2 = 1– P2 = 0.95; V(p) = 0.05*0.05
表1 总体单位规模比值
ρ 5.3当 CX 方法,当 ρ = 时两种方法都可使用。这是因为:
>
ρ < CX 时用第一种方法,当 2CY
CX 2CY时用第二种
2CY y 1− f 2 2 1− f 2 2 1 − f 2 1− f 2 2, V ( ) = Y CY = R CY 2 V ( y) = SY = Y CY X nX n n n
5.7解:
n 1 n ∗ ylr = ylr + B( X − x) = y + 2B( X − x) = ∑[ yi − 2B(xi − X )] n i =1 ∗ E( ylr ) = E( ylr ) + B[ X − E(x)] = Y
1 f 1 N - 1 n = V ( y ) = V{ ∑[ yi − 2B(xi − X )]} ∑[Yi − 2B( Xi − X ) −Y ]2 n N −1 i =1 n i =1
v( y) = 0.03276 × 798.73 = 26.168
se( y) = v( y) = 5.115
因此,对该校学生某月的人均购书支出额的估计为56.07 (元),由于置信度95%对应的 t=1.96, 所以,可以以95%的把 , 握说该学生该月的人均购书支出额大约在56.07±1.96×5.115, 即50.96--61.19元之间。
应用抽样技术答案
第二章 抽样技术基本概念
2.7(1)抽样分布: 3 3.67 4.33 5 5.67 6.33 7 1/10 1/10 2/10 2/10 2/10 1/10 1/10 (2)期望为5,方差为4/3 (3)抽样标准误1.155 (4)抽样极限误差2.263 (5)置信区间(3.407,7.933)
y y 1− f 2 V ( ) −V ( ) = R CX (2ρCY − CX ) X x n
﹥0
5.4 解: V(YR)≈[(1—f)/n]Y2[CY2+CX2—2rCYCX] V(Ysrs)=[(1—f)/n]SY2 =[(1—f)/n] CY2Y2
故
V(YR)/V(Ysrs) = 1—[2rCX/CY—CX2/CY2] = 1-[2*0.696*1.054/1.063-1.0542/1.0632] = 1-0.397076 = 0.602924
(1 − f ) pq = 0.03389 × 0.1957 = 0.08144 n −1
1 = 0.0167 2n
95%的置信区间为 的置信区间为: P 的95%的置信区间为:
p ± (u
1−
α
2
(1− f ) pq 1 + ) = 0.267 ± (1.96 × 0.08144 + 0.0167) n −1 2n
∗ 故估计量 ylr虽然与
一样都是 Y的无偏估计, ylr
但方差不小于 ylr 的方差,
∗ 当 ρ ≠ 0时 V ( ylr ) > V ( ylr ) ,
∗ 故 ylr不优于
ylr。
第六章 不等概率抽样
6.1假设对某个总体,事先给定每个单位的与 规模成比例的比值 Zi ,如下表,试用代码 法抽出一个n=3的 PPS 样本。
2 0
第四章 分层抽样
4.3解: 解
(元) (元) s( yst ) = 3.08 (1) yst = 20.07 ) , n=186 186, 57, 92, (2)按比例分配 n=186,n1=57,n2=92,n3=37 ) (3)Neyman分配 n=175,n1=33,n2=99,n3=43 ) 分配 , , , 4.5 yst = 75.79 元 ,置信区间(60.63,90.95)元。 , ) ( ) 置信区间(
∗ lr
2 E( ylr ) = Y , V ( ylr ) = 1− f SY (1− ρ2 )
1− f 2 1− f 2 2 2 (SY + 4B2 S X − 4BSYX ) = [SY + 4B(BS x − SYX )] n n 1 f 2 1− f 2 - = SY ≥ SY (1 − ρ 2 ) = V ( ylr ) n n =
,
若ρ<
y ˆ 1− f R2 (C2 + C2 − 2ρC C ) V ( ) = C
X
则
ρ
ρ
2CY CX = 2CY C > X 2CY
V ( ) −V ( ) = R2CX (2ρCY − CX )<0 X x n
y y 1− f 2 V ( ) −V ( ) = R CX (2ρCY − CX ) = 0 X x n
4.8 解 已知 1=0.7,W2=0.3,p1=1/43,p2=2/57 已知W , , , (1)简单随机抽样 ) Psrs=(1+2)/100=0.03 V(P)=PQ/(n-1)=0.03*0.97/99=0.0002937 (2)事后分层 ) Ppst=ΣhWhph=0.7*1/43+0.3*2/57=0.0268 V(Ppst) =ΣhWh2[(1—fh)/(nh—1)]phqh =0.72*[1/42](1/43)(42/43)+0.32*[1/56](2/57)(55/57) =0.00031942