抽样技术_第三版_全部课后答案
抽样技术章节试题及答案

抽样技术章节试题及答案一、选择题1. 抽样调查中,样本容量的确定通常不包括以下哪个因素?A. 总体大小B. 研究目的C. 抽样误差D. 抽样方法答案:D2. 在简单随机抽样中,每个个体被抽中的概率是:A. 相等的B. 不相等的C. 随机的D. 固定的答案:A3. 系统抽样中,抽样间隔的确定不考虑以下哪个因素?A. 总体大小B. 样本容量C. 总体分布D. 抽样误差答案:D二、填空题1. 在分层抽样中,每个层内的样本容量与该层的______成正比。
答案:总体大小2. 抽样调查中,抽样误差的大小与样本容量成______关系。
答案:反比3. 非概率抽样中,最常用的抽样方法是______抽样。
答案:方便三、简答题1. 简述分层抽样的优点。
答案:分层抽样的优点包括:(1)可以提高估计的精度;(2)可以减少抽样误差;(3)可以更有效地利用样本信息。
2. 描述系统抽样的步骤。
答案:系统抽样的步骤包括:(1)确定总体中的个体数;(2)确定样本容量;(3)计算抽样间隔;(4)随机选择起始点;(5)按照抽样间隔依次抽取样本。
四、计算题1. 假设总体中有1000个个体,样本容量为100,使用简单随机抽样方法,计算每个个体被抽中的概率。
答案:每个个体被抽中的概率为100/1000 = 0.1。
2. 如果在一项调查中,样本容量为50,总体中个体数为500,使用系统抽样方法,计算抽样间隔。
答案:抽样间隔为500/50 = 10。
五、论述题1. 论述抽样调查与普查的区别。
答案:抽样调查与普查的主要区别在于:(1)抽样调查只对总体中的一部分个体进行调查,而普查是对总体中的每一个个体都进行调查;(2)抽样调查的成本和时间通常比普查要少;(3)抽样调查的结果可能存在抽样误差,而普查则可以提供更准确的数据;(4)抽样调查可以用于大规模的总体,而普查则在小规模总体中更为常见。
抽样技术课后习题_参考答案_金勇进

第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。
解析:由已知得:10000=N 200=n 35.0=p 02.0==Nnf 又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。
抽样技术课后习题参考答案金勇进

抽样技术课后习题参考答案金勇进YUKI was compiled on the morning of December 16, 2020第二章习题判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?解析:抽样理论和数理统计中关于样本均值的定义和性质的不同为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y (千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±*]即为(,) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为862某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
随机抽取了两百名学生进行调查,得到P=,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。
统计学课后答案(第3版)第6章抽样分布与参数估计习题答案

第六章 抽样分布与参数估计习题答案一、单选1.B ;2.D ;3.D ;4.C ;5.A ;6.B ;7.C ;8.D ;9.A ;10.A 二、多选1.ADE ;2.ACDE ;3.ABCD ;4.ADE ;5.BCE6.ACD ;7.ACDE ;8.ACE ;9.BCE ;10.ABD 三、计算分析题1、解:n=10,小样本,由EXCEL 计算有:11.6498==S x ; (1)方差已知,由10596.14982⨯±=±nz x σα得,(494.9,501.1)(2)方差未知,由1011.62622.2498)1(2⨯±=-±nS n t x α得,(493.63,502.37)2、n=500为大样本,p=80/500=16%,则置信区间为 016.096.1%16500)16.01(16.096.1%16)1(2⨯±=-⨯±=-±n p p z p α=(14.4%,17.6%) 3、nx σσ=,由于大国抽取的样本容量大,则抽样平均误差小。
4、(1)3.10100103===nS x σ(小时);=-=-=100)95.01(95.0)1(n p p p σ 2.18%(2)=⨯±=±3.10211202x z x σα(1099.4,1140.6) ⨯±=±2%952p z p σα2.18%=(90.64,99.36)5、为简化起见,按照重复抽样形式计算 (1)∑∑=ff s Si22=22.292; 472.010072.4===nS x σ(2)93.0691472.096.1100691002±=⨯±=±nSz x α=(690.07,691.93) 6、由于总体标准差已知,则用标准状态分布统计量估计nz x σα2=∆(1)10160170102022=-===∆αασz nz x则58.12=αz ,有%29.94)58.1(=F α=1-94.29%=5.71%,则概率%58.88%71.5%29.941=-=-=α (2)=⇒⨯=⇒⨯=∆n n nz x 2096.142σα97(个)(3)=⇒⨯=⇒⨯=∆n nnz x 2096.122σα385(个)允许误差缩小一半,样本容量则为原来的4倍。
第三章分层随机抽样作业答案

P111 3.6 样本量应该满足:
在Nh-1≈Nh的条件下,
而其中每层的吃年夜饭的样本比例的方差的估计值为: p 1 p 1 f N n h hn h h hh v p p 1 p h h h n 1 N n 1 hn h h h
则样本比例的方差的估计值为:
6 2 h 6 2 h
p 1 p h h v p W v p W 1 f s t h h n 1 h 1 h 1 h
把相应的数值代入计算可得方差的估计值为v(pst)=3.9601×10-4,
从而可以得到该估计值的标准差为:s(pst)=0.0199。
(2)样本容量的确定
n2 = 0.2028 × 2568 = 520.7904 ≈ 521
n3 = 0.1625 × 2568 = 417.3000 ≈ 417 n4 = 0.1184 × 2568 = 304.0512 ≈ 304 n5 = 0.1544 × 2568 = 396.4992 ≈ 396 n6 = 0.1529 × 2568 = 392.6472 ≈ 393
P110 3.4 ∵ n0/N=2568/1650000=0.00156<0.05 ∴ 不需要修正 按内曼分配,样本量 n = 2568
w h
W 1 ph ) hp h(
w1= 0.0540/0.2584 = 0.2090
W p (1 p )
h1 h h h
k
w2= 0.0524/0.2584 = 0.2028
P110 3.5 解:总体总共分为10个层,每个层中的样本均值已经知道, 层权也得到,从而可以计算得到该开发区居民购买冷冻 食品的平均支出的估计值为: y st
《抽样技术》练习题及标准答案

《抽样技术》练习题及答案————————————————————————————————作者:————————————————————————————————日期:习题一1.请列举一些你所了解的以及被接受的抽样调查。
2.抽样调查基础理论及其意义;3.抽样调查的特点。
4.样本可能数目及其意义;5.影响抽样误差的因素;6.某个总体抽取一个n=50的独立同分布样本,样本数据如下:567 601 665 732 366 937 462 619 279 287690 520 502 312 452 562 557 574 350 875834 203 593 980 172 287 753 259 276 876692 371 887 641 399 442 927 442 918 11178 416 405 210 58 797 746 153 644 4761)计算样本均值y与样本方差s2;2)若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式;3)根据上述样本数据,如何估计v(y)?4)假定y的分布是近似正态的,试分别给出总体均值μ的置信度为80%,90%,95%,99%的(近似)置信区间。
习题二一判断题1 普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。
2 概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。
3 抽样单元与总体单元是一致的。
4 偏倚是由于系统性因素产生的。
5 在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。
6 偏倚与抽样误差一样都是由于抽样的随机性产生的。
7 偏倚与抽样误差一样都随样本量的增大而减小。
8 抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。
9 抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。
10 总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。
抽样技术第三版第2、3章习题答案

第2章2.1 解:()1 这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是1100。
()2这种抽样方法不是等概率的。
利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是2100,而尚未被抽中的编号为36~63的每个单元的入样概率都是1100。
()3这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是11000,所以这种抽样是等概率的。
2.3 解:首先估计该市居民日用电量的95%的置信区间。
根据中心极限定理可知,在大_y E y y -=近似服从标准正态分布, _Y 的195%α-=的置信区间为y z y z y y αα⎡⎡-+=-+⎣⎣。
而()21f V y S n-=中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间为,y y ⎡⎤-+⎢⎥⎣⎦。
由题意知道,_29.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得 _21130050000()2060.6825300f v y s n --==⨯=。
将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192⎡⎤⎣⎦。
下一步计算样本量。
绝对误差限d 和相对误差限r 的关系为_d rY =。
根据置信区间的求解方法可知____11P y Y r Y P αα⎫⎪⎧⎫-≤≥-⇒≤≥-⎨⎬⎩⎭根据正态分布的分位数可以知道1P Z αα⎫⎪⎪≤≥-⎬⎪⎪⎭,所以()2_2r Y V y z α⎛⎫⎪= ⎪⎝⎭。
也就是2_2_222/221111r Y r Y S n N z S n N z αα⎡⎤⎛⎫⎢⎥⎛⎫⎪⎛⎫⎝⎭⎪⎢⎥-=⇒=+ ⎪ ⎪⎢⎥⎝⎭⎝⎭⎢⎥⎣⎦。
把_29.5,206,10%,50000y s r N ====代入上式可得,861.75862n =≈。
抽样技术第三章参考答案

第三单元习题答案1解:(1)不合适(2)不合适(3)合适(4)不合适2.将800名同学平均分成8组,在每一级中抽取一名“幸运星”。
3.根据表中调查数据,经计算,可得下表:h1 10 256 0.3033 0.0391 11.2 2867.2 94.42 10 420 0.4976 0.0238 25.5 10710 302.53 10 168 0.1991 0.0595 20 3360 355.6总计30 844 1 16937.2错误!未找到引用源。
=错误!未找到引用源。
=20.1V(错误!未找到引用源。
)=错误!未找到引用源。
-错误!未找到引用源。
=9.7681-0.2962=9.4719错误!未找到引用源。
=3.0777(2)置信区间为95%相对误差为10%,则有按比例分配的总量:n=错误!未找到引用源。
=185.4407错误!未找到引用源。
185错误!未找到引用源。
=n错误!未找到引用源。
=56,错误!未找到引用源。
=92,错误!未找到引用源。
=37按内曼分配:n=错误!未找到引用源。
=175错误!未找到引用源。
=33,错误!未找到引用源。
=99,错误!未找到引用源。
=434.根据调查数据可知:h1 0.18 0.92 0.21 0.9333 0.14 0.94 0.08 0.8675 0.16 0.9336 0.22 0.967错误!未找到引用源。
=错误!未找到引用源。
=0.924根据各层层权错误!未找到引用源。
及抽样比错误!未找到引用源。
的结果,可得错误!未找到引用源。
(错误!未找到引用源。
)=错误!未找到引用源。
=0.000396981错误!未找到引用源。
=1.99%错误!未找到引用源。
估计量的标准差为1.99%,比例为9.24%按比例分配:n=2663错误!未找到引用源。
=479,错误!未找到引用源。
=559,错误!未找到引用源。
=373,错误!未找到引用源。
=240,错误!未找到引用源。
《抽样技术》练习题及标准答案

《抽样技术》练习题及答案————————————————————————————————作者:————————————————————————————————日期:习题一1.请列举一些你所了解的以及被接受的抽样调查。
2.抽样调查基础理论及其意义;3.抽样调查的特点。
4.样本可能数目及其意义;5.影响抽样误差的因素;6.某个总体抽取一个n=50的独立同分布样本,样本数据如下:567 601 665 732 366 937 462 619 279 287690 520 502 312 452 562 557 574 350 875834 203 593 980 172 287 753 259 276 876692 371 887 641 399 442 927 442 918 11178 416 405 210 58 797 746 153 644 4761)计算样本均值y与样本方差s2;2)若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式;3)根据上述样本数据,如何估计v(y)?4)假定y的分布是近似正态的,试分别给出总体均值μ的置信度为80%,90%,95%,99%的(近似)置信区间。
习题二一判断题1 普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。
2 概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。
3 抽样单元与总体单元是一致的。
4 偏倚是由于系统性因素产生的。
5 在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。
6 偏倚与抽样误差一样都是由于抽样的随机性产生的。
7 偏倚与抽样误差一样都随样本量的增大而减小。
8 抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。
9 抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。
10 总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。
抽样技术试题及答案

抽样技术试题及答案一、单选题(每题2分,共10分)1. 抽样调查中,样本容量的确定主要取决于()。
A. 总体数量B. 抽样误差C. 总体的变异程度D. 抽样方法答案:C2. 简单随机抽样的特点不包括()。
A. 每个样本单位被抽中的概率相同B. 样本容量较小时,代表性较好C. 样本容量较大时,代表性较差D. 抽样误差较小答案:C3. 在分层抽样中,分层的依据是()。
A. 总体的分布情况B. 总体的数量C. 总体的变异程度D. 总体的地理位置答案:C4. 系统抽样中,抽样间隔的确定主要依据()。
A. 总体数量B. 样本容量C. 总体的分布情况D. 抽样误差答案:B5. 抽样调查中,样本的代表性是指()。
A. 样本容量的大小B. 样本的分布情况C. 样本能否代表总体D. 样本的变异程度答案:C二、多选题(每题3分,共15分)1. 抽样调查的优点包括()。
A. 节省人力物力B. 调查速度快C. 调查结果准确D. 调查结果可靠答案:ABD2. 抽样误差的来源包括()。
A. 抽样方法B. 抽样框的不完善C. 抽样过程中的随机性D. 样本容量的大小答案:ABCD3. 在抽样调查中,下列哪些因素会影响样本的代表性()。
A. 抽样方法B. 抽样框的完整性C. 样本容量D. 抽样过程中的随机性答案:ABCD4. 非概率抽样方法包括()。
A. 简单随机抽样B. 系统抽样C. 便利抽样D. 配额抽样答案:CD5. 抽样调查中,样本容量的确定需要考虑的因素包括()。
A. 总体的数量B. 总体的变异程度C. 允许的抽样误差D. 置信水平答案:BCD三、判断题(每题1分,共5分)1. 抽样调查是一种非全面调查方法。
()答案:正确2. 抽样调查的结果可以完全代表总体。
()答案:错误3. 抽样误差的大小与样本容量成反比。
()答案:正确4. 系统抽样是一种概率抽样方法。
()答案:正确5. 抽样框的不完善会导致抽样误差的增加。
()答案:正确四、简答题(每题5分,共10分)1. 简述分层抽样的步骤。
抽样技术课后习题_参考答案_金勇进

第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。
解析:由已知得:10000=N 200=n 35.0=p 02.0==Nnf 又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。
应用抽样技术课后习题答案.ppt

3.5要调查甲乙两种疾病的发病率,从历史资料得知, 甲种疾病的发病率为8%,乙种疾病的发病率为5 %,求:
(1)要得到相同的标准差0.05,采用简单随机抽样各 需要多大的样本量?
(2)要得到相同的变异系数0.05,又各需要多大的样 本量?
3.5解:已知 P1= 0.08, Q1= 1-P1 = 0.92;
5.y7Elr解(y:lry)lrEB((EyXlr()ylrx)B) [XYy, VE2(B(xy()lXr])Yx1)nf1nSiYn21(1[ yi
2)
2B(xi
X
)]
V
(
ylr
)
V
{
1 n
n [ yi 2B(xi X )]}=1-nf
i 1
1 N 1
N i 1
[Yi
2B(
Xi
X
6.1解:令 M0 1000
,则可以得到下表,从
1-1000中产生n=3个随机数,设为108,597,754,
则第二、第六和第七个单位入样。
i
Mi
累计Mi
代码
1
98
98
1~98
2
102
200
99~200
3
57
257
201~257
4
251
508
258~508
5
《抽样技术》练习题及标准答案

《抽样技术》练习题及答案————————————————————————————————作者:————————————————————————————————日期:习题一1.请列举一些你所了解的以及被接受的抽样调查。
2.抽样调查基础理论及其意义;3.抽样调查的特点。
4.样本可能数目及其意义;5.影响抽样误差的因素;6.某个总体抽取一个n=50的独立同分布样本,样本数据如下:567 601 665 732 366 937 462 619 279 287690 520 502 312 452 562 557 574 350 875834 203 593 980 172 287 753 259 276 876692 371 887 641 399 442 927 442 918 11178 416 405 210 58 797 746 153 644 4761)计算样本均值y与样本方差s2;2)若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式;3)根据上述样本数据,如何估计v(y)?4)假定y的分布是近似正态的,试分别给出总体均值μ的置信度为80%,90%,95%,99%的(近似)置信区间。
习题二一判断题1 普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。
2 概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。
3 抽样单元与总体单元是一致的。
4 偏倚是由于系统性因素产生的。
5 在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。
6 偏倚与抽样误差一样都是由于抽样的随机性产生的。
7 偏倚与抽样误差一样都随样本量的增大而减小。
8 抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。
9 抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。
10 总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。
抽样技术 第三版 第二章课后部分答案 R语言

抽样技术作业一(2.5——2.10)袁闪闪 21205021192.5 解:这里N =200,n =20,由表中的数据可得:2011221211144.5201()826.052611()- 6.097n i i i i n i i y y y n s y y n nv y s n N=======-=-=⨯=∑∑∑(1) 因而该小区平均的文化支出Y 的95%的近似置信区间为:22/2/211[-,-][144.5 1.96 6.097][132.5503,156.4497]n n y z s y z s n N n Nαα-⨯+⨯=±⨯=(1)(1) 所以该小区平均的文化支出Y 的估计为144.5元,其95%的置信区间为 (132.55元,156.45元)。
2.6解:有题意可得:N =350,n =50, y =1120,2s =25600, 所以粮食总产量为:3501120392000()Y N y ∧==⨯=元 代入数据得:22/2/211[-,-][392000 1.967332.12][377629,406371]n n y z Ns y z N s n N n Nαα-⨯+⨯=±⨯=(1)(1) 所以总产值的95%的置信区间为:(377629吨,406371吨)。
2.7解:由题意可得:N =1000,d =2,α=0.05,2S =68,r=70%, 带入公式,可得初始样本量:222/2022222/2/21161.362Nz S d n N z S Nd z S ααα⎛⎫=+==≈ ⎪+⎝⎭ 由于有效回答率为r=70%,,对样本容量进行再调整:0070%87.5788nn n r===≈所以样本最终确定为88。
2.8解:由题意已知:N =100,n =10, X =2135,y =25,x =22, 方法一:简单随机估计:100252500()Y N y ∧==⨯=吨方法二:比估计:由经验可知去年的化肥总产量和今年的总产量之间存在较强的相关性,引入去年的化肥总产量作为辅助变量。
抽样技术课后习题_参考答案_金勇进

第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r,r处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y的定义和性质有哪些不同?解析:抽样理论和数理统计中关于样本均值的定义和性质的不同2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s1706366666206*300500003001500001)()ˆ(222=-=-==s n f N y N v YV19.413081706366666(==)y v该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
抽样技术第五章课后答案

抽样技术第五章课后答案抽样是统计过程中的一个重要环节,它能提供更有效的统计息。
为了获得更加精确的结果,必须使用适当的抽样方法。
抽样方法包括()。
正确地使用()是指()式中所有抽样变量均可视为相同量。
每一组()个变量与某一组()个变量之间有()种相关性。
A:无关系变量; B:线性关联变量; C:关系-线性关联变量; D:线性相似性; E:线性相关性; F:相关性:对数关系。
一、问题定义给定样本,求所需数量。
分析数据求与所需数量对应的样本。
用多组样本重复抽取一组样本。
问题定义二、问题特征问题1:随机选择一个个体,要求其按照一定的方式计算一下,该个体与被抽到的抽样组的数量相等。
问题2:问题1中要得到的抽样组的数量为:从任意数量个样本的统计意义上(单位为 k)或从任意数量个样本的统计意义上(n、 n)去推断出有多少个样本属于随机选取一种方法计算出来的数量与原问题1中随机抽取一个总样本相等的数量与原问题1中随机抽取一个总样本相等的数量之间有着相关关系。
从该角度出发考虑这种相关性,即可以得出如下结果:本题的基本思路与前面两题类似。
从已知条件出发考虑这个问题中不同群体中所占比例之间的相关性:对于某群体内所有个体来说,个体数量都是相同的比例是这样形成的: a.对于随机变量 N; b.每个个体所占比例=群体人数 b+个体人数 c= B; c.群体人数 a=(1- M) b+个体人数c=(1- N) b+个人人数 c=(1- M) c= C; d、 e、 f三种形式均不是随机变量: a.对于该群体中所有个体来说,个体总数与群体总人数之间呈现线性相关关系: b.对于该群体中所有个体来说唯一没有显著线性关系的就是 a。
三、抽样的基本原理抽样的基本原理是将所有变量用等比例形式分组,然后对每个分组进行统计,以发现该分组与总体之间的相互关系,以及分析样本中的差异。
1所示。
抽样方法分为正向抽样法和反向抽样法。
正向抽样是指将所有变量都作为等值统计量进行正比例随机抽样。
抽样技术_第三版_全部课后答案

由题意知:
代入并计算得:
故知:简单随机抽样所需的样本量为61,若预计有效回答率为70%,则样本量最终为87
2.8某地区对本地100家化肥生产企业的尿素产量进行调查,一直去年的总产量为2135吨,抽取10个企业调查今年的产量,得到 ,这些企业去年的平均产量为 。试估计今年该地区化肥总产量。
=1.99%
估计量的标准差为1.99%,比例为9.24%
按比例分配:n=2663
=479, =559, =373, =240, =426, =586
内曼分配:n=2565
=536, =520, =417, =304, =396, =392
5.解:由题意,有
= =75.79
购买冷冻食品的平均支出为75.79元
94.4
2
10
420
0.4976
0.0238
25.5
10710
302.5
3
10
168
0.1991
0.0595
20
3360
355.6
总计
30
844
1
16937.2
= =20.1
V( )= -
=9.7681-0.2962
=9.4719
=3.0777
(2)置信区间为95%相对误差为10%,则有
按比例分配的总量:n= =185.4407 185
20
试估计平均每户家庭订报份数及总的订报份数,以及估计量的方差。
解:由题意得到 , , ,
故 (份)
(份)
(份)
于是由以上的计算结果得到平均每户的订报份数为1.875,估计量方差为0.00391875。该辖区总的订阅份数为7500,估计量方差为62700。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章习题判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y (千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s1706366666206*300500003001500001)()ˆ(222=-=-==s nf N y N v YV 19.413081706366666(==)y v 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±*]即为(,) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为862某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
随机抽取了两百名学生进行调查,得到P=,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。
解析:由已知得:10000=N 200=n 35.0=p 02.0==Nnf又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[,]研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8100181809 110 19 170 10 240 20 120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。
解析:由已知得:200=N 20=n根据表中数据计算得:5.144201201==∑=i i y y()06842.827120120122=--=∑=i iy y s 21808.37)1(1)(2=-=s Nnn y V 10015.6)(=y V ∴ 该小区平均文化支出Y 的95%置信区间为:])(y [2y V zα±即是:[ ,]故估计该小区平均的文化支出Y =,置信水平95%的置信区间为[ ,]。
某地区350个乡为了获得粮食总产量的估计,调查了50个乡当年的粮食产量,得到y =1120(吨),25602=S ,据此估计该地区今年的粮食总产量,并给出置信水平95%的置信区间。
解析:由题意知:y =1120 1429.035050n ===N f 25602=S ⇒160=s 置信水平95%的置信区间为:]1y [2s nfz -±α代入数据得: 置信水平95%的置信区间为:[,]某次关于1000个家庭人均住房面积的调查中,委托方要求绝对误差限为2平方千米,置信水平95%,现根据以前的调查结果,认为总体方差682=S ,是确定简单随机抽样所需的样本量。
若预计有效回答率为70%,则样本量最终为多少?解析:简单随机抽样所需的样本量22222122S Z Nd S NZ n αα+=%7012n n =由题意知:1000=N 2=d 682=S 96.12=αZ代入并计算得:613036.611≈=n87142.87%7012≈==n n故知:简单随机抽样所需的样本量为61,若预计有效回答率为70%,则样本量最终为87某地区对本地100家化肥生产企业的尿素产量进行调查,一直去年的总产量为2135吨,抽取10个企业调查今年的产量,得到25=y ,这些企业去年的平均产量为22=x 。
试估计今年该地区化肥总产量。
解析:由题可知22x =,35.211002135===N X X ,25y =则,该地区化肥产量均值Y 的比率估计量为26.24242535.21===∧x y XY该地区化肥产量总值Y 的比率估计量为 242626.24*100ˆˆ===R Y N Y 所以,今年该地区化肥总产量的估计值为2426吨。
如果在解决习题的问题时可以得到这些家庭月总支出,得到如下表:置信水平95%的置信区间,并比较比估计和简单估计的效率。
解析:由题可知1580130017002300201x n 1x n 1i i =+++==∑=)(5.144y =091.015805.144ˆ=≈===x y r R又329.14615805.144*1600x y y ===XR053.826)(11122=--=∑=n i iy y n S158.3463))((111=---=∑=n i i i xyx x y y n S579.8831)(11122=--=∑=n i i xx x n S故平均文化支出的95%的置信区间为,)ˆˆ2(1[2222x yx R S R S R S n f Z y +---α])ˆˆ2(12222xyx R S R S R S n f Z y +--+α代入数据得(±*)即为[,]某养牛场购进了120头肉牛,购进时平均体重100千克。
现从中抽取10头,记录重量,3个月后再次测量,结果如下:的结果进行比较。
解:由题可知,6.10210595101x n 1x n 1i i =++==∑=)( 163170150101y n 1y n 1i i =+==∑=)(222.2121910*91)(11122==--=∑=n i i y y n S 333.1461317*91))((111==---=∑=n i ii xyx x y y n S 933.1064.926*91)(11122==--=∑=n i ixx x n S故有368.1933.106333.14620===xxy S S β所以总体均值Y 的回归估计量为443.159)6.102100(*368.1163)(0=-+=-+=x X y y lr β 其方差估计为:)2(1)(ˆ02202xyx lr S S S n f y V ββ-+-==)333.146*368.1*2933.106*368.1222.212(101201012-+-=而21y (ˆS nf V -=)=222.212*10120101- =显然)(ˆ)(ˆy V y V lr< 所以,回归估计的结果要优于简单估第三单元习题答案(仅供参考) 1解:(1)不合适 (2)不合适 (3)合适 (4)不合适2.将800名同学平均分成8组,在每一级中抽取一名“幸运星”。
3.根据表中调查数据,经计算,可得下表: h110 2562 10 420 107103 10 168 20 3360 总计30 844 1==V ()=- = ==(2)置信区间为95%相对误差为10%,则有按比例分配的总量:n===n=56,=92,=37按内曼分配:n==175=33,=99,=434.根据调查数据可知:h123456==根据各层层权及抽样比的结果,可得()===%估计量的标准差为%,比例为%按比例分配:n=2663=479,=559,=373,=240,=426,=586内曼分配:n=2565=536,=520,=417,=304,=396,=392 5.解:由题意,有==购买冷冻食品的平均支出为元又由V()=+又n=V()==95%的置信区间为[,]。
7.解:(1)对(2)错(3)错(4)错(5)对8.解:(1)差错率的估计值=70%+30%=估计的方差v()==标准差为S()=。
(2)用事后分层的公式计算差错率为==估计的方差为;v()=-=9.解:(1)所有可能的样本为:第一层第二层3,50,38,156,93,100,68,256,155,103,615,259,15(2)用分别比估计,有=,=,所以用分别比估计可计算得=。
用联合比估计,有=,=,所以用联合比估计可计算得=。
第四章习题4.1邮局欲估计每个家庭的平均订报份数,该辖区共有4000户,划分为400个群各户订报数ij y i y11,2,1,3,3,2,1,4,1,11921,3,2,2,3,1,4,1,1,22032,1,1,1,1,3,2,1,3,11641,1,3,2,1,5,1,2,3,120试估计平均每户家庭订报份数及总的订报份数,以及估计量的方差。
解:由题意得到400=N ,4=n ,10=M ,01.04004===N n f 故875.1410201620191ˆ1=⨯+++===∑=ni i y Mny Y (份)75.18875.110=⨯=⋅=y M y (份) 750040010ˆ=⨯=⋅⋅=y N M Y(份) ∑=--=ni iby yn M s 122)(1∑=---=-=ni ib y yn nM f s nM f y v 1222)(1111)(14)75.1820()75.1819(10401.01222--++-⨯⨯-= 00391875.0=6270000391875.010400)()ˆ(2222=⨯⨯==y v M N Yv 于是由以上的计算结果得到平均每户的订报份数为,估计量方差为。
该辖区总的订阅份数为7500,估计量方差为62700。
4.2 某工业系统准备实行一项改革措施。
该系统共有87个单位,现采用整群抽样,用简单随机抽样抽取15个单位做样本,征求入选单位中每个工人对政(2) 在调查的基础上对方案作了修改,拟再一次征求意见,要求估计比例的允许误差不超过8%,则应抽取多少个单位做样本?解:题目已知87=N ,15=n ,8715==N n f 1)由已知估计同意改革的比例709.0911646ˆ11≈==∑∑==n i ini iMyp733.6011==∑=n i iMnM008687.0)ˆ(1111)ˆ(122=---=∑=ni i iM pyn n f Mpv 此估计量的标准差为9321.0008687.0)ˆ()ˆ(===p v ps4.3 某集团的财务处共有48个抽屉,里面装有各种费用支出的票据。