(完整版)《抽样技术》第四版习题答案

合集下载

抽样技术章节试题及答案

抽样技术章节试题及答案一、选择题1. 抽样调查中，样本容量的确定通常不包括以下哪个因素？A. 总体大小B. 研究目的C. 抽样误差D. 抽样方法答案：D2. 在简单随机抽样中，每个个体被抽中的概率是：A. 相等的B. 不相等的C. 随机的D. 固定的答案：A3. 系统抽样中，抽样间隔的确定不考虑以下哪个因素？A. 总体大小B. 样本容量C. 总体分布D. 抽样误差答案：D二、填空题1. 在分层抽样中，每个层内的样本容量与该层的______成正比。

答案：总体大小2. 抽样调查中，抽样误差的大小与样本容量成______关系。

答案：反比3. 非概率抽样中，最常用的抽样方法是______抽样。

答案：方便三、简答题1. 简述分层抽样的优点。

答案：分层抽样的优点包括：（1）可以提高估计的精度；（2）可以减少抽样误差；（3）可以更有效地利用样本信息。

2. 描述系统抽样的步骤。

答案：系统抽样的步骤包括：（1）确定总体中的个体数；（2）确定样本容量；（3）计算抽样间隔；（4）随机选择起始点；（5）按照抽样间隔依次抽取样本。

四、计算题1. 假设总体中有1000个个体，样本容量为100，使用简单随机抽样方法，计算每个个体被抽中的概率。

答案：每个个体被抽中的概率为100/1000 = 0.1。

2. 如果在一项调查中，样本容量为50，总体中个体数为500，使用系统抽样方法，计算抽样间隔。

答案：抽样间隔为500/50 = 10。

五、论述题1. 论述抽样调查与普查的区别。

答案：抽样调查与普查的主要区别在于：（1）抽样调查只对总体中的一部分个体进行调查，而普查是对总体中的每一个个体都进行调查；（2）抽样调查的成本和时间通常比普查要少；（3）抽样调查的结果可能存在抽样误差，而普查则可以提供更准确的数据；（4）抽样调查可以用于大规模的总体，而普查则在小规模总体中更为常见。

抽样技术课后习题_参考答案_金勇进

第二章习题2.1判断下列抽样方法是否是等概的：（1）总体编号1~64，在0~99中产生随机数r ，若r=0或r>64则舍弃重抽。

（2）总体编号1~64，在0~99中产生随机数r ，r 处以64的余数作为抽中的数，若余数为0则抽中64.（3）总体20000~21000，从1~1000中产生随机数r 。

然后用r+19999作为被抽选的数。

解析：等概抽样属于概率抽样，概率抽样具有一些几个特点：第一，按照一定的概率以随机原则抽取样本。

第二，每个单元被抽中的概率是已知的，或者是可以计算的。

第三，当用样本对总体目标进行估计时，要考虑到该样本被抽中的概率。

因此（1）中只有1~64是可能被抽中的，故不是等概的。

（2）不是等概的【原因】（3）是等概的。

2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同？2.3为了合理调配电力资源，某市欲了解50000户居民的日用电量，从中简单随机抽取了300户进行，现得到其日用电平均值=y 9.5（千瓦时），=2s 206.试估计该市居民用电量的95%置信区间。

如果希望相对误差限不超过10%，则样本量至少应为多少？解：由已知可得，N=50000，n=300，5.9y =，2062=s1706366666206*300500003001500001)()ˆ(222=-=-==s nf N y N v YV 19.413081706366666(==）y v 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为（394035.95，555964.05）由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%，则样本量至少应为8622.4某大学10000名本科生，现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。

[实用参考]《抽样技术》第四版习题答案

第2章2.1解：()1这种抽样方法是等概率的。

在每次抽取样本单元时，尚未被抽中的编号为1～64的这些单元中每一个单元被抽到的概率都是1100。

()2这种抽样方法不是等概率的。

利用这种方法，在每次抽取样本单元时，尚未被抽中的编号为1～35以及编号为64的这36个单元中每个单元的入样概率都是2100，而尚未被抽中的编号为36～63的每个单元的入样概率都是1100。

()3这种抽样方法是等概率的。

在每次抽取样本单元时，尚未被抽中的编号为20PP0～21000中的每个单元的入样概率都是11000，所以这种抽样是等概率的。

2.2解：2.3解：首先估计该市居民日用电量的95%的置信区间。

根据中心极限定理可知，在大样本的条件下，_y E y y -=近似服从标准正态分布，_Y 的195%α-=的区间为y z y z y y αα⎡⎡-+=-+⎣⎣。

而()21f V y S n -=中总体的方差2S是未知的，用样本方差2s 来代替，置信区间为,y y ⎡⎤-+⎢⎥⎣⎦。

由题意知道，_29.5,206y s ==，而且样本量为300,50000n N ==，代入可以求得_21130050000()2060.6825300f v y s n --==⨯=。

将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192⎡⎤⎣⎦。

下一步计算样本量。

绝对误差限d 和相对误差限r 的关系为_d rY =。

根据置信区间的求解方法可知____11P y Y r Y P αα⎫⎪⎧⎫-≤≥-⇒≥-⎨⎬⎩⎭⎪⎭ 根据正态分布的分位数可21α⎫⎪⎪≥-⎬⎪⎪⎭，所以()2_r Y V yz α⎛⎫ ⎪= ⎪⎝⎭。

也就是2_2_222/2211r Y r Y S n z S n N z αα⎤⎛⎫⎥⎛⎫ ⎪⎛⎫⎝⎭ ⎪⎥-=⇒ ⎪ ⎪⎥⎝⎭⎝⎭⎥⎦。

把_29.5,206,10%,50000y s r N ====861.75862≈。

抽样技术课后习题_参考答案_金勇进

第二章习题2.1判断下列抽样方法是否是等概的：（1）总体编号1~64，在0~99中产生随机数r ，若r=0或r>64则舍弃重抽。

（2）总体编号1~64，在0~99中产生随机数r ，r 处以64的余数作为抽中的数，若余数为0则抽中64.（3）总体20000~21000，从1~1000中产生随机数r 。

然后用r+19999作为被抽选的数。

解析：等概抽样属于概率抽样，概率抽样具有一些几个特点：第一，按照一定的概率以随机原则抽取样本。

第二，每个单元被抽中的概率是已知的，或者是可以计算的。

第三，当用样本对总体目标进行估计时，要考虑到该样本被抽中的概率。

因此（1）中只有1~64是可能被抽中的，故不是等概的。

（2）不是等概的【原因】（3）是等概的。

2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同？300户进行，现得到其日用电平均值=y 9.5（千瓦时），=2s 206.试估计该市居民用电量的95%置信区间。

如果希望相对误差限不超过10%，则样本量至少应为多少？解：由已知可得，N=50000，n=300，5.9y =，2062=s 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为（394035.95，555964.05）由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%，则样本量至少应为8622.4某大学10000名本科生，现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。

随机抽取了两百名学生进行调查，得到P=0.35，是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。

解析：由已知得：10000=N 200=n 35.0=p 02.0==Nnf 又有：35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为：])()([2∧∧±P V Z P E α代入数据计算得：该区间为[0.2843，0.4157]2.5研究某小区家庭用于文化方面（报刊、电视、网络、书籍等）的支出，N=200，现抽取一个容量为20的样本，调查结果列于下表：编号文化支出编号文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。

抽样技术试题及答案

抽样技术试题及答案一、选择题（每题2分，共20分）1. 抽样技术中，系统抽样的抽样间隔是固定的。

（）A. 正确B. 错误2. 简单随机抽样的抽样误差与样本容量大小无关。

（）A. 正确B. 错误3. 分层抽样中，各层的样本容量与该层的总体容量成正比。

（）A. 正确B. 错误4. 抽样调查中，样本量越大，抽样误差越小。

（）A. 正确B. 错误5. 抽样框的完整性和代表性是影响抽样误差的重要因素。

（）A. 正确B. 错误6. 在非概率抽样中，样本的代表性无法得到保证。

（）A. 正确B. 错误7. 抽样调查的目的是通过对样本的调查来推断总体的特征。

（）A. 正确B. 错误8. 抽样调查中，样本容量的确定不需要考虑总体的变异程度。

（）A. 正确B. 错误9. 抽样调查中，使用分层抽样可以减少抽样误差。

（）A. 正确B. 错误10. 抽样调查中，样本的代表性是评估抽样质量的关键。

（）A. 正确B. 错误二、简答题（每题5分，共30分）1. 请简述简单随机抽样的优缺点。

2. 描述分层抽样的步骤。

3. 什么是系统抽样？请说明其适用条件。

4. 抽样调查中，如何确定合适的样本容量？5. 请解释什么是抽样误差，并举例说明。

6. 抽样框的不完整性对抽样调查结果有何影响？三、计算题（每题10分，共20分）1. 假设某总体有1000个单位，要求抽样误差不超过5%，置信水平为95%，试计算所需的最小样本容量。

2. 某企业进行员工满意度调查，采用分层抽样，共有员工1000人，其中管理人员100人，技术人员300人，普通员工600人。

若总体满意度为80%，试计算各层的样本容量。

四、案例分析题（每题15分，共15分）1. 某市场研究公司对一个城市的居民进行消费习惯调查，采用简单随机抽样方法，抽取了200个样本。

调查结果显示，有60%的居民倾向于在线购物。

请问，该公司如何利用这次调查结果来推断整个城市居民的在线购物倾向？五、论述题（每题15分，共15分）1. 论述抽样技术在社会调查中的应用及其重要性。

抽样技术课后习题_参考答案_金勇进

第二章习题2.1判断下列抽样方法是否是等概的：（1）总体编号1~64，在0~99中产生随机数r ，若r=0或r>64则舍弃重抽。

（2）总体编号1~64，在0~99中产生随机数r ，r 处以64的余数作为抽中的数，若余数为0则抽中64.（3）总体20000~21000，从1~1000中产生随机数r 。

然后用r+19999作为被抽选的数。

解析：等概抽样属于概率抽样，概率抽样具有一些几个特点：第一，按照一定的概率以随机原则抽取样本。

第二，每个单元被抽中的概率是已知的，或者是可以计算的。

第三，当用样本对总体目标进行估计时，要考虑到该样本被抽中的概率。

因此（1）中只有1~64是可能被抽中的，故不是等概的。

（2）不是等概的【原因】（3）是等概的。

随机抽取了两百名学生进行调查，得到P=0.35，是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。

抽样技术考试及答案

抽样技术考试及答案一、单项选择题（每题2分，共20分）1. 抽样调查中，总体是指（）。

A. 研究对象的全体B. 研究对象的一部分C. 研究对象的样本D. 研究对象的个体答案：A2. 简单随机抽样中，每个个体被抽中的概率是（）。

A. 相等的B. 不相等的C. 随机的D. 固定的答案：A3. 系统抽样中，抽样间隔的确定是（）。

A. 随机的B. 固定的C. 根据样本容量确定D. 根据总体容量确定答案：C4. 分层抽样中，各层的样本容量分配依据是（）。

A. 总体容量B. 各层的个体数C. 各层的变异程度D. 各层的重要性答案：B5. 整群抽样中，抽样的基本单位是（）。

A. 个体B. 群体C. 总体D. 样本答案：B6. 非概率抽样中，最常用的抽样方法是（）。

A. 简单随机抽样B. 系统抽样C. 便利抽样D. 分层抽样答案：C7. 抽样误差是指（）。

A. 抽样过程中产生的误差B. 抽样结果与总体参数之间的差异C. 抽样过程中的随机误差D. 抽样过程中的系统误差答案：B8. 样本容量的确定需要考虑的因素不包括（）。

A. 总体容量B. 抽样误差C. 置信水平D. 抽样方法答案：D9. 样本容量的计算公式中，Z代表的是（）。

A. 置信水平B. 标准差C. 标准误差D. 样本容量答案：C10. 样本容量的计算公式中，E代表的是（）。

A. 置信水平B. 标准差C. 抽样误差D. 样本容量答案：C二、多项选择题（每题3分，共15分）11. 以下哪些是抽样调查的优点？（）A. 经济性B. 灵活性C. 时效性D. 准确性答案：ABC12. 以下哪些是抽样调查的缺点？（）A. 代表性问题B. 抽样误差C. 无法得到总体的精确信息D. 需要专业知识答案：ABCD13. 以下哪些是概率抽样的特点？（）A. 每个个体被抽中的概率是已知的B. 每个个体被抽中的概率是相等的C. 样本的代表性好D. 抽样误差可以计算答案：ABCD14. 以下哪些是系统抽样的步骤？（）A. 确定抽样间隔B. 随机选择起始点C. 按照抽样间隔抽取样本D. 随机分配样本答案：ABC15. 以下哪些是分层抽样的步骤？（）A. 确定分层标准B. 确定各层的样本容量C. 随机抽取各层样本D. 合并各层样本答案：ABCD三、判断题（每题2分，共20分）16. 抽样调查是一种非全面调查方法。

(完整版)抽样技术简答题及答案

抽样技术各类简答题参考答案习题一1.请列举一些你所了解的以及被接受的抽样调查。

略2.抽样调查基础理论及其意义；答：大数定律，中心极限定理，误差分布理论，概率理论。

大数定律是统计抽样调查的数理基础，也给统计学中的大量观察法提供了理论和数学方面的依据；中心极限定理说明，用样本平均值产生的概率来代替从总体中直接抽出来的样本计算的抽取样本的概率，为抽样推断奠定了科学的理论基础；认识抽样误差及其分布的目的是希望所设计的抽样方案所取得的绝大部分的估计量能较好的集中在总体指标的附近，通过计算抽样误差的极限是抽样误差处于被控制的状态；概率论作为数学的一个分支而引进统计学中，是统计学发展史上的重要事件。

3.抽样调查的特点。

答：1）随机抽样；2）以部分推断总体；3）存在抽样误差，但可计算，控制；4）速度快、周期短、精度高、费用低；5）抽样技术灵活多样；6）应用广泛。

4.样本可能数目及其意义；答：样本可能数目是在容量为N 的总体中抽取容量为n 的样本时，所有可能被抽中的不同样本的个数，用A 表示。

意义：正确理解样本可能数目的概念，对于准确理解和把握抽样调查误差的计算，样本统计量的抽样分布、抽样估计的优良标准等一系列理论和方法问题都有十分重要的帮助。

5.影响抽样误差的因素；答：抽样误差是用样本统计量推断总体参数时的误差，它属于一种代表性误差，在抽样调查中抽样误差是不可避免的，但可以计算，并且可以被控制在任意小的范围内；影响抽样误差的因素：1）有样本量大小, 抽样误差通常会随着样本量的大小而增减，在某些情形下，抽样误差与样本量大小的平方根成反比关系；2）所研究现象总体变异程度的大小，一般而言，总体变异程度越大则抽样误差可能越大；3）抽样的方式方法，如放回抽样的误差大于不放回抽样，各种不同的抽样组织方式也常会有不同的抽样误差。

在实际工作中，样本量和抽样方式方法的影响是可以控制的，总体变异程度虽不可以控制，但却可通过设计一些复杂的抽样技术而将其影响加以控制。

《抽样技术》练习题及标准答案

《抽样技术》练习题及答案————————————————————————————————作者：————————————————————————————————日期：习题一1.请列举一些你所了解的以及被接受的抽样调查。

2.抽样调查基础理论及其意义；3.抽样调查的特点。

4.样本可能数目及其意义；5.影响抽样误差的因素；6.某个总体抽取一个n=50的独立同分布样本，样本数据如下：567 601 665 732 366 937 462 619 279 287690 520 502 312 452 562 557 574 350 875834 203 593 980 172 287 753 259 276 876692 371 887 641 399 442 927 442 918 11178 416 405 210 58 797 746 153 644 4761）计算样本均值y与样本方差s2;2）若用y估计总体均值，按数理统计结果，ｙ是否无偏，并写出它的方差表达式；3）根据上述样本数据，如何估计v(y)？4）假定y的分布是近似正态的，试分别给出总体均值μ的置信度为80％，90％，95％，99％的（近似）置信区间。

习题二一判断题1 普查是对总体的所有单元进行调查，而抽样调查仅对总体的部分单元进行调查。

2 概率抽样就是随机抽样，即要求按一定的概率以随机原则抽取样本，同时每个单元被抽中的概率是可以计算出来的。

3 抽样单元与总体单元是一致的。

4 偏倚是由于系统性因素产生的。

5 在没有偏倚的情况下，用样本统计量对目标量进行估计，要求估计量的方差越小越好。

6 偏倚与抽样误差一样都是由于抽样的随机性产生的。

7 偏倚与抽样误差一样都随样本量的增大而减小。

8 抽样单元是构成抽样框的基本要素，抽样单元只包含一个个体。

9 抽样单元可以分级，但在抽样调查中却没有与之相对应的不同级的抽样框。

10 总体目标量与样本统计量有不同的意义，但样本统计量它是样本的函数，是随机变量。

《抽样技术》第四版习题答案

第2章2.1解：()1这种抽样方法是等概率的。

在每次抽取样本单元时，尚未被抽中的编号为1～64的这些单元中每一个单元被抽到的概率都是1 100。

()2这种抽样方法不是等概率的。

()3这种抽样方法是等概率的。

在每次抽取样本单元时，尚未被抽中的编号为20 000～21 000中的每个单元的入样概率都是11000，所以这种抽样是等概率的。

2.2解：2.3 解：首先估计该市居民日用电量的95%的置信区间。

根据中心极限定理可知，在大样本的条件下_y E yy -=近似服从标准正态分布， _Y 的195%α-=的置信区间为2y z y z y y αα⎡⎡-+=-+⎣⎣。

而()21f V y S n-=中总体的方差2S 是未知的，用样本方差2s 来代替，置信区间为,y y ⎡⎤-+⎢⎥⎣⎦。

由题意知道，_29.5,206y s ==，而且样本量为300,50000n N ==，代入可以求得 _21130050000()2060.6825300f v y s n --==⨯=。

将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192⎡⎤⎣⎦。

下一步计算样本量。

绝对误差限d 和相对误差限r的关系为_d rY =。

根据置信区间的求解方法可知____11P y Y r Y P αα⎫⎪⎧⎫-≤≥-⇒≤≥-⎨⎬⎩⎭根据正态分布的分位数可以知道1P Z αα⎫⎪⎪≤≥-⎬⎪⎪⎭，所以()2_r Y V y z α⎛⎫⎪= ⎪⎝⎭。

也就是2_2_222/21111r Y r Y S n N z S n N z αα⎡⎤⎛⎫⎢⎥⎛⎫ ⎪⎛⎫⎝⎭ ⎪⎢⎥-=⇒=+ ⎪ ⎪⎢⎥⎝⎭⎝⎭⎢⎥⎣⎦。

把_29.5,206,10%,50000y s r N ====代入上式可得，861.75862n =≈。

抽样技术课后习题-参考答案-金勇进

抽样技术课后习题-参考答案-金勇进第二章习题2.1判断下列抽样方法是否是等概的：（1）总体编号1~64，在0~99中产生随机数r ，若r=0或r>64则舍弃重抽。

（2）总体编号1~64，在0~99中产生随机数r ，r 处以64的余数作为抽中的数，若余数为0则抽中64.（3）总体20000~21000，从1~1000中产生随机数r 。

然后用r+19999作为被抽选的数。

解析：等概抽样属于概率抽样，概率抽样具有一些几个特点：第一，按照一定的概率以随机原则抽取样本。

第二，每个单元被抽中的概率是已知的，或者是可以计算的。

第三，当用样本对总体目标进行估计时，要考虑到该样本被抽中的概率。

因此（1）中只有1~64是可能被抽中的，故不是等概的。

（2）不是等概的【原因】（3）是等概的。

抽样技术试题及答案

抽样技术试题及答案一、单选题（每题2分，共10分）1. 抽样调查中，样本容量的确定主要取决于（）。

A. 总体数量B. 抽样误差C. 总体的变异程度D. 抽样方法答案：C2. 简单随机抽样的特点不包括（）。

A. 每个样本单位被抽中的概率相同B. 样本容量较小时，代表性较好C. 样本容量较大时，代表性较差D. 抽样误差较小答案：C3. 在分层抽样中，分层的依据是（）。

A. 总体的分布情况B. 总体的数量C. 总体的变异程度D. 总体的地理位置答案：C4. 系统抽样中，抽样间隔的确定主要依据（）。

A. 总体数量B. 样本容量C. 总体的分布情况D. 抽样误差答案：B5. 抽样调查中，样本的代表性是指（）。

A. 样本容量的大小B. 样本的分布情况C. 样本能否代表总体D. 样本的变异程度答案：C二、多选题（每题3分，共15分）1. 抽样调查的优点包括（）。

A. 节省人力物力B. 调查速度快C. 调查结果准确D. 调查结果可靠答案：ABD2. 抽样误差的来源包括（）。

A. 抽样方法B. 抽样框的不完善C. 抽样过程中的随机性D. 样本容量的大小答案：ABCD3. 在抽样调查中，下列哪些因素会影响样本的代表性（）。

A. 抽样方法B. 抽样框的完整性C. 样本容量D. 抽样过程中的随机性答案：ABCD4. 非概率抽样方法包括（）。

A. 简单随机抽样B. 系统抽样C. 便利抽样D. 配额抽样答案：CD5. 抽样调查中，样本容量的确定需要考虑的因素包括（）。

A. 总体的数量B. 总体的变异程度C. 允许的抽样误差D. 置信水平答案：BCD三、判断题（每题1分，共5分）1. 抽样调查是一种非全面调查方法。

（）答案：正确2. 抽样调查的结果可以完全代表总体。

（）答案：错误3. 抽样误差的大小与样本容量成反比。

（）答案：正确4. 系统抽样是一种概率抽样方法。

（）答案：正确5. 抽样框的不完善会导致抽样误差的增加。

（）答案：正确四、简答题（每题5分，共10分）1. 简述分层抽样的步骤。

抽样技术练习题及答案

抽样技术练习题及答案习题一1.请列举一些你所了解的以及被接受的抽样调查。

略2. 抽样调查基础理论及其意义；答：大数定律，中心极限定理，误差分布理论，概率理论。

3.抽样调查的特点。

4.样本可能数目及其意义；答：样本可能数目是在容量为N的总体中抽取容量为n的样本时，所有可能被抽中的不同样本的个数，用A表示。

5. 影响抽样误差的因素；答：抽样误差是用样本统计量推断总体参数时的误差，它属于一种代表性误差，在抽样调查中抽样误差是不可避免的，但可以计算，并且可以被控制在任意小的范围内；影响抽样误差的因素：1)有样本量大小,抽样误差通常会随着样本量的大小而增减，在某些情形下，抽样误差与样本量大小的平方根成反比关系；2)所研究现象总体变异程度的大小，一般而言，总体变异程度越大则抽样误差可能越大；3）抽样的方式方法，如放回抽样的误差大于不放回抽样，各种不同的抽样组织方式也常会有不同的抽样误差。

在实际工作中，样本量和抽样方式方法的影响是可以控制的，总体变异程度虽不可以控制，但却可通过设计一些复杂的抽样技术而将其影响加以控制。

抽样技术练习题及答案word精品

习题一1. 请列举一些你所了解的以及被接受的抽样调查。

2. 抽样调查基础理论及其意义；3. 抽样调查的特点。

4. 样本可能数目及其意义；5. 影响抽样误差的因素；6. 某个总体抽取一个n=50 的独立同分布样本，样本数据如下：567 601 665 732 366 937 462 619 279 287690 520 502 312 452 562 557 574 350 875834 203 593 980 172 287 753 259 276 876692 371 887 641 399 442 927 442 918 11178 416 405 210 58 797 746 153 644 4761）计算样本均值y 与样本方差s2;2）若用y估计总体均值，按数理统计结果，y是否无偏，并写出它的方差表达式；3）根据上述样本数据，如何估计v（y）？4）假定y的分布是近似正态的，试分别给出总体均值卩的置信度为80%, 90%, 95%, 99% 的（近似）置信区间。

习题二一判断题1 普查是对总体的所有单元进行调查，而抽样调查仅对总体的部分单元进行调查。

2 概率抽样就是随机抽样，即要求按一定的概率以随机原则抽取样本，同时每个单元被抽中的概率是可以计算出来的。

3 抽样单元与总体单元是一致的。

4 偏倚是由于系统性因素产生的。

5 在没有偏倚的情况下，用样本统计量对目标量进行估计，要求估计量的方差越小越好。

6 偏倚与抽样误差一样都是由于抽样的随机性产生的。

7 偏倚与抽样误差一样都随样本量的增大而减小。

8 抽样单元是构成抽样框的基本要素，抽样单元只包含一个个体。

9 抽样单元可以分级，但在抽样调查中却没有与之相对应的不同级的抽样框。

10 总体目标量与样本统计量有不同的意义，但样本统计量它是样本的函数，是随机变量。

11 一个抽样设计方案比另一个抽样设计方案好，是因为它的估计量方差小。

12 抽样误差在概率抽样中可以对其进行计量并加以控制，随着样本量的增大抽样误差会越来越小，随着n越来越接近N，抽样误差几乎可以消除。

抽样技术课后习题_参考答案_金勇进

第二章习题2.1判断下列抽样方法是否是等概的：（1）总体编号1~64，在0~99中产生随机数r ，若r=0或r>64则舍弃重抽。

（2）总体编号1~64，在0~99中产生随机数r ，r 处以64的余数作为抽中的数，若余数为0则抽中64.（3）总体20000~21000，从1~1000中产生随机数r 。

然后用r+19999作为被抽选的数。

解析：等概抽样属于概率抽样，概率抽样具有一些几个特点：第一，按照一定的概率以随机原则抽取样本。

第二，每个单元被抽中的概率是已知的，或者是可以计算的。

第三，当用样本对总体目标进行估计时，要考虑到该样本被抽中的概率。

因此（1）中只有1~64是可能被抽中的，故不是等概的。

（2）不是等概的【原因】（3）是等概的。

随机抽取了两百名学生进行调查，得到P=0.35，是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。

抽样技术课后习题-参考答案-金勇进

抽样技术课后习题-参考答案-金勇进第二章习题2.1判断下列抽样方法是否是等概的：（1）总体编号1~64，在0~99中产生随机数r ，若r=0或r>64则舍弃重抽。

（2）总体编号1~64，在0~99中产生随机数r ，r 处以64的余数作为抽中的数，若余数为0则抽中64.（3）总体20000~21000，从1~1000中产生随机数r 。

然后用r+19999作为被抽选的数。

解析：等概抽样属于概率抽样，概率抽样具有一些几个特点：第一，按照一定的概率以随机原则抽取样本。

第二，每个单元被抽中的概率是已知的，或者是可以计算的。

第三，当用样本对总体目标进行估计时，要考虑到该样本被抽中的概率。

因此（1）中只有1~64是可能被抽中的，故不是等概的。

（2）不是等概的【原因】（3）是等概的。

抽样技术课后习题_参考答案_金勇进

第二章习题2.1判断下列抽样方法是否是等概的：（1）总体编号1~64，在0~99中产生随机数r ，若r=0或r>64则舍弃重抽。

（2）总体编号1~64，在0~99中产生随机数r ，r 处以64的余数作为抽中的数，若余数为0则抽中64.（3）总体20000~21000，从1~1000中产生随机数r 。

然后用r+19999作为被抽选的数。

解析：等概抽样属于概率抽样，概率抽样具有一些几个特点：第一，按照一定的概率以随机原则抽取样本。

第二，每个单元被抽中的概率是已知的，或者是可以计算的。

第三，当用样本对总体目标进行估计时，要考虑到该样本被抽中的概率。

因此（1）中只有1~64是可能被抽中的，故不是等概的。

（2）不是等概的【原因】（3）是等概的。

随机抽取了两百名学生进行调查，得到P=0.35，是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。

《抽样技术》习题答案

第2章2.3 解：首先估计该市居民日用电量的95%的置信区间。

根据中心极限定理可知，在大_y E y y -=近似服从标准正态分布， _Y 的195%α-=的置信区间为y z y z y y αα⎡⎡-+=-+⎣⎣。

而()21f V y S n-=中总体的方差2S 是未知的，用样本方差2s 来代替，置信区间为,y y ⎡⎤-+⎢⎥⎣⎦由题意知道，_29.5,206y s ==，而且样本量为300,50000n N ==，代入可以求得_21130050000()2060.6825300f v y s n --==⨯=。

将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192⎡⎤⎣⎦。

下一步计算样本量。

绝对误差限d 和相对误差限r 的关系为_d rY =。

根据置信区间的求解方法可知____11P y Y r Y P αα⎫⎪⎧⎫-≤≥-⇒≤≥-⎨⎬⎩⎭根据正态分布的分位数可以知道1P Z αα⎫⎪⎪≤≥-⎬⎪⎪⎭，所以()2_2r Y V y z α⎛⎫⎪= ⎪⎝⎭。

也就是2_2_222/221111r Y r Y S n N z S n N z αα⎡⎤⎛⎫⎢⎥⎛⎫⎪⎛⎫⎝⎭⎪⎢⎥-=⇒=+ ⎪ ⎪⎢⎥⎝⎭⎝⎭⎢⎥⎣⎦。

把_29.5,206,10%,50000y s r N ====代入上式可得，861.75862n =≈。

所以样本量至少为862。

2.4 解：总体中参加培训班的比例为P ，那么这次简单随机抽样得到的P 的估计值p 的方差()()111f NV p P P n N -=--，在大样本的条件下近似服从标准正态分布。

在本题中，样本量足够大，从而可得P 的195%α-=的置信区间为2p z p z αα⎡-+⎣。

而这里的()V p 是未知的，我们使用它的估计值()()()^5119.652101fV p v p p p n --==-=⨯-。

所以总体比例P 的195%α-=的置信区间可以写为p z p z αα⎡-+⎣，将0.35,200,10000p n N ===代入可得置信区间为0.2844,0.4156⎡⎤⎣⎦。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第2章2.1 解：()1 这种抽样方法是等概率的。

在每次抽取样本单元时，尚未被抽中的编号为1～64的这些单元中每一个单元被抽到的概率都是1100。

()2这种抽样方法不是等概率的。

()3这种抽样方法是等概率的。

在每次抽取样本单元时，尚未被抽中的编号为20 000～21 000中的每个单元的入样概率都是11000，所以这种抽样是等概率的。

2.3 解：首先估计该市居民日用电量的95%的置信区间。

根据中心极限定理可知，在大_y E y y -=近似服从标准正态分布， _Y 的195%α-=的置信区间为2y z y z y y αα⎡⎡-+=-+⎣⎣。

而()21f V y S n-=中总体的方差2S 是未知的，用样本方差2s 来代替，置信区间为,y y ⎡⎤-+⎢⎥⎣⎦。

由题意知道，_29.5,206y s ==，而且样本量为300,50000n N ==，代入可以求得 _21130050000()2060.6825300f v y s n --==⨯=。

将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192⎡⎤⎣⎦。

下一步计算样本量。

绝对误差限d 和相对误差限r 的关系为_d rY =。

也就是2_2_222/221111r Y r Y S n N z S n N z αα⎡⎤⎛⎫⎢⎥⎛⎫⎪⎛⎫⎝⎭⎪⎢⎥-=⇒=+ ⎪ ⎪⎢⎥⎝⎭⎝⎭⎢⎥⎣⎦。

把_29.5,206,10%,50000y s r N ====代入上式可得，861.75862n =≈。

所以样本量至少为862。

在本题中，样本量足够大，从而可得P 的195%α-=的置信区间为2p z p z αα⎡-+⎣。

而这里的()V p 是未知的，我们使用它的估计值()()()^5119.652101fV p v p p p n --==-=⨯-。

所以总体比例P 的195%α-=的置信区间可以写为p z p z αα⎡-+⎣，将0.35,200,10000p n N ===代入可得置信区间为0.2844,0.4156⎡⎤⎣⎦。

2.5 解：利用得到的样本，计算得到样本均值为2890/20144.5y ==，从而估计小区的平均文化支出为144.5元。

总体均值_Y 的195%α-=的置信区间为y z y z αα⎡-+⎣，用()21f v y s n-=来估计样本均值的方差()V y 。

计算得到2826.0256s =，则()2110.1826.025637.17220f v y s n --==⨯=，2 1.9611.95z α==，代入数值后计算可得总体均值的95%的置信区间为[]132.55,156.45。

2.6 解：根据样本信息估计可得每个乡的平均产量为1 120吨，该地区今年的粮食总产量Y 的估计值为_^53503501120 3.9210Y y ==⨯=⨯（吨）。

总体总值估计值的方差为()2^21N f V Y S n -⎛⎫= ⎪⎝⎭，总体总值的195%α-=的置信区间为^^Y z Y z αα⎡-+⎢⎢⎣，把^523.9210,25600,50,350,Y S n N =⨯===, 1.96nf z Nα==代入，可得粮食总产量的195%α-=的置信区间为377629,406371⎡⎤⎣⎦。

2.7 解：首先计算简单随机抽样条件下所需要的样本量，把21000,2,195%,68N d S α==-==带入公式2022/211d n N z S α⎫=+ ⎪⎝⎭，最后可得061.362n =≈。

如果考虑到有效回答率的问题，在有效回答率为70%时，样本量应该最终确定为070%88.5789n n ==≈。

2.8 解：去年的化肥总产量和今年的总产量之间存在较强的相关性，而且这种相关关系较为稳定，所以引入去年的化肥产量作为辅助变量。

于是我们采用比率估计量的形式来估计今年的化肥总产量。

去年化肥总产量为2135X =。

利用去年的化肥总产量，今年的化肥总产量的估计值为_^^_2426.14R y Y R X X x===吨。

2.9 解：本题中，简单估计量的方差的估计值为()21f v y s n-==37.17。

利用比率估计量进行估计时，我们引入了家庭的总支出作为辅助变量，记为X 。

文化支出属于总支出的一部分，这个主要变量与辅助变量之间存在较强的相关关系，而且它们之间的关系是比较稳定的，且全部家庭的总支出是已知的量。

文化支出的比率估计量为_____^_R y y R X X x==，通过计算得到2890/20144.5y ==，而_1580x =，则_^_144.50.09151580yR x ===，文化支出的比率估计量的值为_146.3R y =（元）。

现在考虑比率估计量的方差，在样本量较大的条件下，()()()22212R R x x f V y MSE y S R S S R S nρ-≈≈-⋅+，通过计算可以得到两个变量的样本方差为224826,9.95810xs s ==⨯，Y X 和之间的相关系数的估计值为^0.974ρ=，代入上面的公式，可以得到比率估计量的方差的估计值为_ 1.94R v y ⎛⎫= ⎪⎝⎭。

这个数值比简单估计量的方差估计值要小很多。

全部家庭的平均文化支出的195%α-=的置信区间为R R R R y z y z y y αα⎡⎡-+=-+⎣⎣，把具体的数值代入可得置信区间为[]143.57,149.03。

接下来比较比估计和简单估计的效率，()()__ 1.940.05237.17R R V y v y V y v y ⎛⎫⎛⎫ ⎪ ⎪⎝⎭⎝⎭≈==，这是比估计的设计效应值，从这里可以看出比估计量比简单估计量的效率更高。

2.10 解：利用简单估计量可得1630/10163i y y n ===∑，样本方差为2212.222s =，120N =，样本均值的方差估计值为()21110/120212.22219.453710f v y s n --==⨯=。

利用回归估计的方法，在这里选取肉牛的原重量为辅助变量。

选择原重量为辅助变量是合理的，因为肉牛的原重量在很大程度上影响着肉牛的现在的重量，二者之间存在较强的相关性，相关系数的估计值为^0.971ρ=，而且这种相关关系是稳定的，这里肉牛的原重量的数值已经得到，所以选择肉牛的原重量为辅助变量。

回归估计量的精度最高的回归系数β的估计值为^^14.5680.971 1.36810.341x s s βρ==⨯=。

现在可以得到肉牛现重量的回归估计量为___^lr y y X x β⎛⎫=+- ⎪⎝⎭，代入数值可以得到_159.44lr y =。

回归估计量_lr y 的方差为()__2211lr lr f V y MSE y S n ρ-⎛⎫⎛⎫≈≈- ⎪ ⎪⎝⎭⎝⎭，方差的估计值为2_^211lr f v y s n ρ⎛⎫-⎛⎫=- ⎪ ⎪⎝⎭⎝⎭，代入相应的数值，2_^211 1.112lr f v y s n ρ⎛⎫-⎛⎫=-= ⎪ ⎪⎝⎭⎝⎭，显然有()_lr v y v y ⎛⎫< ⎪⎝⎭。

在本题中，因为存在肉牛原重量这个较好的辅助变量，所以回归估计量的精度要好于简单估计量。

第3章3.1 解：在分层随机抽样中，层标志的选择很重要。

划分层的指标应该与抽样调查中最关心的调查变量存在较强的相关性，而且把总体划分为几个层之后，层应该满足：层内之间的差异尽可能小，层间差异尽可能大。

这样才能使得最后获得的样本有很好的代表性。

对几种分层方法的判断如下：(1)选择性别作为分层变量，是不合适的。

首先，性别这个变量与研究最关心的变量(不同职务，职称的人对分配制度改革的态度)没有很大的相关性；其次，用性别作为分层变量后，层内之间的差异仍然很大，相反，层之间的差异不是很大，因为男性和女性各自内部的职务，职称也存在很大的差别；最后，选择性别作为分层变量后，需要首先得到男性和女性的抽样框，这样会更加麻烦，也会使抽样会变得更加复杂。

(2)按照教师、行政管理人员和职工进行分层，是合适的。

这种分层的指标与抽样调查研究中最关心的变量高度相关，而且按照这种方法分层后，可以看出层内对于分配制度改革的态度差异比较小，因为他们属于相同的阶层，而层之间的态度的差异是比较大的。

这样选取出来的样本具有很好的代表性。

(3)按照职称（正高、副高、中级、初级和其他）分层，也是合理的。

理由与（2）相同，这样进行分层的变量选择与调查最关心的变量是高度相关的，分层后的层满足分层的要求。

所以，按照职称进行分层是合理的。

(4)按照部门进行分层，是合理的。

因为学校有很多院、系或者所，直接进行简单随机抽样，有可能样本不能很好地代表各个院系，最关心的变量与部门也存在一定的相关性。

这样分层后，每个层的总体数目和抽取的样本量都较小，最终的样本的分布比较均匀，比简单随机抽样更加方便实施。

3.2 解：设计的方案如下：第一种方案：可以按照不同的专业进行分层，但是考虑到如果在每层都抽取，不能保证每个新生的入样概率相等，因为每个专业的人数比例未知，8个人的样本量无法在每个层之间进行分配。

所以采取如下方法：对所有的新生按照专业的先后顺序进行编号，使得每个专业的人的编号在一起，然后随机选取出一个号码，然后选取出这个号码所在的专业，选取出这个专业，再在这个专业的所有新生中按照简单随机抽样的方法选取出8个人。

这样就可以保证每个人入选的概率是相等的。

第二种方案：也可以按照性别进行分类，对他们进行编号，为1～800，使得男生的编号都在一起，女生的编号也都在一起，然后随机选取出一个号码，然后看这个号码所对应的性别，然后从这个性别的所有人中按照简单随机抽样的方法选取出8个新生。

这样就可以保证所有的新生的入样概率是相同的。

第三种方案：随机地把所有的人分成8组，而且使得每组的人都是100个人，这样分组完成后，每个组的新生进行编号为1～100，然后随机抽取出一个号码，再从所有的小组中抽取出号码所对应的新生，从而抽取出8个人。