中国人民大学题库答案详解-抽样技术
抽样技术课后习题答案

12
160
1700
3
170
2000
13
180
2000
4
150
1500
14
130
1400
5
160
1700
15
150
1600
6
130
1400
16
100
1200
7
140
1500
17
180
1900
8
100
1200
18
100
1100
9
110
1200
19
170
1800
10
140
1500
20
120
1300
20
试估计平均每户家庭订报份数及总的订报份数,以及估计量的方差。
解:由题意得到 , , ,
故 (份)
(份)
(份)
于是由以上的计算结果得到平均每户的订报份数为1.875,估计量方差为0.00391875。该辖区总的订阅份数为7500,估计量方差为62700。
4.2
某工业系统准备实行一项改革措施。该系统共有87个单位,现采用整群抽样,用简单随机抽样抽取15个单位做样本,征求入选单位中每个工人对政策改革措施的意见,结果如下:
1
42
6.2
11
60
6.3
2
51
5.8
12
52
6.7
3
49
6.7
13
61
5.9
4
55
4.9
14
49
6.1
5
47
5.2
15
57
6.0
《抽样技术》习题答案(答案参考)

第2章项目相同之处不同之处定义都是根据从一个总体中抽样得到的样本,然后定义样本均值为_11ni i y y n ==∑。
抽样理论中样本是从有限总体中按放回的抽样方法得到的,样本中的样本点不会重复;而数理统计中的样本是从无限总体中利用有放回的抽样方法得到的,样本点有可能是重复的。
性质(1) 样本均值的期望都等于总体均值,也就是抽样理论和数理统计中的样本均值都是无偏估计。
(2) 不论总体原来是何种分布,在样本量足够大的条件下,样本均值近似服从正态分布。
(1) 抽样理论中,各个样本之间是不独立的;而数理统计中的各个样本之间是相互独立的。
(2) 抽样理论中的样本均值的方差为()21f V y S n -=,其中2_211i S Y Y N ⎛⎫=- ⎪-⎝⎭∑。
在数理统计中,()21V y nσ=,其中2σ为总体的方差。
2.3 解:首先估计该市居民日用电量的95%的置信区间。
根据中心极限定理可知,在大样本的条件下,()()_y E y y V y V y -=近似服从标准正态分布, _Y 的195%α-=的置信区间为()()()(), 1.96, 1.96y z V y y z V y y V y y V y αα⎡⎡-+=-+⎣⎣。
而()21f V y S n-=中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间为111.96, 1.96f fy s y s n n ⎡⎤---+⎢⎥⎣⎦由题意知道,_29.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得_21130050000()2060.6825300f v y s n --==⨯=。
将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192⎡⎤⎣⎦。
下一步计算样本量。
绝对误差限d 和相对误差限r 的关系为_d rY =。
根据置信区间的求解方法可知()()______11y Y P y Y r Y P V y V y αα⎧⎫-⎪⎪⎧⎫⎪-≤≥-⇒≤≥-⎨⎬⎨⎩⎭⎪⎪根据正态分布的分位数可以知道()__1y Y P Z V y αα⎫-⎪⎪≤≥-⎬⎪⎪⎭,所以()2_2r Y V y z α⎛⎫⎪= ⎪⎝⎭。
《抽样技术》第四版习题答案

第2章2.1 解:()1 这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是1100。
()2这种抽样方法不是等概率的。
利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是2100,而尚未被抽中的编号为36~63的每个单元的入样概率都是1100。
()3这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是11000,所以这种抽样是等概率的。
2.3 解:首先估计该市居民日用电量的95%的置信区间。
根据中心极限定理可知,在大_y E y y -=近似服从标准正态分布, _Y 的195%α-=的置信区间为y z y z y y αα⎡⎡-+=-+⎣⎣。
而()21f V y S n-=中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间为,y y ⎡⎤-+⎢⎥⎣⎦。
由题意知道,_29.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得 _21130050000()2060.6825300f v y s n --==⨯=。
将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192⎡⎤⎣⎦。
下一步计算样本量。
绝对误差限d 和相对误差限r 的关系为_d rY =。
根据置信区间的求解方法可知____11P y Y r Y P αα⎫⎪⎧⎫-≤≥-⇒≤≥-⎨⎬⎩⎭根据正态分布的分位数可以知道1P Z αα⎫⎪⎪≤≥-⎬⎪⎪⎭,所以()2_2rY V y z α⎛⎫⎪= ⎪⎝⎭。
也就是2_2_222/221111r Y r Y S n N z S n N z αα⎡⎤⎛⎫⎢⎥⎛⎫⎪⎛⎫⎝⎭⎪⎢⎥-=⇒=+ ⎪ ⎪⎢⎥⎝⎭⎝⎭⎢⎥⎣⎦。
把_29.5,206,10%,50000y s r N ====代入上式可得,861.75862n =≈。
抽样技术简答题及答案

抽样技术各类简答题参考答案习题一1. 请列举一些你所了解的以及被接受的抽样调查。
略2. 抽样调查基础理论及其意义;答:大数定律,中心极限定理,误差分布理论,概率理论。
大数定律是统计抽样调查的数理基础,也给统计学屮的大量观察法提供了理论和数学方面的依据;屮心极限定理说明,用样本平均值产生的概率来代替从总体中直接抽出来的样本计算的抽取样本的概率,为抽样推断奠定了科学的理论基础;认识抽样误差及其分布的目的是希望所设计的抽样方案所取得的绝大部分的估计量能较好的集屮在总体指标的附近,通过计算抽样误差的极限是抽样误差处于被控制的状态;概率论作为数学的一个分支而引进统计学屮,是统计学发展史上的重要事件。
3. 抽样调查的特点。
答:1)随机抽样;2)以部分推断总体;3)存在抽样误差,但可计算,控制;4)速度快、周期短、精度高、费用低;5)抽样技术灵活多样;6)应用广泛。
4. 样本可能数目及其意义;答:样本可能数目是在容量为N的总体屮抽取容量为n的样本时,所有可能被抽中的不同样本的个数,用A 表示。
意义:正确理解样本可能数目的概念,对于准确理解和把握抽样调查误差的计算,样本统计量的抽样分布、抽样估计的优良标准等一系列理论和方法问题都有十分重要的帮助。
5. 影响抽样误差的因素;答:抽样误差是用样本统计量推断总体参数时的误差,它属于一・种代表性误差,在抽样调查中抽样误差是不可避免的,但可以计算,并且可以被控制在任意小的范围内;影响抽样误差的因素:1)有样本量大小,抽样误差通常会随着样本量的大小而增减,在某些情形下,抽样误差与样本量大小的平方根成反比关系;2)所研究现象总体变异程度的大小,一般而言,总体变异程度越大则抽样误差可能越大;3)抽样的方式方法,如放回抽样的误差大于不放回抽样,各种不同的抽样组织方式也常会有不同的抽样误差。
在实际工作屮,样本量和抽样方式方法的影响是可以控制的,总体变异程度虽不可以控制,但却可通过设计一些复杂的抽样技术而将其影响加以控制。
抽样技术简答题及答案

抽样技术各类简答题参考答案习题一1.请列举一些你所了解的以及被接受的抽样调查。
略2. 抽样调查基础理论及其意义;答:大数定律,中心极限定理,误差分布理论,概率理论。
大数定律是统计抽样调查的数理基础,也给统计学中的大量观察法提供了理论和数学方面的依据;中心极限定理说明,用样本平均值产生的概率来代替从总体中直接抽出来的样本计算的抽取样本的概率,为抽样推断奠定了科学的理论基础;认识抽样误差及其分布的目的是希望所设计的抽样方案所取得的绝大部分的估计量能较好的集中在总体指标的附近,通过计算抽样误差的极限是抽样误差处于被控制的状态;概率论作为数学的一个分支而引进统计学中,是统计学发展史上的重要事件。
3.抽样调查的特点。
答:1)随机抽样;2)以部分推断总体;3)存在抽样误差,但可计算,控制;4)速度快、周期短、精度高、费用低;5)抽样技术灵活多样;6)应用广泛。
4.样本可能数目及其意义;答:样本可能数目是在容量为N的总体中抽取容量为n的样本时,所有可能被抽中的不同样本的个数,用A表示。
意义:正确理解样本可能数目的概念,对于准确理解和把握抽样调查误差的计算,样本统计量的抽样分布、抽样估计的优良标准等一系列理论和方法问题都有十分重要的帮助。
5. 影响抽样误差的因素;答:抽样误差是用样本统计量推断总体参数时的误差,它属于一种代表性误差,在抽样调查中抽样误差是不可避免的,但可以计算,并且可以被控制在任意小的范围内;影响抽样误差的因素:1)有样本量大小,抽样误差通常会随着样本量的大小而增减,在某些情形下,抽样误差与样本量大小的平方根成反比关系;2)所研究现象总体变异程度的大小,一般而言,总体变异程度越大则抽样误差可能越大;3)抽样的方式方法,如放回抽样的误差大于不放回抽样,各种不同的抽样组织方式也常会有不同的抽样误差。
在实际工作中,样本量和抽样方式方法的影响是可以控制的,总体变异程度虽不可以控制,但却可通过设计一些复杂的抽样技术而将其影响加以控制。
抽样技术期末试题及答案

抽样技术期末试题及答案1. 选择题1.1. 在随机抽样中,下列哪种方法可以保证每个个体都有被选中的机会?A. 简单随机抽样B. 系统抽样C. 分层抽样D. 整群抽样答案:A. 简单随机抽样1.2. 下列哪种抽样方法适用于对城市中不同居住区的居民进行调查?A. 简单随机抽样B. 道路抽样C. 有限总体抽样D. 群集抽样答案:B. 道路抽样1.3. 在抽样调查中,误差来源主要包括以下几个方面,下列哪个不是?A. 非抽样误差B. 抽样误差C. 召回误差D. 地区误差答案:C. 召回误差2. 判断题2.1. 分层抽样是按照抽样单元的层次结构进行抽样的方法。
(×)错误2.2. 构成总体的个体是抽样的单位。
(√)正确2.3. 方便抽样是一种常用的抽样方法,可以得到客观有效的数据。
(×)错误3. 简答题3.1. 请简要解释什么是整群抽样,并说明适用的情况。
整群抽样是在调查研究中,将总体划分为若干个不相交的群组,再从中随机选取一部分群组作为样本,对所选群组中的所有个体进行调查和观察的方法。
适用情况:适用于总体中的个体具有较大的相似性,并能够通过群组进行划分的情况。
例如,在调查某个城市的居民满意度时,可以将城市的街道或社区作为群组,通过整群抽样来获取样本。
3.2. 简要介绍一种非概率抽样方法,并讨论其优缺点。
一种非概率抽样方法是方便抽样。
方便抽样是在调查过程中,选择离调查者最为便利的、容易获取的个体作为样本。
优点:方便抽样方法简单、快速,可以节省调查时间和成本。
适用于在研究设计初期或资源有限的情况下进行初步探索和观察。
缺点:方便抽样容易导致抽样偏差,样本的代表性较差,结果可能不具有普遍适用性。
调查者的主观意愿会对样本选择产生较大的影响,结果可能存在较大的偏差和误差。
4. 计算题4.1. 一个城市有5个区,每个区的居民数分别为1000、1500、2000、1200和1800人。
如果采用分层随机抽样方法,每个区的抽样比例分别为0.2、0.3、0.1、0.25和0.15,求总体的抽样比例。
抽样技术期末考试试题及答案

抽样技术期末考试试题及答案一、选择题(每题2分,共20分)1. 抽样调查中,样本容量的大小与抽样误差之间的关系是:A. 正相关B. 负相关C. 无关D. 有时正相关,有时负相关答案:B2. 以下哪种抽样方法属于概率抽样?A. 方便抽样B. 系统抽样C. 雪球抽样D. 判断抽样答案:B3. 在分层抽样中,各层的样本容量分配原则是:A. 各层样本容量相等B. 各层样本容量与总体容量成比例C. 各层样本容量与层内变异程度成反比D. 各层样本容量与层内变异程度成正比答案:D4. 以下哪种情况适合使用整群抽样?A. 总体单位分布均匀B. 总体单位分布不均匀C. 总体单位之间相互独立D. 总体单位之间存在明显的关联性答案:B5. 抽样调查中,如果样本容量增加,抽样误差将:A. 增加B. 减少C. 不变D. 先增加后减少答案:B6. 以下哪项不是抽样调查的优点?A. 节省时间和成本B. 可以对整个总体进行研究C. 可以估计总体参数D. 可以控制抽样误差答案:B7. 随机抽样的基本原则是:A. 抽样单位的选取具有随机性B. 抽样单位的选取具有系统性C. 抽样单位的选取具有主观性D. 抽样单位的选取具有代表性答案:A8. 在简单随机抽样中,每个单位被抽中的概率是:A. 不确定的B. 相等的C. 与总体大小成反比D. 与总体大小成正比答案:B9. 抽样调查中,样本的代表性是指:A. 样本能够代表总体B. 样本大小C. 样本的误差D. 样本的抽样方法答案:A10. 以下哪种抽样方法属于非概率抽样?A. 系统抽样B. 分层抽样C. 方差抽样D. 判断抽样答案:D二、简答题(每题10分,共20分)1. 简述分层抽样的优缺点。
答案:分层抽样的优点包括:(1)可以提高样本的代表性;(2)可以减少抽样误差;(3)可以对不同层进行单独分析。
分层抽样的缺点包括:(1)分层标准的选择可能存在主观性;(2)分层后各层的样本容量分配需要精心设计;(3)如果分层不准确,可能会增加抽样误差。
《抽样技术》第四版习题答案

第2章2.1解:()1这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是1 100。
()2这种抽样方法不是等概率的。
利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是2100,而尚未被抽中的编号为36~63的每个单元的入样概率都是1 100。
()3这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是11000,所以这种抽样是等概率的。
2.2解:2.3 解:首先估计该市居民日用电量的95%的置信区间。
根据中心极限定理可知,在大样本的条件下_y E yy -=近似服从标准正态分布, _Y 的195%α-=的置信区间为2y z y z y y αα⎡⎡-+=-+⎣⎣。
而()21f V y S n-=中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间为,y y ⎡⎤-+⎢⎥⎣⎦。
由题意知道,_29.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得 _21130050000()2060.6825300f v y s n --==⨯=。
将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192⎡⎤⎣⎦。
下一步计算样本量。
绝对误差限d 和相对误差限r的关系为_d rY =。
根据置信区间的求解方法可知____11P y Y r Y P αα⎫⎪⎧⎫-≤≥-⇒≤≥-⎨⎬⎩⎭根据正态分布的分位数可以知道1P Z αα⎫⎪⎪≤≥-⎬⎪⎪⎭,所以()2_r Y V y z α⎛⎫⎪= ⎪⎝⎭。
也就是2_2_222/21111r Y r Y S n N z S n N z αα⎡⎤⎛⎫⎢⎥⎛⎫ ⎪⎛⎫⎝⎭ ⎪⎢⎥-=⇒=+ ⎪ ⎪⎢⎥⎝⎭⎝⎭⎢⎥⎣⎦。
把_29.5,206,10%,50000y s r N ====代入上式可得,861.75862n =≈。
《抽样技术》练习题及标准答案

《抽样技术》练习题及答案————————————————————————————————作者:————————————————————————————————日期:习题一1.请列举一些你所了解的以及被接受的抽样调查。
2.抽样调查基础理论及其意义;3.抽样调查的特点。
4.样本可能数目及其意义;5.影响抽样误差的因素;6.某个总体抽取一个n=50的独立同分布样本,样本数据如下:567 601 665 732 366 937 462 619 279 287690 520 502 312 452 562 557 574 350 875834 203 593 980 172 287 753 259 276 876692 371 887 641 399 442 927 442 918 11178 416 405 210 58 797 746 153 644 4761)计算样本均值y与样本方差s2;2)若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式;3)根据上述样本数据,如何估计v(y)?4)假定y的分布是近似正态的,试分别给出总体均值μ的置信度为80%,90%,95%,99%的(近似)置信区间。
习题二一判断题1 普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。
2 概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。
3 抽样单元与总体单元是一致的。
4 偏倚是由于系统性因素产生的。
5 在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。
6 偏倚与抽样误差一样都是由于抽样的随机性产生的。
7 偏倚与抽样误差一样都随样本量的增大而减小。
8 抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。
9 抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。
10 总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。
《抽样技术》第四版习题答案

第2章2.1解:()1这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是1 100。
()2这种抽样方法不是等概率的。
利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是2100,而尚未被抽中的编号为36~63的每个单元的入样概率都是1 100。
()3这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是11000,所以这种抽样是等概率的。
2.2解:2.3 解:首先估计该市居民日用电量的95%的置信区间。
根据中心极限定理可知,在大样本的条件下_y E yy -=近似服从标准正态分布, _Y 的195%α-=的置信区间为2y z y z y y αα⎡⎡-+=-+⎣⎣。
而()21f V y S n-=中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间为,y y ⎡⎤-+⎢⎥⎣⎦。
由题意知道,_29.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得 _21130050000()2060.6825300f v y s n --==⨯=。
将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192⎡⎤⎣⎦。
下一步计算样本量。
绝对误差限d 和相对误差限r的关系为_d rY =。
根据置信区间的求解方法可知____11P y Y r Y P αα⎫⎪⎧⎫-≤≥-⇒≤≥-⎨⎬⎩⎭根据正态分布的分位数可以知道1P Z αα⎫⎪⎪≤≥-⎬⎪⎪⎭,所以()2_r Y V y z α⎛⎫⎪= ⎪⎝⎭。
也就是2_2_222/21111r Y r Y S n N z S n N z αα⎡⎤⎛⎫⎢⎥⎛⎫ ⎪⎛⎫⎝⎭ ⎪⎢⎥-=⇒=+ ⎪ ⎪⎢⎥⎝⎭⎝⎭⎢⎥⎣⎦。
把_29.5,206,10%,50000y s r N ====代入上式可得,861.75862n =≈。
抽样技术课后习题答案

抽样技术课后习题答案第⼆章习题2.1判断下列抽样⽅法是否是等概的:(1)总体编号1~64,在0~99中产⽣随机数r ,若0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产⽣随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产⽣随机数r 。
然后⽤19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有⼀些⼏个特点:第⼀,按照⼀定的概率以随机原则抽取样本。
第⼆,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当⽤样本对总体⽬标进⾏估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?解析:抽样理论和数理统计中关于样本均值的定义和性质的不同抽样理论概率统计定义 ∑==ni i y n y 11∑==ni iy n y 11性质1.期望()()()()Y C P E NN C N C ===∑∑==n n1i n i 1i i i 1y y y2.⽅差()()()[]()iiP y E y y V n N21∑=-==()()[]n NC i iiC y E y n N121∑=- ()21S nf -=1.期望()??=∑=n i i y n E y E 11()∑==ni y E 1i n 1[]µµ==n n12.⽅差()[]2µ-=i y E y V211-=∑=n i i y n E µ()ny n 122i σµ=-=E2.3为了合理调配电⼒资源,某市欲了解50000户居民的⽇⽤电量,从中简单随机抽取了300户进⾏,现得到其⽇⽤电平均值=y 9.5(千⽡时),=2s 206.试估计该市居民⽤电量的95%置信区间。
大学《抽样技术》期末考试卷(附详细答案)

抽样技术试题期末考试卷一.选择题(每小题3分,共45分)1.概率抽样中的基本抽样方法不包括( C )A 、简单随机抽样B 、分层抽样C 、定额抽样D 、整群抽样2.下列属于总体参数的是( B )A 、)y y (ˆn21+++=L y n N Y B 、)(121N Y Y Y NY +++=LC 、)(n1ˆ21ny y y P +++=L D 、∑∑===ni ini i x y R 11/ˆ3.抽样框的具体表现形式不包括( B )A 、区域框B 、初级框C 、自然框D 、名录框4.估计量方差是( B )A 、指按照某一抽样方案反复进行抽样,估计值的数学期望与待估参数之间的离差。
B 、用样本统计量对总体参数进行估计时产生的误差。
C 、由于抽取样本的随机性造成的样本值与总体值之间的差异。
D 、由其他多种原因引起的估计值与总体参数之间的差异。
5.下列选项属于抽样误差的是( C )A.调查误差B.不完整的抽样框引起的误差C.抽取样本的随机性造成的误差D.不回答误差6. 在简单随机抽样过程中,某一个个体被抽到的可能性( C )A 、与第几次抽样有关,第一次被抽到的概率最大B 、与第几次抽样有关,第一次被抽到的概率最小C 、与第几次抽样无关,每一次被抽到的概率一样D 、与第几次抽样无关,与抽取的样本数有关7.下面的表达式中错误的是( D )A 、∑=1h fB 、∑=n n hC 、∑=1h WD 、∑=1h N8. 下面哪种样本量分配方式属于比例分配?( A )A.NnN n h h = B.hLh hhh hh h c S Nc S N n n ∑==1C.∑==L h h h h h h S N S N n n 1D.∑==L h hh h h h S W SW nn 19.某学校有男、女学生各500名。
为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是( D )A .抽签法B .随机数法C .系统抽样法D .分层抽样法10.层权是( B )A 各层样本单元数与总体单元数之比B 各层单元数与总体单元数之比C 各层样本单元数与总体单元数之和D 各层单元数与总体单元数之和11.以下关于参数比率估计的公式中正确的是( A )A xy R=ˆ B Y xy Y R=ˆ C )ˆ(ˆ)ˆ(ˆRR Y V N Y V = D Y xy Y R=ˆ12.关于群内相关系数的公式,以下说法正确的是( D )A 当群内方差2w S 与总体方差2S 相等时,ρ=1B 当群内各个次级单元的指标值都相等时,即2w S =0,ρ达到最小值0C 当群内方差2w S >总体方差2S 时,ρ取正值D 当群间方差2b S =0时,ρ达到最小值11--M13.群内相关系数ρ取值范围( C )A. [ -1/(M-1) , M]B. [ -1/M , 1] B. [ -1/(M-1) , 1] D. [ 1/(M-1) , 1]14.PPS 抽样是( B )。
最新《抽样技术》第四版习题答案

2.1解:(1)这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为1〜64的这些单元中每一个单元被抽到的概率都是一二0100(2)这种抽样方法不是等概率的。
利用这种方法,在每次抽取样本单元时,尚未被抽中2的编号为1〜35以及编号为64的这36个单元中每个单元的入样概率都是二,而尚未被 100抽中的编号为36〜63的每个单元的入样概率都是」匚,100(3)这种抽样方法是等概率的,在每次抽取样本单元时,尚未被抽中的编号为20 000〜21 000中的每个单元的入样概率都是一L,所以这种抽样是等概率的。
1 0002.3解:首先估计该市居民日用电量的95%的置信区间,根据中心极限定理可知,在大样本的条件下,二=三里!近似服从标准正态分布,『的1-。
=95%的置信区间为[了一2弟27^,? +4任7^]=[》- 1967^,9 + l-967v(y)" o而卜(方=?52中总体的方差T 是未知的,用样本方差『来代替,置信区间由题意知道,y = 95/=206,而且样本量为〃 = 300,N = 50 000,代入可以求得== 1()。
、()。
乂206 = 0682 5。
将它们代入上面的式子可得该市居民 n 300日用电量的95%置信区间为[7.880 8,11.119 2] °下一步计•算样本量。
绝对误差限4和相对误差限r 的关系为“=〃丫。
把 y = 9.5,s2 = 206/ = 10%,N = 50 000代入上式可得,n = 861.75 ^862 o 所以样 本量至少为86202.4 解:总体中参加培训班的比例为P ,那么这次简单随机抽样得到的P 的估计值p尸。
一夕),利用中心极限定理可得 L 在大样本的条件下近 似服从标准正态分布。
在本题中,样本量足够大,从而可得P 的1-2 = 95%的置信区间为 P 一Z R 2/ ( P),P + Z R 2 W ( P)]。
中国人民大学题库问题详解-抽样技术

中国人民大学同等学力申请硕士学位课程考试试题课程代码:123105 课程名称:抽样技术与方法试题卷号: 1名词解释非概率抽样非概率抽样又称为非随机抽样,是调查者根据自己的方便或主观判断抽取样本的方法,其最主要的特征是抽取样本时并不依据随机原则。
包含有判断选样、方便抽样、自愿样本、配额抽样等。
最优分配在分层随机抽样中,对于给定的费用,使估计量的方差V(y_st)达到最小,或者对于给定的估计量方差V,使总费用达到最小的各层样本量的分配,称为最优分配。
PPS抽样是有放回的按规模大小成比例的概率抽样。
其抽选样本的方法有代码法、拉希里方法等。
PPS 抽样是按概率比例抽样,属于概率抽样中的一种。
是指在多阶段抽样中,尤其是二阶段抽样中,初级抽样单位被抽中的机率取决于其初级抽样单位的规模大小,初级抽样单位规模越大,被抽中的机会就越大,初级抽样单位规模越小,被抽中的机率就越小。
就是将总体按一种准确的标准划分出容量不等的具有相同标志的单位在总体中不同比率分配的样本量进行的抽样。
自加权样本指调查中每个样本单元的设计权数是相同的,也就是说每个单元最终入样的概率是相等的。
在不考虑非抽样误差的情况下,可以认为自加权样本完全代表总体,因为每个样本单元都代表了总体中相同数目的单元。
(此时可以使用标准统计方法来进行点估计。
此外,自加权样本往往方差较小,样本统计量更稳健)简述题有人认为“抽样调查除了调查误差以外,还有抽样误差,因此抽样调查不如全面调查准确”,请对此加以评价。
一项调查的误差来自多个方面,抽样调查因为只调查总体中的一小部分,用部分的调查结果推断总体,所以存在着抽样误差,但这只是所有误差中的一部分。
对于抽样调查,误差包括抽样误差和非抽样误差。
有些情况下,全面调查由于参与的人员众多、涉及围大,因此虽然没有抽样误差,但在数据采集和数据汇总整理的过程中却有产生其他误差的更大可能性,所以调查规模并不是越大越好。
与全面调查相比,抽样调查的工作量小,这就为使用素质较高的工作人员并对他们进行深入的培训创造了条件。
抽样技术课后习题答案

该市居民用电量的95%置信区间为
[ =[475000±1.96*41308.19]
即为(394035.95,555964.05)
由相对误差公式 ≤10%
可得
即n≥862
欲使相对误差限不超过10%,则样本量至少应为862
2.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。
因此(1)中只有1~64是可能被抽中的,故不是等概的。(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值 的定义和性质有哪些不同?
解析:抽样理论和数理统计中关于样本均值的定义和性质的不同
抽样理论
概率统计
定义
性质
1.期望
2.方差
1.期望
2.方差
2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值 9.5(千瓦时), 206.试估计该市居民用电量的95%置信区间。如果希望相对误差限不超过10%,则样本量至少应为多少?
20
试估计平均每户家庭订报份数及总的订报份数,以及估计量的方差。
解:由题意得到 , , ,
故 (份)
(份)
(份)
于是由以上的计算结果得到平均每户的订报份数为1.875,估计量方差为0.00391875。该辖区总的订阅份数为7500,估计量方差为62700。
4.2
某工业系统准备实行一项改革措施。该系统共有87个单位,现采用整群抽样,用简单随机抽样抽取15个单位做样本,征求入选单位中每个工人对政策改革措施的意见,结果如下:
抽样技术A卷答案

抽样技术A 卷答案一、单项选择题(本大题共5道小题,每题2分,共10分) 下列各题A)、B )、C )、D )四个选项中,只有一个选项是正确的。
1.下面四个关系式中哪一个是正确的?(A )A.()()()2MSE x V x B E x =+B.()V x =()MSE x +()2BE xC.()MSE x =()V x +()B E x D.()2BE x =()MSE x +()V x2.(B )是总体里最小的、不可再分的单元。
A.抽样单元B.基本单元C.初级单元D.次级单元 3.下面哪种抽样方法是最简单的概率抽样方法(A )。
A.简单随机抽样B.分层随机抽样C.系统抽样D.整群抽样 4.抽样比的计算公式为(B )。
A.()()11f n N =-- B.f n N = C.()1f n N =- D.()f N n N =-5.关于简单随机抽样的核心定理,下面表达式正确的是(A )。
A.()21f V y S n -=B.()211f V y S n -=-C.()21V y S n =D.()21f V y s n-= 6. 下面关于各种抽样方法的设计效应,表述错误的是(B )。
A.简单随机抽样的deff=1B.分层随机抽样的def f ﹥1C.整群随机抽样的def f ﹥1D.机械随机抽样的def f ≈17.假设考虑了有效回答率之外所有其他因素后的初始样本量为400,而预计有效回答率为80﹪,那么样本量则应定为(B )。
A.320B.500C.400D.4808.在要求的精度水平下,不考虑其他因素的影响,若简单随机抽样所需要的样本量为300,分层随机抽样的设计效应deff=0.8,那么若想达到相同的精度,分层随机抽样所需要的样本量为(C )。
A.375B.540C.240D.360 9.分层抽样设计效应满足(B )。
A.1deff = B.1deff C.1deff ≈ D.1deff 10.下面哪种样本量分配方式属于比例分配?(A ) A.h h n n N N = B.h n n =1h h N S =∑ C.hn n=1h hLhhh N S N S=∑ D.h n n=1h h L h hh W S W S =∑ 二、多项选择题(每题3分,共15分)下列各题A )、B )、C )、D )、E )五个选项中,至少有两个答案是正确的 11.常用的构造估计量的方法有(AC )。
中国人民大学汇总题库标准答案详解-抽样技术

中国人民大学同等学力申请硕士学位课程考试试题课程代码:123105 课程名称:抽样技术与方法试题卷号: 1名词解释非概率抽样非概率抽样又称为非随机抽样,是调查者根据自己的方便或主观判断抽取样本的方法,其最主要的特征是抽取样本时并不依据随机原则。
包含有判断选样、方便抽样、自愿样本、配额抽样等。
最优分配在分层随机抽样中,对于给定的费用,使估计量的方差V(y_st)达到最小,或者对于给定的估计量方差V,使总费用达到最小的各层样本量的分配,称为最优分配。
PPS抽样是有放回的按规模大小成比例的概率抽样。
其抽选样本的方法有代码法、拉希里方法等。
PPS 抽样是按概率比例抽样,属于概率抽样中的一种。
是指在多阶段抽样中,尤其是二阶段抽样中,初级抽样单位被抽中的机率取决于其初级抽样单位的规模大小,初级抽样单位规模越大,被抽中的机会就越大,初级抽样单位规模越小,被抽中的机率就越小。
就是将总体按一种准确的标准划分出容量不等的具有相同标志的单位在总体中不同比率分配的样本量进行的抽样。
自加权样本指调查中每个样本单元的设计权数是相同的,也就是说每个单元最终入样的概率是相等的。
在不考虑非抽样误差的情况下,可以认为自加权样本完全代表总体,因为每个样本单元都代表了总体中相同数目的单元。
(此时可以使用标准统计方法来进行点估计。
此外,自加权样本往往方差较小,样本统计量更稳健)简述题有人认为“抽样调查除了调查误差以外,还有抽样误差,因此抽样调查不如全面调查准确”,请对此加以评价。
一项调查的误差来自多个方面,抽样调查因为只调查总体中的一小部分,用部分的调查结果推断总体,所以存在着抽样误差,但这只是所有误差中的一部分。
对于抽样调查,误差包括抽样误差和非抽样误差。
有些情况下,全面调查由于参与的人员众多、涉及范围大,因此虽然没有抽样误差,但在数据采集和数据汇总整理的过程中却有产生其他误差的更大可能性,所以调查规模并不是越大越好。
与全面调查相比,抽样调查的工作量小,这就为使用素质较高的工作人员并对他们进行深入的培训创造了条件。
中国人民大学题库答案详解抽样技术

中国人民大学题库答案详解抽样技术1名词解释非概率抽样非概率抽样又称为非随机抽样,是调查者根据自己的方便或主观判断抽取样本的方法,其最主要的特征是抽取样本时并不依据随机原则。
包含有判断选样、方便抽样、自愿样本、配额抽样等。
最优分配在分层随机抽样中,对于给定的费用,使估计量的方差V(y(_)t)达到最小,或者对于给定的估计量方差V,使总费用达到最小的各层样本量的分配,称为最优分配。
PPS抽样是有放回的按规模大小成比例的概率抽样。
其抽选样本的方法有代码法、拉希里方法等。
PPS抽样是按概率比例抽样,属于概率抽样中的一种。
是指在多阶段抽样中,尤其是二阶段抽样中,初级抽样单位被抽中的机率取决于其初级抽样单位的规模大小,初级抽样单位规模越大,被抽中的机会就越大,初级抽样单位规模越小,被抽中的机率就越小。
就是将总体按一种准确的标准划分出容量不等的具有相同标志的单位在总体中不同比率分配的样本量进行的抽样。
自加权样本指调查中每个样本单元的设计权数是相同的,也就是说每个单元最终入样的概率是相等的。
在不考虑非抽样误差的情况下,可以认为自加权样本完全代表总体,因为每个样本单元都代表了总体中相同数目的单元。
(此时可以使用标准统计方法来进行点估计。
此外,自加权样本往往方差较小,样本统计量更稳健)简述题有人认为“抽样调查除了调查误差以外,还有抽样误差,因此抽样调查不如全面调查准确”,请对此加以评价。
一项调查的误差来自多个方面,抽样调查因为只调查总体中的一小部分,用部分的调查结果推断总体,所以存在着抽样误差,但这只是所有误差中的一部分。
对于抽样调查,误差包括抽样误差和非抽样误差。
有些情况下,全面调查由于参与的人员众多、涉及范围大,因此虽然没有抽样误差,但在数据采集和数据汇总整理的过程中却有产生其他误差的更大可能性,所以调查规模并不是越大越好。
与全面调查相比,抽样调查的工作量小,这就为使用素质较高的工作人员并对他们进行深入的培训创造了条件。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中国人民大学同等学力申请硕士学位课程考试试题课程代码:123105 课程名称:抽样技术与方法试题卷号: 1名词解释非概率抽样非概率抽样又称为非随机抽样,是调查者根据自己的方便或主观判断抽取样本的方法,其最主要的特征是抽取样本时并不依据随机原则。
包含有判断选样、方便抽样、自愿样本、配额抽样等。
最优分配在分层随机抽样中,对于给定的费用,使估计量的方差V(y_st)达到最小,或者对于给定的估计量方差V,使总费用达到最小的各层样本量的分配,称为最优分配。
PPS抽样是有放回的按规模大小成比例的概率抽样。
其抽选样本的方法有代码法、拉希里方法等。
PPS 抽样是按概率比例抽样,属于概率抽样中的一种。
是指在多阶段抽样中,尤其是二阶段抽样中,初级抽样单位被抽中的机率取决于其初级抽样单位的规模大小,初级抽样单位规模越大,被抽中的机会就越大,初级抽样单位规模越小,被抽中的机率就越小。
就是将总体按一种准确的标准划分出容量不等的具有相同标志的单位在总体中不同比率分配的样本量进行的抽样。
自加权样本指调查中每个样本单元的设计权数是相同的,也就是说每个单元最终入样的概率是相等的。
在不考虑非抽样误差的情况下,可以认为自加权样本完全代表总体,因为每个样本单元都代表了总体中相同数目的单元。
(此时可以使用标准统计方法来进行点估计。
此外,自加权样本往往方差较小,样本统计量更稳健)简述题有人认为“抽样调查除了调查误差以外,还有抽样误差,因此抽样调查不如全面调查准确”,请对此加以评价。
一项调查的误差来自多个方面,抽样调查因为只调查总体中的一小部分,用部分的调查结果推断总体,所以存在着抽样误差,但这只是所有误差中的一部分。
对于抽样调查,误差包括抽样误差和非抽样误差。
有些情况下,全面调查由于参与的人员众多、涉及范围大,因此虽然没有抽样误差,但在数据采集和数据汇总整理的过程中却有产生其他误差的更大可能性,所以调查规模并不是越大越好。
与全面调查相比,抽样调查的工作量小,这就为使用素质较高的工作人员并对他们进行深入的培训创造了条件。
此外,如果能对调查过程实施更为细致的监督、检查和指导,可以使抽样调查所得到的数据质量比同样的全面调查数据质量更高,从而使调查的总误差更小。
试对分层抽样中的联合比率估计和分别比率估计方法进行比较。
如果每一层都满足比率估计量有效的条件,则除非R h=R,都有分别比率估计量的方差小于联合比率估计量的方差。
但当每层的样本量不太大时,还是采用联合比率估计量更可靠些,因为这时分别比率估计量的偏倚很大,从而使总的均方误差增大。
实际使用时,如果各层的样本量都较大,且有理由认为各层的比率R h差异较大,则分别比率估计优于联合比率估计。
当各层的样本量不大,或各层比率R h差异很小,则联合比率估计更好些。
此外,联合比估计不像分别比那样需要已知每层的辅助信息X h。
计算题某住宅区调查居民的用水情况,该区共有N =1000户,调查了n =100户,得y _=12.5吨,s 2 =1252,有40户用水超过了规定的标准。
要求计算:(1)该住宅区总的用水量及95%的置信区间;(2)若要求估计的相对误差不超过10%,应抽多少户作为样本?(3)以95%的可靠性估计超过用水标准的户数;(4)若认为估计用水超标户的置信区间过宽,要求缩短一半应抽多少户作为样本?【解】已知N=1000,n=100,f=n N =1001000 =0.1, y _=12.5, s 2 =1252(1)估计该住宅区总的用水量Y 为:Y ^=Ny _=1000*12.5=12500吨估计该住宅区总的用水量Y 的方差和标准差为:V(Y ^)=N 2v(y _)=N 21−f n s 2=10002*1−0.1100*1252=11268000 s(Y ^)=SQRT(v(Y ^))=√11268000 ≈ 3356.7842因此,在95%的置信度下,该住宅总的用水量的置信区间估计为:Y ^±z 0.025s(Y ^)=12500±1.96*3356.7842≈12500±6579即,我们可以以95%的把握认为该住宅总的用水量在 5921吨~19079吨之间。
(2)根据题意,要求估计的相对误差不超过10%,即r ≤0.1,假定置信度为95% 根据公式:n 0=22r 2y 2=1.962×12520.12×12.52≈3078 由于n 0N=3.078>0.05,所以需要对n 0进行修正: n=n 01+n 0/N =30781+3.078≈755 若要求估计的相对误差不超过10%,应抽不少于755户作为样本。
或:n 0=1/(1/N+d 2/(z α/22s 2)) ≈755 (d=ry _=1.25)(3)令超过用水标准的户数为A ,样本中超过用水标准的户数为a = 40,估计超过用水标准的比例p 为:p=a/n=40/100=40%估计超过用水标准的比例p 的方差和标准差为:v(p)=1−f n−1p(1-p)=1−0.1100−1*40%*60%≈0.002182s(p)=√v(p)=√0.002182≈4.67%在95%的可靠性下,超过用水标准的比例p 的估计区间为:p ±z 0.025 s(p)=40%±1.96*4.67%因此,我们有95%的把握认为,超过用水标准的比例p 在30.85%-49.15%之间,超过用水标准的户数的点估计为:1000*40%=400户,超过用水标准的户数在1000*30.85%户~1000*49.15%户之间,即309户~492户之间。
或:p ±z 0.025√(1−f n−1p(1−p)代入得(0.3089,0.4911)(4)若要置信区间的宽度缩小为原来一半,即要求应抽取的户数n 满足方程z 0.025√1−f n−1p(1−p) = 1/2 * z 0.025√v(p)≈0.045766代入数据解得n=306.25≈306户。
为估计市区人均居住面积,按与各区人数呈比例的概率从12个区中抽了4个区,经调查的数据如下:【解】设居住面积为Y ,人口数为X ,N=12,n=4,f=n/N=1/3。
人均居住面积点估计值为R ^=r=∑y i 41∑x i 41 = 92366062117019 ≈4.363米2/人. s y 2=1n−1∑(y i −rx i )2n 1=13∑(y i −rx i )241= 13[(2835326-4.363*604746)2+(1670996-4.363*456035)2+(1835226-4.363*470981)2+(2895058-4.363*585257)2)≈ 101742707182.336373V(R ^)=V(r)≈1x 21−f n 1n−1∑(y i −rx i )2n 1=1−1/34× s y 2x2≈16 * 101742707182.33637370027647599.390625≈0.24215s(R^)=√V(r)=√0.24215≈0.492因此置信度为95%的区间估计为:4.363±1.96*0.492,即(3.3987,5.3273) 试题卷号:2名词解释概率抽样也称随机抽样,是指依据随机原则,按照某种事先设计的程序,从总体中抽取部分单元的抽样方法。
(概率抽样就是使总体中的每一个单位都有一个已知的、不为零的概率进入样本的抽样方法。
)具体说来,概率抽样具有以下几个特点:(1)按一定的概率以随机原则抽取样本。
(2)每个单元被抽中的概率是已知的,或是可以计算出来的。
(3)当用样本对总体目标量进行估计时,要考虑到该样本(或每个样本单元)被抽中的概率。
也就是说,估计量不仅与样本单元的观测值有关,也与其入样概率有关。
概率抽样最主要的优点是,可以依据调查结果计算抽样误差,从而得到对总体目标量进行推断的可靠程度。
从另一方面讲,也可以按照要求的精确度,计算必要的样本单元数目。
因此,概率抽样可以排除调查者的主观影响,抽选出较其他方法更具代表性的样本。
事后分层又称抽样后分层,是对一个总体先进行简单随机抽样或系统抽样,抽取一个样本量为n的样本,然后对样本中的单元按某些特征进行分层并进行分层抽样估计。
πPS抽样是不放回的与单元大小成比例的概率抽样(该抽样方法是在总体抽取样本时,借助总体单元大小或规模(M i)的辅助变量来确定单元入样概率(Z i)或包含概率(πi, πij)的方法)随机化回答在调查中当一个问题是敏感性的或高度私人机密性的,则就会发生拒绝回答或回避回答的情况。
为了获得对这类问题总体比例进行估计的资料,就需要采用随机化的方式来获取回答信息并进行估计的技术,我们称之为随机化回答。
简述题什么是抽样框?简述抽样框的类型和作用,以及良好抽样框的标志。
总体的具体表现是抽样框。
通常,抽样框是一份包含所有抽样单元的名单,给每一个抽样单元编上一个号码,就可以按一定的随机化程序进行抽样。
抽样框又称“抽样框架”、“抽样结构”,是指对可以选择作为样本的总体单位列出名册或排序编号,以确定总体的抽样范围和结构。
设计出了抽样框后,便可采用抽签的方式或按照随机数表来抽选必要的单位数。
若没有抽样框,则不能计算样本单位的概率,从而也就无法进行概率选样。
抽样框有不同类型:名录框(总体中所有单元实际的名录清单,如在校学生名单、企业名册、电话号码簿等)、区域框(其单元由地理区域构成的集合,抽样总体由这些地理区域组成)、自然框(把相关的自然现象概念(如时间、距离等)作为抽样框使用)。
抽样框对抽样调查具有十分重要的作用。
1)首先,抽样框是代表总体进行抽样的,抽样框的缺陷会造成目标总体与调查总体不一致,在估计中出现偏差;2)其次,抽样框中的联系资料是用来确定总体单元所在的位置和联系地址的,如果出现错误,可能会产生无法联系而造成无回答;3)抽样框中的辅助资料可以用来进行分层等以改进抽样设计或改进估计方法,以提高抽样效率。
因此完备的抽样框是做好抽样调查的前提条件。
良好抽样框的标志是具有充分的辅助信息、目标总体和抽样总体完全重合,也就是目标总体单元和抽样总体单元完全呈一一对应的关系。
具体来讲:1)关联性,指抽样框与目标总体的对应程度,要求两者之间尽可能地关联;2)准确性,涵盖误差尽可能小,分类是否准确?联系资料是否完整?辅助资料是否齐全等;3)时效性,抽样框是否及时更新;4)最后还可以从建立抽样框的费用进行评估。
对多阶段抽样中自加权的有关问题进行论述。
由于不等概率抽样往往不满足自加权,因此在多阶段抽样中,最后一阶按等概率(如SRS等)抽取最终单元(USU),其它阶段采用PPS,且各阶段样本量对不同单元都等于常数,则所得样本是自加权的。