抽样技术第二章部分习题
应用抽样技术课后习题答案
=(0.0907,0.4433)
N1的95%的置信区间为: (159,776) 95%的置信区间为 (159, 的置信区间为:
(3)N=1750,n=30, (3)N=1750,n=30,n1=8, t=1.96, p=0.267, q=1q=1-0.267=0.733 由此可计算得: t 2q 1.962 × 0.733 n0 = 2 = =1054.64 r p 0.01× 0.267 n = n0/[1+(n0—1)/N] = 1054.64/[1+1053.64/1750]=658.2942 = 659 计算结果说明,至少应抽取一个样本量为659的简单随机 样本,才能满足95%置信度条件下相对误差不超过10%的精度 要求。
t=1.96 (2)易知,N=1750,n=30, n = 8 1 n 8 N − n 1750 − 30 1− f p= 1 = = 0.267 = = = 0.03389 n −1 (n −1)N 29 ×1750 n 30
pq = p(1 − p) = 0.267 × 0.733 = 0.1957
5.5 证明:由(5.6)得:
V ( yR ) ≈ 1− f n (Yi − RX i )2 ∑
i =1 N
N −n 2 令 Sd = V , Nn
2 d
N −1
=
N −n 2 Sd Nn
则n(NV + S ) = NS ,
2 d
S 2 NSd 从而n = = V 2 2 NV + Sd Sd 1+ NV
第五章 比率估计与回归估计
5.2 N=2000, n=36, 1-α=0.95, t=1.96, ˆ f = n/N=0.018, v(R) = 0.000015359, ˆ se(R) =0.00392 置信区间为[40.93%,42.47%]。 置信区间为[40.93%,42.47%]。
抽样技术第三版第2、3章习题答案
第2章2.1 解:()1 这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是1100。
()2这种抽样方法不是等概率的。
利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是2100,而尚未被抽中的编号为36~63的每个单元的入样概率都是1100。
()3这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是11000,所以这种抽样是等概率的。
2.3 解:首先估计该市居民日用电量的95%的置信区间。
根据中心极限定理可知,在大_y E y y -=近似服从标准正态分布, _Y 的195%α-=的置信区间为y z y z y y αα⎡⎡-+=-+⎣⎣。
而()21f V y S n-=中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间为,y y ⎡⎤-+⎢⎥⎣⎦。
由题意知道,_29.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得 _21130050000()2060.6825300f v y s n --==⨯=。
将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192⎡⎤⎣⎦。
下一步计算样本量。
绝对误差限d 和相对误差限r 的关系为_d rY =。
根据置信区间的求解方法可知____11P y Y r Y P αα⎫⎪⎧⎫-≤≥-⇒≤≥-⎨⎬⎩⎭根据正态分布的分位数可以知道1P Z αα⎫⎪⎪≤≥-⎬⎪⎪⎭,所以()2_2r Y V y z α⎛⎫⎪= ⎪⎝⎭。
也就是2_2_222/221111r Y r Y S n N z S n N z αα⎡⎤⎛⎫⎢⎥⎛⎫⎪⎛⎫⎝⎭⎪⎢⎥-=⇒=+ ⎪ ⎪⎢⎥⎝⎭⎝⎭⎢⎥⎣⎦。
把_29.5,206,10%,50000y s r N ====代入上式可得,861.75862n =≈。
(抽样检验)抽样技术课后答案
第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s1706366666206*300500003001500001)()ˆ(222=-=-==s nf N y N v YV 19.413081706366666(==)y v 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
第二章抽样方法-PPT文档资料
上面的例子中有三个层次的抽样单位:学校、班 级、学生,则对应的抽样框也应有三个:全部学校的 名单、抽取的学校样本中的全部班级的名单、抽取班 级中的所有学生的名单。
4、参数值与统计值: 参数值也称总体值,它是关于总体中某一变量的 综合描述,或者说是总体中所有个体的某种特征的 综合数量表现。 在统计中最常见的总体值是某一变量的平均值 例如:平均年龄、平均收入等。 总体值只有通过对总体中的每一个个体都进行调 查或测量才能得到。
5、抽样误差: 总体的异质性和样本与总体范围的差异性,在用 样本的统计值去推算总体的参数值时总会有偏差, 这种偏差就是抽样误差。它是样本代表性大小的一 个标准。
当总体相当大时,可能被抽取的样本非常多,不 可能列出所有的实际抽样误差,而用平均抽样误差来 表征各样本实际抽样误差的平均水平。
抽样误差是指样本指标值与被推断的总体指标值 之差。主要包括:样本平均数与总体平均数之差;样 本成数与总体成数之差。
2、可测性原则。
可测性原则指的是抽样设计能够从样本自身计算 出有效的估计或者抽样变动的近似值。在研究中通常 用标准误来表示。通常,只有概率样本在客观上才是 可测的,即概率样本可以计算出有效的估计值或抽样 变动的近似值。但是,概率抽样也并不自动保证可测 性。比如,从一个具有周期性变化的总体中选出一个 系统样本,就不能保证这种可测性。
一、抽样的基本术语
抽样:是通过抽取总体中的部分单元,收集这些 单元的信息,运用数理统计的原理和方法,对总体进 行推断的一种手段。
总体
抽取样本 推断总体
样本
1、总体与样本。总体是指研究对象的全体,它 是由研究对象中的单元组成的。总体中单元的数目 称作总体容量。
应用抽样技术课后习题答案.
第二章 抽样技术基本概念
2.7(1)抽样分布: 3 3.67 4.33 5 5.67 6.33 7
1/10 1/10 2/10 2/10 2/10 1/10 1/10 (2)期望为5,方差为4/3 (3)抽样标准误1.155 (4)抽样极限误差2.263 (5)置信区间(3.407,7.933)
第三章 简单随机抽样
3.3为调查某中学学生的每月购书支出水平,在全校 名学生中,用不放回简单随机抽样的方法抽得一 个的样本。对每个抽中的学生调查其上个月的购 书支出金额 (如表1所示)。
(1)在95%的置信度下估计该校学生该月平均购书支 出额;
(2)试估计该校学生该月购书支出超出70元的人数;
(3)如果要求相对误差限不超过10%,以95%的置信 度估计该校学生该月购书支出超出70元的人数比 例,样本量至少应为多少。
故 n ≈ 92.26 ≈93
4.8 解 已知W1=0.7,W2=0.3,p1=1/43,p2=2/57 (1)简单随机抽样 (1+2)/100=0.03 V(P)(1)=0.03*0.97/99=0.0002937 (2)事后分层 Σ0.7*1/43+0.3*2/57=0.0268 V() =Σ2[(1—)/(—1)] =0.72*[1/42](1/43)(42/43)+0.32*[1/56](2/57)(55/57) =0.00031942
由此可计算得:
n0
t2q r2 p
1.962 0.733 0.01 0.267
1054.64
n = n0/[1+(n0—1)] = 1054.64/[1+1053.64/1750]=658.2942 = 659
计算结果说明,至少应抽取一个样本量为659的简单随机样本,才能 满足95%置信度条件下相对误差不超过10%的精度要求。
《抽样技术》练习题及标准答案
《抽样技术》练习题及答案————————————————————————————————作者:————————————————————————————————日期:习题一1.请列举一些你所了解的以及被接受的抽样调查。
2.抽样调查基础理论及其意义;3.抽样调查的特点。
4.样本可能数目及其意义;5.影响抽样误差的因素;6.某个总体抽取一个n=50的独立同分布样本,样本数据如下:567 601 665 732 366 937 462 619 279 287690 520 502 312 452 562 557 574 350 875834 203 593 980 172 287 753 259 276 876692 371 887 641 399 442 927 442 918 11178 416 405 210 58 797 746 153 644 4761)计算样本均值y与样本方差s2;2)若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式;3)根据上述样本数据,如何估计v(y)?4)假定y的分布是近似正态的,试分别给出总体均值μ的置信度为80%,90%,95%,99%的(近似)置信区间。
习题二一判断题1 普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。
2 概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。
3 抽样单元与总体单元是一致的。
4 偏倚是由于系统性因素产生的。
5 在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。
6 偏倚与抽样误差一样都是由于抽样的随机性产生的。
7 偏倚与抽样误差一样都随样本量的增大而减小。
8 抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。
9 抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。
10 总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。
《抽样技术》练习题及标准答案
《抽样技术》练习题及答案————————————————————————————————作者:————————————————————————————————日期:习题一1.请列举一些你所了解的以及被接受的抽样调查。
2.抽样调查基础理论及其意义;3.抽样调查的特点。
4.样本可能数目及其意义;5.影响抽样误差的因素;6.某个总体抽取一个n=50的独立同分布样本,样本数据如下:567 601 665 732 366 937 462 619 279 287690 520 502 312 452 562 557 574 350 875834 203 593 980 172 287 753 259 276 876692 371 887 641 399 442 927 442 918 11178 416 405 210 58 797 746 153 644 4761)计算样本均值y与样本方差s2;2)若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式;3)根据上述样本数据,如何估计v(y)?4)假定y的分布是近似正态的,试分别给出总体均值μ的置信度为80%,90%,95%,99%的(近似)置信区间。
习题二一判断题1 普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。
2 概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。
3 抽样单元与总体单元是一致的。
4 偏倚是由于系统性因素产生的。
5 在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。
6 偏倚与抽样误差一样都是由于抽样的随机性产生的。
7 偏倚与抽样误差一样都随样本量的增大而减小。
8 抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。
9 抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。
10 总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。
抽样技术试题及答案
抽样技术试题及答案一、单选题(每题2分,共10分)1. 抽样调查中,样本容量的确定主要取决于()。
A. 总体数量B. 抽样误差C. 总体的变异程度D. 抽样方法答案:C2. 简单随机抽样的特点不包括()。
A. 每个样本单位被抽中的概率相同B. 样本容量较小时,代表性较好C. 样本容量较大时,代表性较差D. 抽样误差较小答案:C3. 在分层抽样中,分层的依据是()。
A. 总体的分布情况B. 总体的数量C. 总体的变异程度D. 总体的地理位置答案:C4. 系统抽样中,抽样间隔的确定主要依据()。
A. 总体数量B. 样本容量C. 总体的分布情况D. 抽样误差答案:B5. 抽样调查中,样本的代表性是指()。
A. 样本容量的大小B. 样本的分布情况C. 样本能否代表总体D. 样本的变异程度答案:C二、多选题(每题3分,共15分)1. 抽样调查的优点包括()。
A. 节省人力物力B. 调查速度快C. 调查结果准确D. 调查结果可靠答案:ABD2. 抽样误差的来源包括()。
A. 抽样方法B. 抽样框的不完善C. 抽样过程中的随机性D. 样本容量的大小答案:ABCD3. 在抽样调查中,下列哪些因素会影响样本的代表性()。
A. 抽样方法B. 抽样框的完整性C. 样本容量D. 抽样过程中的随机性答案:ABCD4. 非概率抽样方法包括()。
A. 简单随机抽样B. 系统抽样C. 便利抽样D. 配额抽样答案:CD5. 抽样调查中,样本容量的确定需要考虑的因素包括()。
A. 总体的数量B. 总体的变异程度C. 允许的抽样误差D. 置信水平答案:BCD三、判断题(每题1分,共5分)1. 抽样调查是一种非全面调查方法。
()答案:正确2. 抽样调查的结果可以完全代表总体。
()答案:错误3. 抽样误差的大小与样本容量成反比。
()答案:正确4. 系统抽样是一种概率抽样方法。
()答案:正确5. 抽样框的不完善会导致抽样误差的增加。
()答案:正确四、简答题(每题5分,共10分)1. 简述分层抽样的步骤。
应用抽样技术第三版课后习题答案
应用抽样技术第三版课后习题答案应用抽样技术第三版课后习题答案抽样技术是统计学中重要的一部分,它用于从总体中选择一部分样本,以便对总体进行推断。
在应用抽样技术的过程中,我们常常会遇到一些难题和疑惑。
为了帮助读者更好地理解和应用抽样技术,本文将为大家提供《应用抽样技术第三版》课后习题的详细解答。
第一章:抽样方法的基本概念1. 抽样方法的基本概念抽样方法是指从总体中选取一部分样本,以代表整个总体。
常用的抽样方法包括简单随机抽样、分层抽样、整群抽样等。
在选择抽样方法时,需要根据具体问题和研究目的来确定最适合的方法。
2. 简单随机抽样简单随机抽样是指从总体中随机选择样本,使每个样本都有相等的机会被选中。
这种抽样方法适用于总体规模较小且分布均匀的情况。
3. 分层抽样分层抽样是将总体划分为若干个层次,然后从每个层次中随机选择样本。
这种抽样方法适用于总体具有明显层次结构的情况,可以提高样本的代表性。
4. 整群抽样整群抽样是将总体划分为若干个群组,然后从每个群组中随机选择样本。
这种抽样方法适用于总体群组之间差异较大的情况,可以减少抽样误差。
第二章:简单随机抽样1. 简单随机抽样的步骤简单随机抽样的步骤包括确定总体、确定样本容量、编制总体名单、进行随机抽样和分析样本数据。
在确定样本容量时,需要考虑总体的大小、抽样误差和置信水平等因素。
2. 简单随机抽样的应用简单随机抽样广泛应用于各个领域的调查和研究中。
例如,在市场调查中,可以使用简单随机抽样来获取消费者的意见和反馈;在医学研究中,可以使用简单随机抽样来选择研究对象。
第三章:分层抽样1. 分层抽样的步骤分层抽样的步骤包括确定总体、划分层次、确定每层样本容量、进行随机抽样和分析样本数据。
在确定每层样本容量时,需要根据每个层次的重要性和变异程度来确定。
2. 分层抽样的应用分层抽样适用于总体具有明显层次结构的情况。
例如,在教育调查中,可以将学校划分为不同的层次,然后从每个层次中随机选择样本;在人口统计调查中,可以将人口按照年龄、性别等因素划分为不同的层次,然后进行抽样。
统计抽样技术习题及答案
统计抽样技术习题及答案统计抽样技术习题及答案统计抽样是统计学中非常重要的一项技术,它可以帮助我们从一个大的总体中选择出一部分样本,以便进行统计推断和分析。
在实际应用中,统计抽样技术被广泛运用于社会调查、市场调研、医学研究等领域。
本文将介绍一些统计抽样的习题,并提供相应的答案,帮助读者更好地理解和应用这一技术。
习题一:简单随机抽样某公司有1000名员工,现在要从中抽取100名员工进行调查。
请问,如何进行简单随机抽样?答案:简单随机抽样是指从总体中随机选择样本的方法。
对于本题,可以使用随机数表或者随机数生成器来进行抽样。
具体步骤如下:1. 编制一个包含1000个员工编号的名单;2. 使用随机数表或者随机数生成器生成100个随机数;3. 根据随机数在名单中选择对应编号的员工,即为抽取的样本。
习题二:系统抽样某学校有3000名学生,现在要从中抽取300名学生进行问卷调查。
请问,如何进行系统抽样?答案:系统抽样是指按照一定的规则从总体中选择样本的方法。
对于本题,可以按照以下步骤进行系统抽样:1. 计算抽样间隔,即总体大小除以样本大小,即3000/300=10;2. 随机选择一个起始数字,例如5;3. 从起始数字开始,每隔10个学生选择一个,直到选择满足样本大小为止。
习题三:整群抽样某城市共有10个行政区,现在要从中抽取3个行政区进行调查。
请问,如何进行整群抽样?答案:整群抽样是指将总体划分为若干个互不重叠的群体,然后从中随机选择若干个群体作为样本的方法。
对于本题,可以按照以下步骤进行整群抽样:1. 将10个行政区划分为若干个群体,每个群体包含若干个行政区;2. 使用随机数表或者随机数生成器生成3个随机数;3. 根据随机数选择对应的群体,即为抽取的样本。
习题四:分层抽样某市共有5个区,每个区有10个街道,现在要从中抽取10个街道进行调查。
请问,如何进行分层抽样?答案:分层抽样是指将总体划分为若干个层次,然后从每个层次中随机选择样本的方法。
金勇进:《抽样技术(第2版)》课后习题参考答案(精品pdf)
第一章1.1 答:理论上,若要根据调查数据进行统计推断,则需使用概率抽样。
在实际情形中,对概率抽样与非概率抽样的选择基于对调查目的与调查条件的权衡。
按照L. Kish 的说法,适用概率抽样的场合:(1)“当随机化〖即概率抽样〗既简单又重要时,忽视它就等于轻率和无知”;(2)“只有在某一具体研究领域中由于观察到抽选偏差,发现随机性的假设系错误后〖即随机性假设不成立〗,某些研究人员才显示出对概率抽样发生兴趣……在大多数物理学和化学实验中,样本的选择看来并不需要特别注意,在生物学里,随机与不随机兼而有之。
另一个极端是社会科学,事物特征的分布往往与随机分布相去甚远,也正是在这些领域,概率抽样最为需要,也是最为发展的”;(3)“随机化的概率抽样并不是一个教条而是一种策略,特别是对抽样数目大的场合更是如此”。
〖请再次注意由个人随意写下一些数字的例子〗适用非概率抽样的场合:(1)“比较大的挑战是在很多场合实行随机化的花费很大,这时它的价值必须与它的高费用相权衡,而且常常还要与减少对测量和实验变量的控制相权衡〖指调查方法与试验方法的选择〗。
因此,在很多现场操作中作业人员在下列三种情况下,尽量避免使用概率抽样: 第一,如果元素是一致的,那抽样就不重要了,例如,所有重量为一个单位的氢原子都可以认为是一样的;第二,虽然缺乏一致性,但如果预测的变量是可以度量且能够控制的话,抽样仍然可以避免,例如,在对个人进行抽选时对性别的控制是容易的;第三,如果不能控制的变量在总体中是随机分布的,那么对于任何选样设计,都可以提供一个随机样本。
”(2)“很多卓有成就的科学(天文学、物理学和化学)的巨大进步过去和现在都没有用概率抽样,在这些科学的研究里,统计推断是根据对总体有着适当的、自动的和自然的随机化这一主观判断而作出的……科学研究里充满了根据总体天然随机化的假定而获得成功的例子。
”1.2 答(1)(2)(3)皆否。
理由:判断一抽样是否为概率抽样,乃判断其是否为一给定之(),,S P U ,即:是否有确定之有限总体U ,所有可能样本的集合{}S s =是否确定,每个样本的选取概率{}P p =是否确定。
抽样技术 第三版 第二章课后部分答案 R语言
抽样技术作业一(2.5——2.10)袁闪闪 21205021192.5 解:这里N =200,n =20,由表中的数据可得:2011221211144.5201()826.052611()- 6.097n i i i i n i i y y y n s y y n nv y s n N=======-=-=⨯=∑∑∑(1) 因而该小区平均的文化支出Y 的95%的近似置信区间为:22/2/211[-,-][144.5 1.96 6.097][132.5503,156.4497]n n y z s y z s n N n Nαα-⨯+⨯=±⨯=(1)(1) 所以该小区平均的文化支出Y 的估计为144.5元,其95%的置信区间为 (132.55元,156.45元)。
2.6解:有题意可得:N =350,n =50, y =1120,2s =25600, 所以粮食总产量为:3501120392000()Y N y ∧==⨯=元 代入数据得:22/2/211[-,-][392000 1.967332.12][377629,406371]n n y z Ns y z N s n N n Nαα-⨯+⨯=±⨯=(1)(1) 所以总产值的95%的置信区间为:(377629吨,406371吨)。
2.7解:由题意可得:N =1000,d =2,α=0.05,2S =68,r=70%, 带入公式,可得初始样本量:222/2022222/2/21161.362Nz S d n N z S Nd z S ααα⎛⎫=+==≈ ⎪+⎝⎭ 由于有效回答率为r=70%,,对样本容量进行再调整:0070%87.5788nn n r===≈所以样本最终确定为88。
2.8解:由题意已知:N =100,n =10, X =2135,y =25,x =22, 方法一:简单随机估计:100252500()Y N y ∧==⨯=吨方法二:比估计:由经验可知去年的化肥总产量和今年的总产量之间存在较强的相关性,引入去年的化肥总产量作为辅助变量。
抽样调查,习题答案
抽样调查,习题答案篇一:《抽样技术》第四版习题答案第2章2.1 解:?1? 这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是1。
100?2?这种抽样方法不是等概率的。
利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是抽中的编号为36~63的每个单元的入样概率都是2,而尚未被1001。
100?3?这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是1,所以这种抽样是等概率的。
10002.3 解:首先估计该市居民日用电量的95%的置信区间。
根据中心极限定理可知,在大间为??z?_E近似服从标准正态分布,Y的195%的置信区_z。
1而V1?f2S中总体的方差S2是未知的,用样本方差s2来代替,置信区间n为,?_2。
?由题意知道,y?9.5,s?206,而且样本量为n?300,N?50000,代入可以求得v(y)?_1?f21?50000s??206?0.6825。
将它们代入上面的式子可得该市居民n300 日用电量的95%置信区间为??7.8808,11.1192??。
下一步计算样本量。
绝对误差限d和相对误差限r的关系为d?rY。
根据置信区间的求解方法可知____PyYrY1P1_2_rY根据正态分布的分位数可以知道P。
?Z1??,所以Vz?2?_rY??11?也就是S2nnNz??2?_222_rY1?。
22Nz/2S把y?9.5,s?206,r?10%,N?50000代入上式可得,n?86以总体比例P的195%的置信区间n?1可以写为pzp?z?,将p?0.35,n?200,N?10000代入可得置信区间为??0.2844,0.4156??。
2.5 解:利用得到的样本,计算得到样本均值为?2890/20?144.5,从而估计小区的平均文化支出为144.5元。
《抽样技术》第二章-简单随机抽样
1
f
公式V y S 2 1 f 的说明
n
(1)V y 主要取决于S 2和n,与f 关系不大;
(2)当f n 5%时,1 f 可忽略,即V y S 2 ;
N
n
(3)V y S 2 1 f 2 N n 放回时的V y 2 。
n
n N 1
n
❖ 推论2 y 的标准误
Xi——第i个家庭的成年女子数 Yi——第i个家庭成年女子化妆品的总费用 i=1,2,⋯,N
每个成年女子化妆品的平均费用为
N
总的费用 R 总的成年女子数
Yi
i1 N
Xi
Y X
Y X
i1
比率的例子
❖ (3)在某住宅小区的房价调查中,要估计该小区的平 均房屋单价。令
Xi——第i套住宅的建筑面积 Yi——第i套住宅的市场价格 i=1,2,⋯,N
1, 1
2, 3
3, 4
4, 5
1, 2
2, 4
3, 5
1, 3
2, 5
1, 4
二、简单随机抽样的抽选
❖ 首先将容量为N的有限总体中的所有单元从1 到N编好号码,然后从这N个编号中抽取n个。
❖ 具体的抽取方式一般有: (1)抽签法; (2)随机数表法; (3)计算机产生伪随机数法。
随机数表法
❖ 随机数表是由0, 1, 2, ⋯, 9这十个数字组成的,书中 表3.2给出了由2500个一位数字组成的随机数表。这 个随机数表是这样产生的:在这2500个位置上分别 独立地做一次等可能地产生0, 1, 2, ⋯, 9的随机试验。 因此,在任意一个位置上0~9这十个数字出现的可 能性都相同,在任意两个位置上00~99这一百个数 字出现的可能性也都是相同的,在任意三个位置上 000~999这一千个数字出现的可能性也都是相同的, 依次类推。
《抽样技术》练习题及标准答案
《抽样技术》练习题及答案————————————————————————————————作者:————————————————————————————————日期:习题一1.请列举一些你所了解的以及被接受的抽样调查。
2.抽样调查基础理论及其意义;3.抽样调查的特点。
4.样本可能数目及其意义;5.影响抽样误差的因素;6.某个总体抽取一个n=50的独立同分布样本,样本数据如下:567 601 665 732 366 937 462 619 279 287690 520 502 312 452 562 557 574 350 875834 203 593 980 172 287 753 259 276 876692 371 887 641 399 442 927 442 918 11178 416 405 210 58 797 746 153 644 4761)计算样本均值y与样本方差s2;2)若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式;3)根据上述样本数据,如何估计v(y)?4)假定y的分布是近似正态的,试分别给出总体均值μ的置信度为80%,90%,95%,99%的(近似)置信区间。
习题二一判断题1 普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。
2 概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。
3 抽样单元与总体单元是一致的。
4 偏倚是由于系统性因素产生的。
5 在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。
6 偏倚与抽样误差一样都是由于抽样的随机性产生的。
7 偏倚与抽样误差一样都随样本量的增大而减小。
8 抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。
9 抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。
10 总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。
抽样技术第三版第2、3章习题答案
第2章2.1 解:()1 这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是1100。
()2这种抽样方法不是等概率的。
利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是2100,而尚未被抽中的编号为36~63的每个单元的入样概率都是1100。
()3这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是11000,所以这种抽样是等概率的。
2.3 解:首先估计该市居民日用电量的95%的置信区间。
根据中心极限定理可知,在大_y E y y -=近似服从标准正态分布, _Y 的195%α-=的置信区间为y z y z y y αα⎡⎡-+=-+⎣⎣。
而()21f V y S n-=中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间为,y y ⎡⎤-+⎢⎥⎣⎦。
由题意知道,_29.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得 _21130050000()2060.6825300f v y s n --==⨯=。
将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192⎡⎤⎣⎦。
下一步计算样本量。
绝对误差限d 和相对误差限r 的关系为_d rY =。
根据置信区间的求解方法可知____11P y Y r Y P αα⎫⎪⎧⎫-≤≥-⇒≤≥-⎨⎬⎩⎭根据正态分布的分位数可以知道1P Z αα⎫⎪⎪≤≥-⎬⎪⎪⎭,所以()2_2r Y V y z α⎛⎫⎪= ⎪⎝⎭。
也就是2_2_222/221111r Y r Y S n N z S n N z αα⎡⎤⎛⎫⎢⎥⎛⎫⎪⎛⎫⎝⎭⎪⎢⎥-=⇒=+ ⎪ ⎪⎢⎥⎝⎭⎝⎭⎢⎥⎣⎦。
把_29.5,206,10%,50000y s r N ====代入上式可得,861.75862n =≈。
抽样技术:第2章课后答案
第2章2.1 M: (I)这种抽样方法是等機率的・在毎次抽取川本敢尤时.冊未被抽中的编号为1〜64的这兰单元中毎一个m兀被抽刮的槪率都足亠.100(2)这种抽杆方法不艮等嵐略的.利用这种方法.任每次抽収样本恥尤时.尚未被抽中的編号为1-35 U及编号为64的这36个嘏元中毎个敏元的入—.而尚木被捕中的编号为36~63的毎100个唯元的入样執丰祁足丄•100(3)这艸抽样方法是零怨率的.在邰次抽取样木单元时.尚未被抽中的编号为20 000〜21 000中的毎个服元的入样駅率都是詁亦・所以这种抽祥是等槪率的・2.2 W:2.3解:许先(Ail i^iUKKH用电凰的95%的KWK何.根撫中心极RI定理可知.在大样本的条件卜.[升和讣卩药]=[升1・96 皿灯+ 1・96风可•向叫亍)=上上$2中总体的方差S ,是未知的.用样本方差 /来代fh ?¥(SkM 为由聽盘知道.y = 9.5,52= 206 •而且样木址为“ = 300,N = 50 000・代入对以求刁严6)= 乎/二上驾铲°°°x206 = 0.682 5 •将它幻代入上面的式「町能该山居民日用电虽的95%置信区何为[7.880 8,11.119 2].下一步汁舒样木址.绝対谋船Bid和郴対的关系为d = Fp ・ 根区何的求解方注町卸把y = 9.5,s 2= 206.r = 10%,AT = 50 000 代入上式町阳.H = 861.75 ^862 .所以杆木 18至少为2.4 解:总体中套加培训班的比例为P.强么这次简眾閤机抽样紂到的P 的估计ffip 的方溢 1-f N “、 n-PP(l-P)・利用中心极国迷理可得+—在人杆木的条件F 近似眼从标准正念分布.V 的l-a=95%的B!怙区何为v-r> 1 —a根据正念分布的分位数町以知适P庄和g中.样木盘足够大.从m何typ的1-0=95%的置伉区何为]卩・讣卩莎P+Z^JF⑹卜丽这眼的叫P)是未妹的.我们便用它的估计(ftr(p)=v(p)=^p(l-p)=9.652xl0-\所以总体比例P的l-a = 95%的置仃区何可以写为["-二呻庶门“ +兀喘応孑}将p = O.35^ = 2OO.y = IOOOO代入町得K信区何为〔0.284 4.0.4156].2.5解:利用衍到的样木.计ma样本均值为歹=2 890/20 = 144.5.从ifiH占计小区的平均文化支出为144.5 7U.总体均(ftV的l-a = 95%的迓仃区何为卩-二皿灰冰歹匕曲丁^药]用二乎,来估计样本均值的方筮卩@)・计算斜到F =826.025 6,则卩(刃=匕上T =匕巴丄只826・025 6 = 37」72 •n20£/:丿卩(刃=1 %xj37.172 71.95 •代入数W可紂总体肉值的95%的置佰区何为[132.55J 56.45].2.6M:根据样木位息估计对衍毎个乡的平均产诫为1120吨.该地区今年的粮伐总产虽丫的佔计值为X = 350> = 350xl 120 =3.92xl05(吨)•)S2.总体总(ft 的I・a = 95%的盘伉区何为总体总(ft估计值的方差为rM= W•把y = 3.92X10\S2 = 25 600,n = 50,^ = 350,= 1.96代入.可須粮伏总产虽的l-a=95%的置信区何为[377 629.406 371]./ = ^.za/:解:泞先计外简腋皈机抽样条什下所需耍的祥本虽・把N = l 000,d = 2」-a = 95%S'=68 帯入公式%如果彩电到仃效河猝率的问題・亦仃效冋??率为70%时・样本虽应该加终确定为/70% = 88.57 *89./i = no2.8 M:去年的化肥总产虽和今邻的总产量Z何存在较強的WXfte iliifl这种相关关系较为楼定.所以引入去年的化肥产址作为辅助变虽・「•建我的采用比申估计址的形式*估计今年的化肥总产虽•去年化肥总广虽为X = 2I35・利用£年的化肥总严虽・今年的化肥总产虽的估计(ft为y/?X=^X = 2 426.14< =■X2.9駢:木JS中.简險估计址的方羞的估计(ft为v(y)=^L S2 =37.17.n利用比率估itfit进行估计时.我们引入了家庭的总支出作为辅助变fit.记为X・文化支出届F总支岀的一部分.这个上箜变st与辅助变st之何存在较強的相关关系.面11它m之何的关系是比较住定的.11全部家庭的总支出是已知的虽・文化支出的比率估计就为y^RX^X.通过if■算彻到y = 2 890/20 = 144.5・ifijx = l 580.則' V 144 5 ・/? = 1 = 2_£O,O915.文化支岀的比率佔计址的值为儿= 146.3 (元人=•I现在考Jg比率佔计fit的方差.在样木足牧大的条件几卩(耳片MSE(耳片乎(S j2RpS・S,+用S:)・通过计件吋以得到两个变fit的样本方羞为A?=826,.<=9.958xl0\『和X之何的相关系数的佔计值为p = 0.974.代入上面的公式.可U得到比半估计虽的方差的佔计備为v耳=1.94・这个数值比简的方羌佔计值耍小很个部家庭的平均文化支出的l-a = 95%的盘估X何为[斤・%应订•齐+ %応「卜“96^面•齐+1 %応J]・把具体的敌值代入可得置仃区何为[143.57.149.03].y[yA彳元)接下来比较比佔汁和简腋佔计的效札亠亠2 = :^ = 0・052・这是比佔计的设计效应v(y)呛)37.17值,从这里可以看岀比佔计駅比简乐佔计虽的效率史高.2.10 利用简爪佔计址町紂戸=》比/” = 1 630/10二163・样本方澄为? =212.222, AT = 120・样本均值的方左佔计值为v(y)=52 = ^1^120 x212.222 = 19.453 7.利用回贮估计的方注.在这里选取肉牛的KiRfi为辅助变址.迭擇原電虽为緬助矢St是合理的.因为肉牛的很大程皮上彩响荷肉牛的现任的車虽・二折Z何“庄牧冬的相关性.郴关系数的估计血为2 = 0.971 •临II 这种相关关瑕是稳定的.这觇肉牛的原載虽的8(值已经衍到.所以选好肉牛的廉載ft为辅助妞.* * |4 CAQ何粉估计SMM度加高的冋•垠敌“的伕计ffi为/7 = p—= 0.971x^^- = 1.368.现在何以衍到$. 10.341肉牛fltiF.fi 的回归佔计fit 为无=戸+ 0 X^x .代入数值町以月到畀=159.44.囚为恋在肉牛股秋fit 这个牧好的辅助变足,所以冋$1佔计虽的箱度耍好「简冋归估计fit 入的方差为打兀)=MSE (人方差的佔计位为仏卜•代入柿应的敷值・单估计就・。
《抽样技术》第四版习题答案
第2章(一)创作者(人):历恰面日期:贰零贰贰年1月1日解:这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是。
这种抽样方法不是等概率的。
利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是,而尚未被抽中的编号为36~63的每个单元的入样概率都是。
这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是,所以这种抽样是等概率的。
解:项目相同之处不同之处定义都是根据从一个总体中抽样得到的样本,然后定义样本均值为。
抽样理论中样本是从有限总体中按放回的抽样方法得到的,样本中的样本点不会重复;而数理统计中的样本是从无限总体中利用有放回的抽样方法得到的,样本点有可能是重复的。
性质(1)样本均值的期望都等于总体均值,也就是抽样理论和数理统计中的样本均值都是无偏估计。
(2)不论总体原来是何种分布,在样本量足够大的条件下,样本均值近似服从正态分布。
(1)抽样理论中,各个样本之间是不的;而数理统计中的各个样本之间是相互的。
(2)抽样理论中的样本均值的方差为,其中。
在数理统计中,,其中为总体的方差。
解:首先估计该市居民日用电量的95%的置信区间。
根据中心极限定理可知,在大样本的条件下,近似服从正态分布,的的置信区间为。
而中总体的方差是未知的,用样本方差来代替,置信区间为。
由题意知道,,而且样本量为,代入可以求得。
将它们代入上面的式子可得该市居民日用电量的95%置信区间为。
下一步计算样本量。
绝对误差限和相对误差限的关系为。
根据置信区间的求解方法可知根据正态分布的分位数可以知道,所以。
也就是。
把代入上式可得,。
所以样本量至少为862。
解:总体中参加培训班的比例为,那么这次简单随机抽样得到的的估计值的方差,利用中心极限定理可得在大样本的条件下近似服从正态分布。