应用抽样技术答案
应用抽样技术练习题答案
应用抽样技术练习题一、选择题1. 下列哪种抽样方法属于非概率抽样?A. 简单随机抽样B. 分层抽样C. 方便抽样D. 系统抽样2. 在简单随机抽样中,每个个体被抽中的概率是:A. 不相等B. 相等C. 逐渐增大D. 逐渐减小A. 总体标准差B. 抽样误差C. 置信水平A. 确定总体B. 划分层次C. 确定各层样本量5. 系统抽样中,抽样间隔的计算公式是:A. N/nB. N/(n+1)C. n/ND. (N1)/n二、填空题1. 抽样技术分为两大类:______抽样和______抽样。
2. 在______抽样中,每个个体被抽中的概率是相等的。
3. 抽样误差的大小与样本量成______比,与总体标准差成______比。
4. 在分层抽样中,各层的样本量应与各层的______成比例。
5. 系统抽样的第一步是确定______。
三、简答题1. 简述简单随机抽样的步骤。
2. 何为抽样误差?它受哪些因素影响?3. 简述分层抽样的优点。
4. 系统抽样与简单随机抽样有何区别?5. 如何确定样本量?四、计算题1. 某企业有员工1000人,采用简单随机抽样方法抽取50人进行调查。
计算每个员工被抽中的概率。
2. 某地区居民收入总体标准差为500元,要求抽样误差不超过50元,置信水平为95%。
计算所需样本量。
3. 某学校有学生2000人,分为四个年级,每个年级人数分别为400、450、500和650人。
现采用分层抽样方法抽取200人进行调查,求每个年级应抽取的样本量。
4. 某生产线共有1000个产品,采用系统抽样方法抽取100个产品进行质量检验。
计算抽样间隔。
5. 某企业对员工满意度进行调查,总体标准差为10%,要求抽样误差不超过2%,置信水平为90%。
计算所需样本量。
五、判断题1. 在抽样调查中,总体的大小对于抽样误差没有影响。
()2. 非概率抽样不能提供总体参数的估计。
()3. 在系统抽样中,第一个样本单元可以随机选择。
应用抽样技术练习题答案
应用抽样技术练习题答案一、选择题1. 抽样技术中,简单随机抽样的特点是:A. 样本容量较大B. 每个个体被抽中的概率相等C. 样本代表性差D. 抽样成本高答案:B2. 系统抽样中,若总体容量为100,样本容量为10,抽样间隔为:A. 10B. 5C. 20D. 1答案:A3. 分层抽样的目的是:A. 增加样本容量B. 提高样本的代表性C. 降低抽样成本D. 减少数据收集时间答案:B4. 在分层抽样中,如果某层的样本量占总体的比例小于该层在总体中的比例,那么该层的:A. 抽样误差会增大B. 抽样误差会减小C. 抽样成本会降低D. 抽样成本会提高答案:A5. 以下哪种抽样方法不属于概率抽样?A. 简单随机抽样B. 系统抽样C. 分层抽样D. 判断抽样答案:D二、判断题1. 在简单随机抽样中,每个个体被抽中的概率是相同的。
(对)2. 分层抽样可以提高样本的代表性,但会增加抽样成本。
(错)3. 系统抽样适用于总体分布均匀的情况。
(对)4. 判断抽样是一种非概率抽样方法。
(对)5. 抽样误差与样本容量成反比。
(对)三、简答题1. 请简述分层抽样的优点和局限性。
答案:分层抽样的优点是能够保证样本在各个层中的比例与总体相同,从而提高样本的代表性。
局限性是分层可能需要额外的信息,且如果分层不准确,可能会影响样本的代表性。
2. 什么是系统抽样?请简述其抽样过程。
答案:系统抽样是一种概率抽样方法,它首先将总体随机分成若干个等距的子群,然后在第一个子群中随机选择一个起始点,之后按照固定的间隔选择样本。
这种方法适用于总体分布均匀的情况。
四、计算题1. 某公司有500名员工,需要从中随机抽取50名员工进行满意度调查。
如果采用系统抽样,计算抽样间隔。
答案:抽样间隔 = 总体容量 / 样本容量 = 500 / 50 = 102. 假设某城市有10个区域,每个区域的人口数分别为10000, 15000, 12000, 8000, 9000, 11000, 13000, 7000, 14000, 6000。
应用抽样技术课后习题答案
=(0.0907,0.4433)
N1的95%的置信区间为: (159,776) 95%的置信区间为 (159, 的置信区间为:
(3)N=1750,n=30, (3)N=1750,n=30,n1=8, t=1.96, p=0.267, q=1q=1-0.267=0.733 由此可计算得: t 2q 1.962 × 0.733 n0 = 2 = =1054.64 r p 0.01× 0.267 n = n0/[1+(n0—1)/N] = 1054.64/[1+1053.64/1750]=658.2942 = 659 计算结果说明,至少应抽取一个样本量为659的简单随机 样本,才能满足95%置信度条件下相对误差不超过10%的精度 要求。
t=1.96 (2)易知,N=1750,n=30, n = 8 1 n 8 N − n 1750 − 30 1− f p= 1 = = 0.267 = = = 0.03389 n −1 (n −1)N 29 ×1750 n 30
pq = p(1 − p) = 0.267 × 0.733 = 0.1957
5.5 证明:由(5.6)得:
V ( yR ) ≈ 1− f n (Yi − RX i )2 ∑
i =1 N
N −n 2 令 Sd = V , Nn
2 d
N −1
=
N −n 2 Sd Nn
则n(NV + S ) = NS ,
2 d
S 2 NSd 从而n = = V 2 2 NV + Sd Sd 1+ NV
第五章 比率估计与回归估计
5.2 N=2000, n=36, 1-α=0.95, t=1.96, ˆ f = n/N=0.018, v(R) = 0.000015359, ˆ se(R) =0.00392 置信区间为[40.93%,42.47%]。 置信区间为[40.93%,42.47%]。
应用抽样技术练习题答案
应用抽样技术练习题答案一、选择题1. 抽样技术在统计分析中的主要作用是什么?A. 预测未来趋势B. 代表总体特征C. 描述个体差异D. 计算平均值答案:B2. 以下哪项不是抽样误差的来源?A. 抽样方法B. 抽样框的不完整性C. 抽样过程中的随机性D. 样本量的大小答案:D3. 简单随机抽样的特点是什么?A. 每个个体被抽中的概率相同B. 样本量必须很大C. 需要分层抽样D. 只能用于总体较小的情况答案:A4. 分层抽样的优点是什么?A. 可以减少抽样误差B. 可以增加样本量C. 可以提高总体的代表性D. 可以降低抽样成本答案:A5. 系统抽样的特点是什么?A. 抽样间隔是固定的B. 抽样间隔是随机的C. 需要分层D. 需要配额答案:A二、判断题1. 抽样调查总是比全面调查更经济。
(错误)2. 抽样调查的目的是估计总体参数。
(正确)3. 抽样调查中,样本量越大,抽样误差就越小。
(错误)4. 抽样框是抽样调查中用来记录所有个体的列表。
(正确)5. 抽样技术只能用于定量研究。
(错误)三、简答题1. 请简述分层抽样的步骤。
答案:分层抽样的步骤包括:(1)确定总体并将其分为互不重叠的子群体,即层;(2)在每个层中独立地进行抽样;(3)将各层的样本合并,形成总体的代表性样本。
2. 为什么在抽样调查中需要考虑样本的代表性?答案:样本的代表性意味着样本能够反映总体的特征。
如果样本具有代表性,那么从样本中得到的统计推断将更接近总体的真实情况,从而提高研究的准确性和可靠性。
四、计算题1. 假设一个总体有1000个个体,我们使用简单随机抽样方法抽取了50个个体作为样本。
计算样本比例的抽样误差。
答案:抽样误差可以通过以下公式计算:\( \text{抽样误差} = Z\times \sqrt{\frac{p(1-p)}{n}} \),其中\( Z \)是标准正态分布的置信水平对应的Z值(例如,95%置信水平对应的Z值为1.96),\( p \)是总体比例(由于我们不知道总体比例,这里假设为0.5,此时抽样误差最大),\( n \)是样本量。
抽样技术第二章参考答案
抽样技术第⼆章参考答案第⼆章习题判断下列抽样⽅法是否是等概的:(1)总体编号1~64,在0~99中产⽣随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产⽣随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产⽣随机数r 。
然后⽤r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有⼀些⼏个特点:第⼀,按照⼀定的概率以随机原则抽取样本。
第⼆,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当⽤样本对总体⽬标进⾏估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同解析:抽样理论和数理统计中关于样本均值的定义和性质的不同为了合理调配电⼒资源,某市欲了解50000户居民的⽇⽤电量,从中简单随机抽取了300户进⾏,现得到其⽇⽤电平均值=y (千⽡时),=2s 206.试估计该市居民⽤电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量⾄少应为多少解:由已知可得,N=50000,n=300,5.9y =,2062=s1706366666206*300500003001500001)()?(222=-=-==s nf N y N v YV19.413081706366666(==)y v该市居民⽤电量的95%置信区间为[])(y [2y V z N α±=[475000±*]即为(,)由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤-即n ≥862欲使相对误差限不超过10%,则样本量⾄少应为862某⼤学10000名本科⽣,现欲估计爱暑假期间参加了各类英语培训的学⽣所占的⽐例。
应用抽样技术答案
N
1750
3.4
(1) N 200000
n 70
n1 6
1 f 1 1 0.01449 n 1 n 1 70 1
该地区拥有私人汽车的比例估计: p n1 6 0.086 n 70
q 1 p 1 0.086 0.914 pq 0.0860.914 0.0786
4.5 依题意,可算得样本量 n = 200,并有如下表数据
1
2
3
4
5
6
7
8
9
10
Total
Wh yh 7.298 3.64 13.974 4.256 11.446 9.164 14.11 5.096 3.168 3.64 75.792
Whsh2 904.05 355.94 4739.65 526.90 1325.85 918.84 2132.48 522.24 170.37 295.75 11892.07 故可得
2658
������ℎ = ������������ℎ
������1 ≈ 478 ������2 ≈ 558 ������3 ≈ 373 按尼曼分配时
n
=
������
������ℎ +
������ℎ ������ℎ 2 ������ℎ ������ℎ ������ℎ
������
≈
2561
������4 ≈ 239 ������5 ≈ 425
1750(0.0907, 0.4433) (159, 776)
(3)
n0
t2q 2p
1.962 (1 0.267) 0.12 0.267
1054.64
可得最少的样本量: n n0 1054.64 658.2948 659 。
抽样技术练习题及答案
习题一1.请列举一些你所了解的以及被接受的抽样调查。
2.抽样调查基础理论及其意义;3.抽样调查的特点。
4.样本可能数目及其意义;5.影响抽样误差的因素;6.某个总体抽取一个n=50的独立同分布样本,样本数据如下:567 601 665 732 366 937 462 619 279 287690 520 502 312 452 562 557 574 350 875834 203 593 980 172 287 753 259 276 876692 371 887 641 399 442 927 442 918 11178 416 405 210 58 797 746 153 644 4761)计算样本均值y与样本方差s2;2)若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式;3)根据上述样本数据,如何估计v(y)?4)假定y的分布是近似正态的,试分别给出总体均值μ的置信度为80%,90%,95%,99%的(近似)置信区间。
习题二一判断题1 普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。
2 概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。
3 抽样单元与总体单元是一致的。
4 偏倚是由于系统性因素产生的。
5 在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。
6 偏倚与抽样误差一样都是由于抽样的随机性产生的。
7 偏倚与抽样误差一样都随样本量的增大而减小。
8 抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。
9 抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。
10 总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。
11 一个抽样设计方案比另一个抽样设计方案好,是因为它的估计量方差小。
12 抽样误差在概率抽样中可以对其进行计量并加以控制,随着样本量的增大抽样误差会越来越小,随着n越来越接近N,抽样误差几乎可以消除。
抽样技术第四习题答案
第2章2.1 解:()1 这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是1100。
()2这种抽样方法不是等概率的。
利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是2100,而尚未被抽中的编号为36~63的每个单元的入样概率都是1100。
()3这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是11000,所以这种抽样是等概率的。
2.3 解:首先估计该市居民日用电量的95%的置信区间。
根据中心极限定理可知,在大_y E y y -=近似服从标准正态分布, _Y 的195%α-=的置信区间为y z y z y y αα⎡⎡-+=-+⎣⎣。
而()21f V y S n-=中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间为,y y ⎡⎤-+⎢⎥⎣⎦。
由题意知道,_29.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得 _21130050000()2060.6825300f v y s n --==⨯=。
将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192⎡⎤⎣⎦。
下一步计算样本量。
绝对误差限d 和相对误差限r 的关系为_d rY =。
根据置信区间的求解方法可知____11P y Y r Y P αα⎫⎪⎧⎫-≤≥-⇒≤≥-⎨⎬⎩⎭根据正态分布的分位数可以知道1P Z αα⎫⎪⎪≤≥-⎬⎪⎪⎭,所以()2_2r Y V y z α⎛⎫⎪= ⎪⎝⎭。
也就是2_2_222/221111r Y r Y S n N z S n N z αα⎡⎤⎛⎫⎢⎥⎛⎫⎪⎛⎫⎝⎭⎪⎢⎥-=⇒=+ ⎪ ⎪⎢⎥⎝⎭⎝⎭⎢⎥⎣⎦。
把_29.5,206,10%,50000y s r N ====代入上式可得,861.75862n =≈。
应用抽样技术期末试题及答案
应用抽样技术期末试题及答案一、选择题1. 抽样是统计调查中的一种重要方法,以下关于抽样的说法正确的是:A. 抽样是指从整体中选择出有代表性的样本进行研究或调查B. 抽样是指从部分中选择出有代表性的样本进行研究或调查C. 抽样是指从样本中选择出有代表性的整体进行研究或调查D. 抽样是指从总体中选择出有代表性的样本进行研究或调查2. 在抽样调查中,以下哪种抽样方法可以保证每个个体被等可能地被抽取到样本中?A. 系统抽样B. 随机抽样C. 整群抽样D. 方便抽样3. 利用抽样获得的样本数据,能够推断总体的特征,以下哪种类型的推断是建立在统计学原理基础上的?A. 修改性推断B. 统计推断C. 精确推断D. 直接推断4. 通过抽样的方法,我们可以评估总体参数的数值,以下哪种方法是建立在中心极限定理的基础上的?A. 置信度B. 可信度C. 可靠度D. 信度5. 抽样调查中使用的样本容量过小可能导致结果的不准确,以下哪个因素不会影响样本容量的大小?A. 总体的大小B. 误差容忍度C. 可用资源D. 概率分布二、填空题1. 整群抽样是指将总体按照特定的特征分成多个________,然后从某些群体中选择样本进行调查。
答案:群体2. 抽样误差是指样本的统计特征与总体的真实特征之间的差异,它受到样本容量和________的影响。
答案:抽样方法3. 置信区间是用来估计总体参数的区间范围,常见的置信区间水平有________。
答案:90%、95%、99%4. 在简单随机抽样中,每个个体被选入样本的概率是________。
答案:相等的5. 样本的有效性是指样本是否真实、准确地反映了总体的特征,影响样本有效性的因素有样本的________。
答案:无偏性三、问答题1. 请简要说明抽样方法的分类及其特点。
答:抽样方法可以分为概率抽样和非概率抽样。
概率抽样是指每个个体被抽中的概率是可以计算的,包括简单随机抽样、系统抽样、整群抽样等。
抽样技术习题参考答案(第一章)
第一章1.1 答:理论上,若要根据调查数据进行统计推断,则需使用概率抽样。
在实际情形中,对概率抽样与非概率抽样的选择基于对调查目的与调查条件的权衡。
按照L. Kish 的说法,适用概率抽样的场合:(1)“当随机化〖即概率抽样〗既简单又重要时,忽视它就等于轻率和无知”;(2)“只有在某一具体研究领域中由于观察到抽选偏差,发现随机性的假设系错误后〖即随机性假设不成立〗,某些研究人员才显示出对概率抽样发生兴趣……在大多数物理学和化学实验中,样本的选择看来并不需要特别注意,在生物学里,随机与不随机兼而有之。
另一个极端是社会科学,事物特征的分布往往与随机分布相去甚远,也正是在这些领域,概率抽样最为需要,也是最为发展的”;(3)“随机化的概率抽样并不是一个教条而是一种策略,特别是对抽样数目大的场合更是如此”。
〖请再次注意由个人随意写下一些数字的例子〗适用非概率抽样的场合:(1)“比较大的挑战是在很多场合实行随机化的花费很大,这时它的价值必须与它的高费用相权衡,而且常常还要与减少对测量和实验变量的控制相权衡〖指调查方法与试验方法的选择〗。
因此,在很多现场操作中作业人员在下列三种情况下,尽量避免使用概率抽样: 第一,如果元素是一致的,那抽样就不重要了,例如,所有重量为一个单位的氢原子都可以认为是一样的;第二,虽然缺乏一致性,但如果预测的变量是可以度量且能够控制的话,抽样仍然可以避免,例如,在对个人进行抽选时对性别的控制是容易的;第三,如果不能控制的变量在总体中是随机分布的,那么对于任何选样设计,都可以提供一个随机样本。
”(2)“很多卓有成就的科学(天文学、物理学和化学)的巨大进步过去和现在都没有用概率抽样,在这些科学的研究里,统计推断是根据对总体有着适当的、自动的和自然的随机化这一主观判断而作出的……科学研究里充满了根据总体天然随机化的假定而获得成功的例子。
”1.2 答(1)(2)(3)皆否。
理由:判断一抽样是否为概率抽样,乃判断其是否为一给定之(),,S P U ,即:是否有确定之有限总体U ,所有可能样本的集合{}S s =是否确定,每个样本的选取概率{}P p =是否确定。
抽样技术练习题及答案word精品
习题一1. 请列举一些你所了解的以及被接受的抽样调查。
2. 抽样调查基础理论及其意义;3. 抽样调查的特点。
4. 样本可能数目及其意义;5. 影响抽样误差的因素;6. 某个总体抽取一个n=50 的独立同分布样本,样本数据如下:567 601 665 732 366 937 462 619 279 287690 520 502 312 452 562 557 574 350 875834 203 593 980 172 287 753 259 276 876692 371 887 641 399 442 927 442 918 11178 416 405 210 58 797 746 153 644 4761)计算样本均值y 与样本方差s2;2)若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式;3)根据上述样本数据,如何估计v(y)?4)假定y的分布是近似正态的,试分别给出总体均值卩的置信度为80%, 90%, 95%, 99% 的(近似)置信区间。
习题二一判断题1 普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。
2 概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。
3 抽样单元与总体单元是一致的。
4 偏倚是由于系统性因素产生的。
5 在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。
6 偏倚与抽样误差一样都是由于抽样的随机性产生的。
7 偏倚与抽样误差一样都随样本量的增大而减小。
8 抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。
9 抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。
10 总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。
11 一个抽样设计方案比另一个抽样设计方案好,是因为它的估计量方差小。
12 抽样误差在概率抽样中可以对其进行计量并加以控制,随着样本量的增大抽样误差会越来越小,随着n越来越接近N,抽样误差几乎可以消除。
应用抽样技术答案
第二章2.1判断题:(1)错;(2)错;(3)对;(4)错;(5)错;(6)错;(7)错;(8)错;(9)对;(10)对;(11)错;(12)错;(13)错。
2.3选择题:(1)b ;(2)b ;(3)d ;(4)c ;(5)c 。
2.7(1)抽样分布:(2)期望为5,方差为4/3 (3)抽样标准误 = = 1.155 (4)抽样极限误差 = 1.96*1.155 = 2.263(5)置信区间 = (5.67-2.263, 5.67+2.263) =(3.407, 7.933)。
若区间两端只考虑抽样分布的可能性取值,则可得该抽样分布作为离散分布的置信区间为[3, 7]第三章3.1 判断题是否为等概率抽样:(1)是;(2)否;(3)是;(4)否。
3.2 (1)5.51==∑iYNY25.6)(122=-=∑Y Y Niσ33.8)(1122=--=∑Y Y N S i (2)样本:(2, 5) (2, 6) (2, 9) (5, 6) (5, 9) (6, 9)()()5.55.775.55.545.361=+++++=∑y E ()∑=+++++=33.8)5.485.05.2485.4(612s E3.3(1) 1682=∑i y 1182662=∑i y03276.0301750/3011=-=-n f 760.5630/1682==y127.8261302^067.503011826611)(11212212=-⨯-=⎪⎭⎫ ⎝⎛--=--=∑∑==y n y n y y n s n i in i i ()07.27271.82603276.012=⨯=-=s nf y v ()203.5)(==y v y se198.10203.596.1)(=⨯=⨯=∆y se t95%置信度下置信区间为(56.067-10.198, 56.067+10.198)=(45.869, 66.265). 因此,对该校学生某月的人均购书支出额的估计为56.07(元),由于置信度95%对应的96.1=t ,所以,可以以95%的把握说该学生该月的人均购书支出额大约在45.87~66.27元之间。
抽样技术课后习题答案
该市居民用电量的95%置信区间为
[ =[475000±1.96*41308.19]
即为(394035.95,555964.05)
由相对误差公式 ≤10%
可得
即n≥862
欲使相对误差限不超过10%,则样本量至少应为862
2.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。
因此(1)中只有1~64是可能被抽中的,故不是等概的。(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值 的定义和性质有哪些不同?
解析:抽样理论和数理统计中关于样本均值的定义和性质的不同
抽样理论
概率统计
定义
性质
1.期望
2.方差
1.期望
2.方差
2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值 9.5(千瓦时), 206.试估计该市居民用电量的95%置信区间。如果希望相对误差限不超过10%,则样本量至少应为多少?
20
试估计平均每户家庭订报份数及总的订报份数,以及估计量的方差。
解:由题意得到 , , ,
故 (份)
(份)
(份)
于是由以上的计算结果得到平均每户的订报份数为1.875,估计量方差为0.00391875。该辖区总的订阅份数为7500,估计量方差为62700。
4.2
某工业系统准备实行一项改革措施。该系统共有87个单位,现采用整群抽样,用简单随机抽样抽取15个单位做样本,征求入选单位中每个工人对政策改革措施的意见,结果如下:
抽样技术 第三版 第二章课后部分答案 R语言
抽样技术作业一(2.5——2.10)袁闪闪 21205021192.5 解:这里N =200,n =20,由表中的数据可得:2011221211144.5201()826.052611()- 6.097n i i i i n i i y y y n s y y n nv y s n N=======-=-=⨯=∑∑∑(1) 因而该小区平均的文化支出Y 的95%的近似置信区间为:22/2/211[-,-][144.5 1.96 6.097][132.5503,156.4497]n n y z s y z s n N n Nαα-⨯+⨯=±⨯=(1)(1) 所以该小区平均的文化支出Y 的估计为144.5元,其95%的置信区间为 (132.55元,156.45元)。
2.6解:有题意可得:N =350,n =50, y =1120,2s =25600, 所以粮食总产量为:3501120392000()Y N y ∧==⨯=元 代入数据得:22/2/211[-,-][392000 1.967332.12][377629,406371]n n y z Ns y z N s n N n Nαα-⨯+⨯=±⨯=(1)(1) 所以总产值的95%的置信区间为:(377629吨,406371吨)。
2.7解:由题意可得:N =1000,d =2,α=0.05,2S =68,r=70%, 带入公式,可得初始样本量:222/2022222/2/21161.362Nz S d n N z S Nd z S ααα⎛⎫=+==≈ ⎪+⎝⎭ 由于有效回答率为r=70%,,对样本容量进行再调整:0070%87.5788nn n r===≈所以样本最终确定为88。
2.8解:由题意已知:N =100,n =10, X =2135,y =25,x =22, 方法一:简单随机估计:100252500()Y N y ∧==⨯=吨方法二:比估计:由经验可知去年的化肥总产量和今年的总产量之间存在较强的相关性,引入去年的化肥总产量作为辅助变量。
抽样技术简答题及答案
抽样技术各类简答题参考答案习题一1.请列举一些你所了解的以及被接受的抽样调查。
略2. 抽样调查基础理论及其意义;答:大数定律,中心极限定理,误差分布理论,概率理论。
大数定律是统计抽样调查的数理基础,也给统计学中的大量观察法提供了理论和数学方面的依据;中心极限定理说明,用样本平均值产生的概率来代替从总体中直接抽出来的样本计算的抽取样本的概率,为抽样推断奠定了科学的理论基础;认识抽样误差及其分布的目的是希望所设计的抽样方案所取得的绝大部分的估计量能较好的集中在总体指标的附近,通过计算抽样误差的极限是抽样误差处于被控制的状态;概率论作为数学的一个分支而引进统计学中,是统计学发展史上的重要事件。
3.抽样调查的特点。
答:1)随机抽样;2)以部分推断总体;3)存在抽样误差,但可计算,控制;4)速度快、周期短、精度高、费用低;5)抽样技术灵活多样;6)应用广泛。
4.样本可能数目及其意义;答:样本可能数目是在容量为N的总体中抽取容量为n的样本时,所有可能被抽中的不同样本的个数,用A表示。
意义:正确理解样本可能数目的概念,对于准确理解和把握抽样调查误差的计算,样本统计量的抽样分布、抽样估计的优良标准等一系列理论和方法问题都有十分重要的帮助。
5. 影响抽样误差的因素;答:抽样误差是用样本统计量推断总体参数时的误差,它属于一种代表性误差,在抽样调查中抽样误差是不可避免的,但可以计算,并且可以被控制在任意小的范围内;影响抽样误差的因素:1)有样本量大小,抽样误差通常会随着样本量的大小而增减,在某些情形下,抽样误差与样本量大小的平方根成反比关系;2)所研究现象总体变异程度的大小,一般而言,总体变异程度越大则抽样误差可能越大;3)抽样的方式方法,如放回抽样的误差大于不放回抽样,各种不同的抽样组织方式也常会有不同的抽样误差。
在实际工作中,样本量和抽样方式方法的影响是可以控制的,总体变异程度虽不可以控制,但却可通过设计一些复杂的抽样技术而将其影响加以控制。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.5解:已知
PQ (1) 由 n0 得: V ( p)
1 0
P1= 0.08, Q1= 1-P1 = 0.92; P2= 0.05, Q2 = 1– P2 = 0.95; V(p) = 0.05*0.05
,
0.08 0.92 n 30 2 0.05 Q 得: (2) 由 n0 2 Cv ( p) P
(2)事后分层
Ppst=ΣhWhph=0.7*1/43+0.3*2/57=0.0268 V(Ppst) =ΣhWh2[(1—fh)/(nh—1)]phqh =0.72*[1/42](1/43)(42/43)+0.32*[1/56](2/57)(55/57) =0.00031942
第五章 比率估计与回归估计
N1 的95%的置信区间为: (159,776)
(3)N=1750,n=30,n1=8, t=1.96, p=0.267, q=1-0.267=0.733 由此可计算得: t 2 q 1.962 0.733 n0 2 1054.64 r p 0.01 0.267
n = n0/[1+(n0—1)/N] = 1054.64/[1+1053.64/1750]=658.2942 = 659
21 22 23 24 25 26 27 28 29 30
49 45 95 36 25 45 128 45 数据,有:
1682 2 56.07(元), s y (118266 16822 / 30) / 30 798.73 yi 1682, y 30
回归系数 b = Sxy/Sxx2= 370.5965 ylr=x—b(x—X)=1260—370.5965*(2.97—460/140)=1377.089
Ylr=Nylr=192792.47(斤)
v(Ylr)=[N2(1—f)/n] *∑i=1n [yi—y—b(xi—x)]2/(n--2) =[1402(1—10/140)/80]*89480.59 = 20356834 se(Ylr)= 4511.855
故估计量 ylr 虽然与
一样都是 Y 的无偏估计, ylr
但方差不小于 ylr 的方差,
当 0时 V ( ylr ) V ( ylr ) ,
故 ylr 不优于
ylr。
第六章 不等概率抽样
6.1假设对某个总体,事先给定每个单位的与 规模成比例的比值 Zi ,如下表,试用代码 法抽出一个n=3的 PPS 样本。
0.92 n 4600 2 0.05 0.08
1 0
0.05 0.95 n 19 2 0.05
2 0
0.95 n 7600 2 0.05 0.05
2 0
第四章 分层抽样
4.3解:
s( yst ) 3.08 (元) (元) (1) yst 20.07 , (2)按比例分配 n=186,n1=57,n2=92,n3=37 (3)Neyman分配 n=175,n1=33,n2=99,n3=43 4.5 yst 75.79 ,置信区间(60.63,90.95)元。 (元)
1 f N n 1750 30 0.03276 b2 4ac n n N 30 1750
v( y ) 0.03276 798.73 26.168
se( y ) v( y ) 5.115
因此,对该校学生某月的人均购书支出额的估计为56.07 (元),由于置信度 95%对应的 t=1.96, 所以,可以以95%的把 , 握说该学生该月的人均购书支出额大约在56.07±1.96×5.115, 即50.96--61.19元之间。
1-f 1 N 1 n [Yi 2 B( X i X ) Y ]2 V ( y ) V { [ yi 2 B( xi X )]} = n N 1 i 1 n i 1
1 f 2 1 f 2 2 2 ( S Y 4 B S X 4 BS YX ) [ S Y 4 B( BS x2 S YX )] n n 1-f 2 1 f 2 SY S Y (1 2 ) V ( ylr ) n n
= 25149054
se(Ysrs)= 5014.883
面积/ 产量/ 亩 斤 3 1400 2.5 1120 4.2 1710 3.6 1500 1.8 720 5.2 1980 3.2 1310 2.4 1080 2.6 1300 1.2 480 29.7 12600
5.6 解 (3) 回归估计:
3.3为调查某中学学生的每月购书支出水平,在全校 名学生中,用不放回简单随机抽样的方法抽得一 个的样本。对每个抽中的学生调查其上个月的购 书支出金额 yi (如表1所示)。 (1)在95%的置信度下估计该校学生该月平均购书支 出额; (2)试估计该校学生该月购书支出超出70元的人数; (3)如果要求相对误差限不超过10%,以95%的置信 度估计该校学生该月购书支出超出70元的人数比 例,样本量至少应为多少。
5.7解:
n 1 n ylr ylr B( X x ) y 2 B( X x ) [ yi 2 B( xi X )] n i 1 E ( ylr ) E ( ylr ) B[ X E ( x )] Y
lr
E ( ylr ) Y , V ( ylr ) 1 f SY2 (1 2 )
表2 子公司 序号 1 2 3 4 某企业各子公司上年与当年利润(单位:万元)
t=1.96 (2)易知,N=1750,n=30, n1 8 n 8 1 f N n 1750 30 p 1 0.267 0.03389 n 1 (n 1) N 29 1750 n 30
pq p(1 p) 0.267 0.733 0.1957
表1 总体单位规模比值
i
1
zi
0.098
i
6
zi
0.067
2
3 4
0.102
0.057 0.251
7
8 9
0.048
0.154 0.223
6.1解:令 M 0 1000 ,则可以得到下表,从1-1000中 产生n=3个随机数,设为108,597,754,则第二、 第六和第七个单位入样。
i
1 2 3 4 5 6 7 8
C X 时用第一种方法,当 2CY
CX 2CY时用第二种
2CY y 1 f 2 2 1 f 2 2 1 f 2 1 f 2 2, V ( ) Y CY R CY 2 V ( y) SY Y CY X nX n n n
,
若
y ˆ ) 1 f R 2 (C 2 C 2 2 C C ) V ( ) V (R Y X Y X x n y y 1 f 2 CX
(1 f ) pq 0.03389 0.1957 0.08144 n 1
1 0.0167 2n
P
的95%的置信区间为:
1
p (u
2
(1 f ) pq 1 ) 0.267 (1.96 0.08144 0.0167) n 1 2n
=(0.0907,0.4433)
5.2 N=2000, n=36, 1-α =0.95, t=1.96, ˆ ) 0.000015359, f = n/N=0.018, v( R ˆ ) =0.00392 se( R 置信区间为[40.93%,42.47%]。
第五章 比率估计与回归估计
5.3当 方法,当 = C X 时两种方法都可使用。这是因为:
表1
样本 序号
30名学生某月购书支出金额的样本数据
支出额 (元) 样本 序号 支出额 (元) 样本 序号 支出额 (元)
1 2 3 4 5 6 7 8 9 10
85 62 42 15 50 39 83 65 32 46
11 12 13 14 15 16 17 18 19 20
20 75 34 41 58 63 95 120 19 57
Mi
98 102 57 251 67 48 154 223
累计Mi
代码
98 200 257 508 575 623 777 1000
1~98 99~200 201~257 258~508 509~575 576~623 627~777 778~1000
Σ
M0=1000
—
—
6.3欲估计某大型企业年度总利润,已知该企业 有8个子公司,下表是各子公司上年利润Xi 和当年利润 Yi 的数据,以Mi作为单位Xi大小 的度量,对子公司进行PPS 抽样,设n=3,试与 简单随机抽样作精度比较。
﹥0
5.4 解:
V(YR)≈[(1—f)/n]Y2[CY2+CX2—2rCYCX] V(Ysrs)=[(1—f)/n]SY2
故
=[(1—f)/n] CY2Y2
V(YR)/V(Ysrs) = 1—[2rCX/CY—CX2/CY2]
= 1-[2*0.696*1.054/1.063-1.0542/1.0632]
4.6 解 已知W1=0.2,W2=0.3,W3=0.5, P1=0.1,P2=0.2,P3=0.4 P=ΣhWhPh=0.28,Q=1—P=0.72 n=100的简单随机抽样估计方差:
V(Psrs) ≈ [(1—f ’)/100]PQ ≈ 0.28*0.72/100
= 0.002016 按比例分配的分层抽样的估计方差:
V(Pprop) ≈ΣhWh2 [(1—fh)/nh] Ph Qh
≈ n-1ΣhWh Ph Qh = n-1[0.2*0.1*0.9+0.3*0.2*0.8+0.5*0.4*0.6]