应用抽样技术答案
抽样技术课后习题_参考答案_金勇进
第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。
解析:由已知得:10000=N 200=n 35.0=p 02.0==Nnf 又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。
应用抽样技术课后习题答案
=(0.0907,0.4433)
N1的95%的置信区间为: (159,776) 95%的置信区间为 (159, 的置信区间为:
(3)N=1750,n=30, (3)N=1750,n=30,n1=8, t=1.96, p=0.267, q=1q=1-0.267=0.733 由此可计算得: t 2q 1.962 × 0.733 n0 = 2 = =1054.64 r p 0.01× 0.267 n = n0/[1+(n0—1)/N] = 1054.64/[1+1053.64/1750]=658.2942 = 659 计算结果说明,至少应抽取一个样本量为659的简单随机 样本,才能满足95%置信度条件下相对误差不超过10%的精度 要求。
t=1.96 (2)易知,N=1750,n=30, n = 8 1 n 8 N − n 1750 − 30 1− f p= 1 = = 0.267 = = = 0.03389 n −1 (n −1)N 29 ×1750 n 30
pq = p(1 − p) = 0.267 × 0.733 = 0.1957
5.5 证明:由(5.6)得:
V ( yR ) ≈ 1− f n (Yi − RX i )2 ∑
i =1 N
N −n 2 令 Sd = V , Nn
2 d
N −1
=
N −n 2 Sd Nn
则n(NV + S ) = NS ,
2 d
S 2 NSd 从而n = = V 2 2 NV + Sd Sd 1+ NV
第五章 比率估计与回归估计
5.2 N=2000, n=36, 1-α=0.95, t=1.96, ˆ f = n/N=0.018, v(R) = 0.000015359, ˆ se(R) =0.00392 置信区间为[40.93%,42.47%]。 置信区间为[40.93%,42.47%]。
应用抽样技术练习题答案
应用抽样技术练习题答案一、选择题1. 抽样技术在统计分析中的主要作用是什么?A. 预测未来趋势B. 代表总体特征C. 描述个体差异D. 计算平均值答案:B2. 以下哪项不是抽样误差的来源?A. 抽样方法B. 抽样框的不完整性C. 抽样过程中的随机性D. 样本量的大小答案:D3. 简单随机抽样的特点是什么?A. 每个个体被抽中的概率相同B. 样本量必须很大C. 需要分层抽样D. 只能用于总体较小的情况答案:A4. 分层抽样的优点是什么?A. 可以减少抽样误差B. 可以增加样本量C. 可以提高总体的代表性D. 可以降低抽样成本答案:A5. 系统抽样的特点是什么?A. 抽样间隔是固定的B. 抽样间隔是随机的C. 需要分层D. 需要配额答案:A二、判断题1. 抽样调查总是比全面调查更经济。
(错误)2. 抽样调查的目的是估计总体参数。
(正确)3. 抽样调查中,样本量越大,抽样误差就越小。
(错误)4. 抽样框是抽样调查中用来记录所有个体的列表。
(正确)5. 抽样技术只能用于定量研究。
(错误)三、简答题1. 请简述分层抽样的步骤。
答案:分层抽样的步骤包括:(1)确定总体并将其分为互不重叠的子群体,即层;(2)在每个层中独立地进行抽样;(3)将各层的样本合并,形成总体的代表性样本。
2. 为什么在抽样调查中需要考虑样本的代表性?答案:样本的代表性意味着样本能够反映总体的特征。
如果样本具有代表性,那么从样本中得到的统计推断将更接近总体的真实情况,从而提高研究的准确性和可靠性。
四、计算题1. 假设一个总体有1000个个体,我们使用简单随机抽样方法抽取了50个个体作为样本。
计算样本比例的抽样误差。
答案:抽样误差可以通过以下公式计算:\( \text{抽样误差} = Z\times \sqrt{\frac{p(1-p)}{n}} \),其中\( Z \)是标准正态分布的置信水平对应的Z值(例如,95%置信水平对应的Z值为1.96),\( p \)是总体比例(由于我们不知道总体比例,这里假设为0.5,此时抽样误差最大),\( n \)是样本量。
抽样技术第二章参考答案
抽样技术第⼆章参考答案第⼆章习题判断下列抽样⽅法是否是等概的:(1)总体编号1~64,在0~99中产⽣随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产⽣随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产⽣随机数r 。
然后⽤r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有⼀些⼏个特点:第⼀,按照⼀定的概率以随机原则抽取样本。
第⼆,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当⽤样本对总体⽬标进⾏估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同解析:抽样理论和数理统计中关于样本均值的定义和性质的不同为了合理调配电⼒资源,某市欲了解50000户居民的⽇⽤电量,从中简单随机抽取了300户进⾏,现得到其⽇⽤电平均值=y (千⽡时),=2s 206.试估计该市居民⽤电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量⾄少应为多少解:由已知可得,N=50000,n=300,5.9y =,2062=s1706366666206*300500003001500001)()?(222=-=-==s nf N y N v YV19.413081706366666(==)y v该市居民⽤电量的95%置信区间为[])(y [2y V z N α±=[475000±*]即为(,)由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤-即n ≥862欲使相对误差限不超过10%,则样本量⾄少应为862某⼤学10000名本科⽣,现欲估计爱暑假期间参加了各类英语培训的学⽣所占的⽐例。
应用抽样技术答案
N
1750
3.4
(1) N 200000
n 70
n1 6
1 f 1 1 0.01449 n 1 n 1 70 1
该地区拥有私人汽车的比例估计: p n1 6 0.086 n 70
q 1 p 1 0.086 0.914 pq 0.0860.914 0.0786
4.5 依题意,可算得样本量 n = 200,并有如下表数据
1
2
3
4
5
6
7
8
9
10
Total
Wh yh 7.298 3.64 13.974 4.256 11.446 9.164 14.11 5.096 3.168 3.64 75.792
Whsh2 904.05 355.94 4739.65 526.90 1325.85 918.84 2132.48 522.24 170.37 295.75 11892.07 故可得
2658
������ℎ = ������������ℎ
������1 ≈ 478 ������2 ≈ 558 ������3 ≈ 373 按尼曼分配时
n
=
������
������ℎ +
������ℎ ������ℎ 2 ������ℎ ������ℎ ������ℎ
������
≈
2561
������4 ≈ 239 ������5 ≈ 425
1750(0.0907, 0.4433) (159, 776)
(3)
n0
t2q 2p
1.962 (1 0.267) 0.12 0.267
1054.64
可得最少的样本量: n n0 1054.64 658.2948 659 。
抽样技术第四习题答案
第2章2.1 解:()1 这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是1100。
()2这种抽样方法不是等概率的。
利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是2100,而尚未被抽中的编号为36~63的每个单元的入样概率都是1100。
()3这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是11000,所以这种抽样是等概率的。
2.3 解:首先估计该市居民日用电量的95%的置信区间。
根据中心极限定理可知,在大_y E y y -=近似服从标准正态分布, _Y 的195%α-=的置信区间为y z y z y y αα⎡⎡-+=-+⎣⎣。
而()21f V y S n-=中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间为,y y ⎡⎤-+⎢⎥⎣⎦。
由题意知道,_29.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得 _21130050000()2060.6825300f v y s n --==⨯=。
将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192⎡⎤⎣⎦。
下一步计算样本量。
绝对误差限d 和相对误差限r 的关系为_d rY =。
根据置信区间的求解方法可知____11P y Y r Y P αα⎫⎪⎧⎫-≤≥-⇒≤≥-⎨⎬⎩⎭根据正态分布的分位数可以知道1P Z αα⎫⎪⎪≤≥-⎬⎪⎪⎭,所以()2_2r Y V y z α⎛⎫⎪= ⎪⎝⎭。
也就是2_2_222/221111r Y r Y S n N z S n N z αα⎡⎤⎛⎫⎢⎥⎛⎫⎪⎛⎫⎝⎭⎪⎢⎥-=⇒=+ ⎪ ⎪⎢⎥⎝⎭⎝⎭⎢⎥⎣⎦。
把_29.5,206,10%,50000y s r N ====代入上式可得,861.75862n =≈。
《抽样技术》习题答案(答案参考)
第2章项目相同之处不同之处定义都是根据从一个总体中抽样得到的样本,然后定义样本均值为_11ni i y y n ==∑。
抽样理论中样本是从有限总体中按放回的抽样方法得到的,样本中的样本点不会重复;而数理统计中的样本是从无限总体中利用有放回的抽样方法得到的,样本点有可能是重复的。
性质(1) 样本均值的期望都等于总体均值,也就是抽样理论和数理统计中的样本均值都是无偏估计。
(2) 不论总体原来是何种分布,在样本量足够大的条件下,样本均值近似服从正态分布。
(1) 抽样理论中,各个样本之间是不独立的;而数理统计中的各个样本之间是相互独立的。
(2) 抽样理论中的样本均值的方差为()21f V y S n -=,其中2_211i S Y Y N ⎛⎫=- ⎪-⎝⎭∑。
在数理统计中,()21V y nσ=,其中2σ为总体的方差。
2.3 解:首先估计该市居民日用电量的95%的置信区间。
根据中心极限定理可知,在大样本的条件下,()()_y E y y V y V y -=近似服从标准正态分布, _Y 的195%α-=的置信区间为()()()(), 1.96, 1.96y z V y y z V y y V y y V y αα⎡⎡-+=-+⎣⎣。
而()21f V y S n-=中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间为111.96, 1.96f fy s y s n n ⎡⎤---+⎢⎥⎣⎦由题意知道,_29.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得_21130050000()2060.6825300f v y s n --==⨯=。
将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192⎡⎤⎣⎦。
下一步计算样本量。
绝对误差限d 和相对误差限r 的关系为_d rY =。
根据置信区间的求解方法可知()()______11y Y P y Y r Y P V y V y αα⎧⎫-⎪⎪⎧⎫⎪-≤≥-⇒≤≥-⎨⎬⎨⎩⎭⎪⎪根据正态分布的分位数可以知道()__1y Y P Z V y αα⎫-⎪⎪≤≥-⎬⎪⎪⎭,所以()2_2r Y V y z α⎛⎫⎪= ⎪⎝⎭。
抽样技术练习题及答案
1.请列举一些你所了解的以及被接受的抽样调查。
2.抽样调查基础理论及其意义;3.抽样调查的特点。
4.样本可能数目及其意义;5.影响抽样误差的因素;6.某个总体抽取一个n=50的独立同分布样本,样本数据如下:567 601 665 732 366 937 462 619 279 287690 520 502 312 452 562 557 574 350 875834 203 593 980 172 287 753 259 276 876692 371 887 641 399 442 927 442 918 11178 416 405 210 58 797 746 153 644 4761)计算样本均值y与样本方差s2;2)若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式;3)根据上述样本数据,如何估计v(y)?4)假定y的分布是近似正态的,试分别给出总体均值μ的置信度为80%,90%,95%,99%的(近似)置信区间。
一判断题1 普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。
2 概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。
3 抽样单元与总体单元是一致的。
4 偏倚是由于系统性因素产生的。
5 在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。
6 偏倚与抽样误差一样都是由于抽样的随机性产生的。
7 偏倚与抽样误差一样都随样本量的增大而减小。
8 抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。
9 抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。
10 总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。
11 一个抽样设计方案比另一个抽样设计方案好,是因为它的估计量方差小。
12 抽样误差在概率抽样中可以对其进行计量并加以控制,随着样本量的增大抽样误差会越来越小,随着n越来越接近N,抽样误差几乎可以消除。
《抽样技术》练习题及标准答案
《抽样技术》练习题及答案————————————————————————————————作者:————————————————————————————————日期:习题一1.请列举一些你所了解的以及被接受的抽样调查。
2.抽样调查基础理论及其意义;3.抽样调查的特点。
4.样本可能数目及其意义;5.影响抽样误差的因素;6.某个总体抽取一个n=50的独立同分布样本,样本数据如下:567 601 665 732 366 937 462 619 279 287690 520 502 312 452 562 557 574 350 875834 203 593 980 172 287 753 259 276 876692 371 887 641 399 442 927 442 918 11178 416 405 210 58 797 746 153 644 4761)计算样本均值y与样本方差s2;2)若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式;3)根据上述样本数据,如何估计v(y)?4)假定y的分布是近似正态的,试分别给出总体均值μ的置信度为80%,90%,95%,99%的(近似)置信区间。
习题二一判断题1 普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。
2 概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。
3 抽样单元与总体单元是一致的。
4 偏倚是由于系统性因素产生的。
5 在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。
6 偏倚与抽样误差一样都是由于抽样的随机性产生的。
7 偏倚与抽样误差一样都随样本量的增大而减小。
8 抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。
9 抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。
10 总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。
统计基础单元测试第四章抽样技术含答案8K
统计基础单元测试第四章抽样技术一、单项选择题(10题20分)1.在抽样推断中,必须遵循( )抽取样本A.随意原则B.随机原则C.可比性原则D.对等原则2.能够事先加以计算和控制的误差是A.抽样误差B.登记误差C.系统误差D.测量误差3.抽样极限误差与抽样平均误差数值之间的关系是A.前者一定小于后者B.前者一定大于后者C.前者一定等于后者D.以上三种情况都有可能4.某企业连续性生产,为检验产品质量,在24小时中每隔半小时抽取一分钟产品进行检验,这是A.整群抽样B.简单随机抽样C.类型抽样D.纯随机抽样5.概率和概率度之间的对应关系是A.前者大于后者B.前者小于后者C.确定性关系D.不确定6.现随机从某批次日兴灯产品中抽取100件产品,测得平均寿命为2000小时,则样本平均A.100小时B.2000小时C.1900小时D.2100小时7.现随机从某批次日兴灯产品中抽取100件产品,其中优质品率为98%,则样本优质品的成数为A.100%B.98%C.2%D.无法计算8.抽样平均误差反映了样本指标与总体指标间的A.可能误差范围B.平均误差程度C.实际误差D.实际误差的绝对值9.在实际工作中,不重复抽样的平均抽样误差的计算,采用重复抽样的公式的情况是A.n占N比重很小时B.n占N比重很大时C.n很小时D.n很大时10.点估计A.不考虑抽样误差及可靠程度B.考虑抽样误差及可靠程度C.适用于推断的准确性要求高的情况D.无需考虑有效性和一致性二、多项选择题(8题24分)1.以下关于抽样调查说法正确的是A.必须遵循随机性原则B.能以样本数据估计总体数C.能节约调查成本D.需要大量调查经费2.总体A.可以是有限总体B.可以是无限总体C.可以抽取多个样本D.其容量用N表示3.从总体中抽取样本单位的方法有A.随机抽样B.重复抽样C.类型抽样D.不重复抽样4.影响抽样误差的主要因素有A.必须抽样数目的多少B.总体标志变异程度的大小C.不同的抽样组织形式D.抽样周期的长短5.要提高抽样推断的精确度,可采用的方法有A.增加样本单位数目B.减少样本单位数目C.缩小总体被研究标志的变异程度D.改变抽样组织方式6.以下相关公式正确的有A.xμ= B.pμC.pμxμ7.在总体1000个单位中,随机抽取100个单位进行调查,则下列说法正确的是A.样本个数是100个B.样本容量是100个C.是一个大样本D.是一个有100个单位的样本8.对总体平均数进行区间估计时必须掌握的基本数据有A.样本平均数B.样本平均数的抽样误差C.抽样间隔数D.概率度t三、填空题(10题10分)1.概率抽样的组织方式主要简单随机抽样、系统随机抽样、分层抽样和整群抽样等2.通常当样本容量小于30时,称为小3.在抽样调查中,按照随机原则从总体中抽取的那部分组成的整体叫做样本4.总体参数估计的方法有点估计和区间估计两种5.抽样极限误差反映了样本指标与总体指标之间的抽样误差的可能范围6.总体参数通常是一个定值(常量),而样本统计量则随机变量7.总体指标的区间估计必须具备样本指标、抽样平均误差和概率度三个素8.在简单重复抽样条件下,如果其他条件保持不变,仅将误差范围缩小二分之一,则样本容量必须扩大为原来的4倍;若将误差范围扩大一倍,则抽样单位数目将缩小为原来的四分之一四、简答题(10分)1.什么是抽样平均误差?影响抽样平均误差的因素有哪些?答:抽样平均误差是指所有样本指标数值与总体指标数值之差的平均数,即所有样本的抽样估计误差与被估计的未知的真实总体参数值之差的平均数。
抽样技术课后习题_参考答案_金勇进
第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。
解析:由已知得:10000=N 200=n 35.0=p 02.0==Nnf 又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。
抽样技术A卷答案
抽样技术A 卷答案一、单项选择题(本大题共5道小题,每题2分,共10分) 下列各题A)、B )、C )、D )四个选项中,只有一个选项是正确的。
1.下面四个关系式中哪一个是正确的?(A )A.()()()2MSE x V x B E x =+B.()V x =()MSE x +()2BE xC.()MSE x =()V x +()B E x D.()2BE x =()MSE x +()V x2.(B )是总体里最小的、不可再分的单元。
A.抽样单元B.基本单元C.初级单元D.次级单元 3.下面哪种抽样方法是最简单的概率抽样方法(A )。
A.简单随机抽样B.分层随机抽样C.系统抽样D.整群抽样 4.抽样比的计算公式为(B )。
A.()()11f n N =-- B.f n N = C.()1f n N =- D.()f N n N =-5.关于简单随机抽样的核心定理,下面表达式正确的是(A )。
A.()21f V y S n -=B.()211f V y S n -=-C.()21V y S n =D.()21f V y s n-= 6. 下面关于各种抽样方法的设计效应,表述错误的是(B )。
A.简单随机抽样的deff=1B.分层随机抽样的def f ﹥1C.整群随机抽样的def f ﹥1D.机械随机抽样的def f ≈17.假设考虑了有效回答率之外所有其他因素后的初始样本量为400,而预计有效回答率为80﹪,那么样本量则应定为(B )。
A.320B.500C.400D.4808.在要求的精度水平下,不考虑其他因素的影响,若简单随机抽样所需要的样本量为300,分层随机抽样的设计效应deff=0.8,那么若想达到相同的精度,分层随机抽样所需要的样本量为(C )。
A.375B.540C.240D.360 9.分层抽样设计效应满足(B )。
A.1deff = B.1deff C.1deff ≈ D.1deff 10.下面哪种样本量分配方式属于比例分配?(A ) A.h h n n N N = B.h n n =1h h N S =∑ C.hn n=1h hLhhh N S N S=∑ D.h n n=1h h L h hh W S W S =∑ 二、多项选择题(每题3分,共15分)下列各题A )、B )、C )、D )、E )五个选项中,至少有两个答案是正确的 11.常用的构造估计量的方法有(AC )。
抽样技术A卷答案
11.常用的构造估计量的方法有( AC )。
抽样技术A 卷答案一、单项选择题 (本大题共5道小题,每题2分,共10分) 下列各题A )、B )、C )、D )四个选项中,只有一个选项是正确的。
1. 下面四个关系式中哪一个是正确的? ( A )— _ 2 —A. MSE (X )=V (x ) +B 2(E X )— _ 2 —B. V (X 尸 MSE (X )+ B (Ex )C. MSE(x)=V(x)+ B(Ex )D. B 2(EX )= MSE (I )+V (x )2. ( B )是总体里最小的、不可再分的单元。
A.抽样单元B.基本单元C.初级单元D.次级单元3. 下面哪种抽样方法是最简单的概率抽样方法( A.简单随机抽样B.分层随机抽样C.系统抽样D.整群抽样4. 抽样比的计算公式为(B )。
=仆 C. f =(n -1 /N D. f = (N -n y NA )。
A. f =(n -1 y(N -1 )B. f,下面表达式正确的是(A )。
1 — f2 — 1 2 — 1 — f 2 S C.V (y ) = —S D.V (y )= s nn-1 n n6. 下面关于各种抽样方法的设计效应,表述错误的是( A.简单随机抽样的deff=1B.分层随机抽样的deff > 1C.整群随机抽样的deff > 1D.机械随机抽样的deff -17. 假设考虑了有效回答率之外所有其他因素后的初始样本量为 为80%,那么样本量则应定为(B )。
A.320B.500C.400D.4808. 在要求的精度水平下,不考虑其他因素的影响,若简单随机抽样所需要的样本量为 300,分层随机抽样的设计效应 deff=0.8 需要的样本量为(C )。
A.375B.540C.2409. 分层抽样设计效应满足(5.关于简单随机抽样的核心定理 *)=斗2B.V (;>D.360 B)。
B )。
应用抽样技术答案
第二章2.1判断题:(1)错;(2)错;(3)对;(4)错;(5)错;(6)错;(7)错;(8)错;(9)对;(10)对;(11)错;(12)错;(13)错。
2.3选择题:(1)b ;(2)b ;(3)d ;(4)c ;(5)c 。
2.7(1)抽样分布:(2)期望为5,方差为4/3 (3)抽样标准误 = = 1.155 (4)抽样极限误差 = 1.96*1.155 = 2.263(5)置信区间 = (5.67-2.263, 5.67+2.263) =(3.407, 7.933)。
若区间两端只考虑抽样分布的可能性取值,则可得该抽样分布作为离散分布的置信区间为[3, 7]第三章3.1 判断题是否为等概率抽样:(1)是;(2)否;(3)是;(4)否。
3.2 (1)5.51==∑iYNY25.6)(122=-=∑Y Y Niσ33.8)(1122=--=∑Y Y N S i (2)样本:(2, 5) (2, 6) (2, 9) (5, 6) (5, 9) (6, 9)()()5.55.775.55.545.361=+++++=∑y E ()∑=+++++=33.8)5.485.05.2485.4(612s E3.3(1) 1682=∑i y 1182662=∑i y03276.0301750/3011=-=-n f 760.5630/1682==y127.8261302^067.503011826611)(11212212=-⨯-=⎪⎭⎫ ⎝⎛--=--=∑∑==y n y n y y n s n i in i i ()07.27271.82603276.012=⨯=-=s nf y v ()203.5)(==y v y se198.10203.596.1)(=⨯=⨯=∆y se t95%置信度下置信区间为(56.067-10.198, 56.067+10.198)=(45.869, 66.265). 因此,对该校学生某月的人均购书支出额的估计为56.07(元),由于置信度95%对应的96.1=t ,所以,可以以95%的把握说该学生该月的人均购书支出额大约在45.87~66.27元之间。
抽样技术 第三版 第二章课后部分答案 R语言
抽样技术作业一(2.5——2.10)袁闪闪 21205021192.5 解:这里N =200,n =20,由表中的数据可得:2011221211144.5201()826.052611()- 6.097n i i i i n i i y y y n s y y n nv y s n N=======-=-=⨯=∑∑∑(1) 因而该小区平均的文化支出Y 的95%的近似置信区间为:22/2/211[-,-][144.5 1.96 6.097][132.5503,156.4497]n n y z s y z s n N n Nαα-⨯+⨯=±⨯=(1)(1) 所以该小区平均的文化支出Y 的估计为144.5元,其95%的置信区间为 (132.55元,156.45元)。
2.6解:有题意可得:N =350,n =50, y =1120,2s =25600, 所以粮食总产量为:3501120392000()Y N y ∧==⨯=元 代入数据得:22/2/211[-,-][392000 1.967332.12][377629,406371]n n y z Ns y z N s n N n Nαα-⨯+⨯=±⨯=(1)(1) 所以总产值的95%的置信区间为:(377629吨,406371吨)。
2.7解:由题意可得:N =1000,d =2,α=0.05,2S =68,r=70%, 带入公式,可得初始样本量:222/2022222/2/21161.362Nz S d n N z S Nd z S ααα⎛⎫=+==≈ ⎪+⎝⎭ 由于有效回答率为r=70%,,对样本容量进行再调整:0070%87.5788nn n r===≈所以样本最终确定为88。
2.8解:由题意已知:N =100,n =10, X =2135,y =25,x =22, 方法一:简单随机估计:100252500()Y N y ∧==⨯=吨方法二:比估计:由经验可知去年的化肥总产量和今年的总产量之间存在较强的相关性,引入去年的化肥总产量作为辅助变量。
抽样技术简答题参考答案
简答题参考答案习题一1.请列举一些你所了解的以及被接受的抽样调查。
略2. 抽样调查基础理论及其意义;答:大数定律,中心极限定理,误差分布理论,概率理论。
大数定律是统计抽样调查的数理基础,也给统计学中的大量观察法提供了理论和数学方面的依据;中心极限定理说明,用样本平均值产生的概率来代替从总体中直接抽出来的样本计算的抽取样本的概率,为抽样推断奠定了科学的理论基础;认识抽样误差及其分布的目的是希望所设计的抽样方案所取得的绝大部分的估计量能较好的集中在总体指标的附近,通过计算抽样误差的极限是抽样误差处于被控制的状态;概率论作为数学的一个分支而引进统计学中,是统计学发展史上的重要事件。
3.抽样调查的特点。
答:1)随机抽样;2)以部分推断总体;3)存在抽样误差,但可计算,控制;4)速度快、周期短、精度高、费用低;5)抽样技术灵活多样;6)应用广泛。
4.样本可能数目及其意义;答:样本可能数目是在容量为N的总体中抽取容量为n的样本时,所有可能被抽中的不同样本的个数,用A表示。
意义:正确理解样本可能数目的概念,对于准确理解和把握抽样调查误差的计算,样本统计量的抽样分布、抽样估计的优良标准等一系列理论和方法问题都有十分重要的帮助。
5. 影响抽样误差的因素;答:抽样误差是用样本统计量推断总体参数时的误差,它属于一种代表性误差,在抽样调查中抽样误差是不可避免的,但可以计算,并且可以被控制在任意小的范围内;影响抽样误差的因素:1)有样本量大小,抽样误差通常会随着样本量的大小而增减,在某些情形下,抽样误差与样本量大小的平方根成反比关系;2)所研究现象总体变异程度的大小,一般而言,总体变异程度越大则抽样误差可能越大;3)抽样的方式方法,如放回抽样的误差大于不放回抽样,各种不同的抽样组织方式也常会有不同的抽样误差。
在实际工作中,样本量和抽样方式方法的影响是可以控制的,总体变异程度虽不可以控制,但却可通过设计一些复杂的抽样技术而将其影响加以控制。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章2.1判断题:(1)错;(2)错;(3)对;(4)错;(5)错;(6)错;(7)错;(8)错;(9)对;(10)对;(11)错;(12)错;(13)错。
2.3选择题:(1)b ;(2)b ;(3)d ;(4)c ;(5)c 。
2.7(133.674.33 55.676.33 71/10 1/10 2/10 2/10 2/10 1/10 1/10(2)期望为5,方差为4/3 (3)抽样标准误 == 1.155(4)抽样极限误差 = 1.96*1.155 = 2.263(5)置信区间 = (5.67-2.263, 5.67+2.263) =(3.407, 7.933)。
若区间两端只考虑抽样分布的可能性取值,则可得该抽样分布作为离散分布的置信区间为[3, 7]第三章3.1 判断题是否为等概率抽样:(1)是;(2)否;(3)是;(4)否。
3.2 (1)5.51==∑i Y NY 25.6)(122=-=∑Y Y Ni σ 33.8)(1122=--=∑Y Y N S i (2)样本:(2, 5) (2, 6) (2, 9) (5, 6) (5, 9) (6, 9)()()5.55.775.55.545.361=+++++=∑y E ()∑=+++++=33.8)5.485.05.2485.4(612s E3.3(1)1682=∑i y 1182662=∑i y03276.0301750/3011=-=-n f 760.5630/1682==y127.8261302^067.503011826611)(11212212=-⨯-=⎪⎭⎫ ⎝⎛--=--=∑∑==y n y n y y n s n i in i i ()07.27271.82603276.012=⨯=-=s nf y v ()203.5)(==y v y se198.10203.596.1)(=⨯=⨯=∆y se t95%置信度下置信区间为(56.067-10.198, 56.067+10.198)=(45.869, 66.265). 因此,对该校学生某月的人均购书支出额的估计为56.07(元),由于置信度95%对应的96.1=t ,所以,可以以95%的把握说该学生该月的人均购书支出额大约在45.87~66.27元之间。
(2) 易知N =1750, n =30,=8,t =1.96 267.03081===n n p 03389.01301750/30111=--=--n f 1957.0)267.01(267.0)1(=-⨯=-=p p pq08144.0957.003389.01)1()(=⨯=--=n pq f p v 0167.0302121=⨯=nP 的95%的置信区间为:())4433.0,0907.0(0167.008114.096.1267.0211)1(=+⨯±=⎪⎪⎭⎫⎝⎛+--±n n pq f t p 则1N 的估计值为46725.467ˆ1≈==Np N ,其95%的置信区间为: )776,159()4433.0,0907.0(1750=⨯(3)64.1054267.01.0)267.01(96.122220=⨯-⨯==p q t n γ可得最少的样本量:6592948.6581750164.1054164.10541100≈=--=--=Nn n n 。
3.4(1)000020=N 70=n 61=n01449.017011111=-=-≈--n n f 该地区拥有私人汽车的比例估计:086.07061===n n p 914.0086.011=-=-=p q 0786.0914.0086.0=⨯=pq 因而比例估计的标准差:0338.0914.0086.001449.01)1()(=⨯⨯=--=n pqf p se(2) t =1.96 %5=∆12179.12005.00786.096.122220≈=⨯=∆=pq t n 由于N 很大,最少的样本量12111000≈≈--=n Nn n n 。
3.5已知08.01=P 92.01=Q 05.02=P 95.02=Q 205.0=V 05.0=CV 要得到相同的标准差0.05,则所需的样本量由)(0P V PQn =得: 3044.2905.092.008.0210≈=⨯=n 1905.095.005.022=⨯=n 要得到相同的变异系数0.05,则所需的样本量由PP CV Qn )(20=得:460008.005.092.0210=⨯=n 760005.005.095.022=⨯=n 。
第四章4.3购买彩票的平均支出:(元)2621.2131≈=∑=h h h st y W y方差估计量:3104.11)1()(2312≈-=∑=h hh h h st n s f W y v标准差:3631.33104.11)()(≈≈=st st y v y se (2) t =1.96 %10=γ1768.196.12621.211.022=⎪⎭⎫ ⎝⎛⨯=⎪⎪⎭⎫ ⎝⎛=tYV γ 1395.348231=∑=hh h sW按比例分配时:84.2951768.11395.3482310===∑=VsW n hh h所需样本量为22005.21984484.295184.295100≈=+=+=Nn n n 各层样本量;674431.662203033.011≈=⨯==n W n 1090083.1092204976.022≈=⨯==n W n 446033.432201991.033≈=⨯==n W n 按尼曼分配时:9470.294.40000.303311=⨯=s W 6550.8302.50000.497622=⨯=s W7995.5848.88890.199133=⨯=s W4016.177995.56550.89470.231=++=∑=hh h sW所需样本量为19154.190844/1395.3481768.14016.17/)()(222≈=+=+=∑∑N s W V s W n h h h h 各层样本量;322680.324016.179470.2191111≈=⨯==∑hh s W s W nn 957672.944016.176550.8191222≈=⨯==∑hh s W s W nn645010.634016.177995.5191333≈=⨯==∑hh s W s W n n4.4 h W h n h 在家人数n hi p h q h W h *p h1 0.18 30 27 0.9 0.1 0.162 0.000101 2 0.21 30 28 0.933333 0.066667 0.196 9.46E-05 3 0.14 30 27 0.9 0.1 0.126 6.08E-05 4 0.09 30 26 0.866667 0.133333 0.0783.23E-055 0.16 30 28 0.933333 0.066667 0.149333 5.49E-05 60.2230 29 0.966667 0.033333 0.212667 5.38E-05 合计0.9240.000397(2) 当按比例分配时,按尼曼分配时4.5依题意,可算得样本量n = 200,并有如下表数据1 2 3 4 5 6 7 8 9 10 Total h h y W7.2983.6413.9744.25611.4469.16414.115.0963.1683.6475.7922h h s W 904.05 355.94 4739.65 526.90 1325.85 918.84 2132.48 522.24 170.37 295.75 11892.07故可得平均支出的分层估计:79.75==∑h h y W y 其方差估计:46.5920007.118921)(2==≈∑h h s W n y v 标准差:71.74604.59)()(===y v y se95%的置信区间为:)91.90,68.60()71.796.179.75(=⨯±。
4.65.0,3.0,2.0321===W W W ? 4.0,2.0,1.0321===P P P28.0==∑h h P W P样本量为100的简单随机抽样估计方差:002016.011112=≈-≈-=PQ nPQ N N n S n f V按比例分配分层抽样的样本量为:26.92002016.0186.0002016.012.0048.0018.00==++==∑VQP W n hhh930≈≈n n4.6 另解 已知W 1=0.2,W 2=0.3,W 3=0.5, P 1=0.1,P 2=0.2,P 3=0.4 P=Σh W h P h =0.28,Q=1—P=0.72 n=100的简单随机抽样估计方差: V(P srs ) ≈ [(1—f ’)/100]PQ ≈ 0.28*0.72/100 = 0.002016 按比例分配的分层抽样的估计方差: V(P prop ) ≈Σh W h 2 [(1—f h )/n h ] P h Q h ≈ n -1Σh W h P h Q h= n -1[0.2*0.1*0.9+0.3*0.2*0.8+0.5*0.4*0.6] = 0.186 n -1 故 n ≈ 92.26 ≈93 4.8(1) 由题设,100=n 31=n 所以,对于差错率的简单估计:03.010031===n n p 97.01=-=p q0291.097.003.0=⨯=pq因而上述估计的标准差:0171.011000291.011)1()(=-=-≈--=n pq n pqf p se(2) 由题设取层权,3.0,7.0==B A W W 每层的差错率估计分别为:03509.0572,02326.043111======B B B A A A n n p n n p 差错率的事后分层估计:0268.0=+=B B A A pst p W p W p02326.012=-=A A A AA q p n n s03446.012=-=B B B BB q p n n s方差:000269.0])1()1[(1)(1)(22222=-+-++-=B B A A B B A A pst s W s W ns W s W n f p v 标准误:0164.0000269.0)()(===pst pst p v p se第五章5.1 记总产量为Y ,总播种面积为XX = 77 000 N = 200 n = 10095.010200/1011=-=-n f 2.142==∑i y y 2706==∑i x x 22.14=y6.270=x 22.23072=∑iy8183282=∑ix6.43330=∑i i y x6818.31)(11222=--=∑y n y n s i y 93.9564)(11222=--=∑x n x n s i x 0311.539)(11=--=∑x y n x y n s i i xy故有05255.027062.142ˆ===x y R总产量的比率估计:34.40467700005255.0ˆˆ=⨯==X R Y R其方差:173.5484)ˆ2ˆ()1(1)ˆ()1()ˆ(222222=-+-=---=∑yx x y i i R s R s R s nf N n x R y n f N Y v 总产量的简单估计:284422.14200ˆ=⨯==y N Y srs8.120390)1(1)()1()ˆ(2222=-=---=∑y i srs s nf N n y y n f N Y v比率估计的方差较小,因此效果较好。