抽样技术课后答案
应用抽样技术课后习题答案
![应用抽样技术课后习题答案](https://img.taocdn.com/s3/m/0ddc062a0066f5335a81210c.png)
=(0.0907,0.4433)
N1的95%的置信区间为: (159,776) 95%的置信区间为 (159, 的置信区间为:
(3)N=1750,n=30, (3)N=1750,n=30,n1=8, t=1.96, p=0.267, q=1q=1-0.267=0.733 由此可计算得: t 2q 1.962 × 0.733 n0 = 2 = =1054.64 r p 0.01× 0.267 n = n0/[1+(n0—1)/N] = 1054.64/[1+1053.64/1750]=658.2942 = 659 计算结果说明,至少应抽取一个样本量为659的简单随机 样本,才能满足95%置信度条件下相对误差不超过10%的精度 要求。
t=1.96 (2)易知,N=1750,n=30, n = 8 1 n 8 N − n 1750 − 30 1− f p= 1 = = 0.267 = = = 0.03389 n −1 (n −1)N 29 ×1750 n 30
pq = p(1 − p) = 0.267 × 0.733 = 0.1957
5.5 证明:由(5.6)得:
V ( yR ) ≈ 1− f n (Yi − RX i )2 ∑
i =1 N
N −n 2 令 Sd = V , Nn
2 d
N −1
=
N −n 2 Sd Nn
则n(NV + S ) = NS ,
2 d
S 2 NSd 从而n = = V 2 2 NV + Sd Sd 1+ NV
第五章 比率估计与回归估计
5.2 N=2000, n=36, 1-α=0.95, t=1.96, ˆ f = n/N=0.018, v(R) = 0.000015359, ˆ se(R) =0.00392 置信区间为[40.93%,42.47%]。 置信区间为[40.93%,42.47%]。
抽样技术第二章参考答案
![抽样技术第二章参考答案](https://img.taocdn.com/s3/m/b457d37aae1ffc4ffe4733687e21af45b307fed0.png)
抽样技术第⼆章参考答案第⼆章习题判断下列抽样⽅法是否是等概的:(1)总体编号1~64,在0~99中产⽣随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产⽣随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产⽣随机数r 。
然后⽤r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有⼀些⼏个特点:第⼀,按照⼀定的概率以随机原则抽取样本。
第⼆,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当⽤样本对总体⽬标进⾏估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同解析:抽样理论和数理统计中关于样本均值的定义和性质的不同为了合理调配电⼒资源,某市欲了解50000户居民的⽇⽤电量,从中简单随机抽取了300户进⾏,现得到其⽇⽤电平均值=y (千⽡时),=2s 206.试估计该市居民⽤电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量⾄少应为多少解:由已知可得,N=50000,n=300,5.9y =,2062=s1706366666206*300500003001500001)()?(222=-=-==s nf N y N v YV19.413081706366666(==)y v该市居民⽤电量的95%置信区间为[])(y [2y V z N α±=[475000±*]即为(,)由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤-即n ≥862欲使相对误差限不超过10%,则样本量⾄少应为862某⼤学10000名本科⽣,现欲估计爱暑假期间参加了各类英语培训的学⽣所占的⽐例。
应用抽样技术答案
![应用抽样技术答案](https://img.taocdn.com/s3/m/7bc46c91bceb19e8b8f6ba2f.png)
N
1750
3.4
(1) N 200000
n 70
n1 6
1 f 1 1 0.01449 n 1 n 1 70 1
该地区拥有私人汽车的比例估计: p n1 6 0.086 n 70
q 1 p 1 0.086 0.914 pq 0.0860.914 0.0786
4.5 依题意,可算得样本量 n = 200,并有如下表数据
1
2
3
4
5
6
7
8
9
10
Total
Wh yh 7.298 3.64 13.974 4.256 11.446 9.164 14.11 5.096 3.168 3.64 75.792
Whsh2 904.05 355.94 4739.65 526.90 1325.85 918.84 2132.48 522.24 170.37 295.75 11892.07 故可得
2658
������ℎ = ������������ℎ
������1 ≈ 478 ������2 ≈ 558 ������3 ≈ 373 按尼曼分配时
n
=
������
������ℎ +
������ℎ ������ℎ 2 ������ℎ ������ℎ ������ℎ
������
≈
2561
������4 ≈ 239 ������5 ≈ 425
1750(0.0907, 0.4433) (159, 776)
(3)
n0
t2q 2p
1.962 (1 0.267) 0.12 0.267
1054.64
可得最少的样本量: n n0 1054.64 658.2948 659 。
《抽样技术》习题答案(答案参考)
![《抽样技术》习题答案(答案参考)](https://img.taocdn.com/s3/m/8faeed4deff9aef8941e06e1.png)
第2章项目相同之处不同之处定义都是根据从一个总体中抽样得到的样本,然后定义样本均值为_11ni i y y n ==∑。
抽样理论中样本是从有限总体中按放回的抽样方法得到的,样本中的样本点不会重复;而数理统计中的样本是从无限总体中利用有放回的抽样方法得到的,样本点有可能是重复的。
性质(1) 样本均值的期望都等于总体均值,也就是抽样理论和数理统计中的样本均值都是无偏估计。
(2) 不论总体原来是何种分布,在样本量足够大的条件下,样本均值近似服从正态分布。
(1) 抽样理论中,各个样本之间是不独立的;而数理统计中的各个样本之间是相互独立的。
(2) 抽样理论中的样本均值的方差为()21f V y S n -=,其中2_211i S Y Y N ⎛⎫=- ⎪-⎝⎭∑。
在数理统计中,()21V y nσ=,其中2σ为总体的方差。
2.3 解:首先估计该市居民日用电量的95%的置信区间。
根据中心极限定理可知,在大样本的条件下,()()_y E y y V y V y -=近似服从标准正态分布, _Y 的195%α-=的置信区间为()()()(), 1.96, 1.96y z V y y z V y y V y y V y αα⎡⎡-+=-+⎣⎣。
而()21f V y S n-=中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间为111.96, 1.96f fy s y s n n ⎡⎤---+⎢⎥⎣⎦由题意知道,_29.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得_21130050000()2060.6825300f v y s n --==⨯=。
将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192⎡⎤⎣⎦。
下一步计算样本量。
绝对误差限d 和相对误差限r 的关系为_d rY =。
根据置信区间的求解方法可知()()______11y Y P y Y r Y P V y V y αα⎧⎫-⎪⎪⎧⎫⎪-≤≥-⇒≤≥-⎨⎬⎨⎩⎭⎪⎪根据正态分布的分位数可以知道()__1y Y P Z V y αα⎫-⎪⎪≤≥-⎬⎪⎪⎭,所以()2_2r Y V y z α⎛⎫⎪= ⎪⎝⎭。
《抽样技术》第四版习题答案
![《抽样技术》第四版习题答案](https://img.taocdn.com/s3/m/2221acda6294dd88d1d26b26.png)
第2章2.1 解:()1 这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是1100。
()2这种抽样方法不是等概率的。
利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是2100,而尚未被抽中的编号为36~63的每个单元的入样概率都是1100。
()3这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是11000,所以这种抽样是等概率的。
2.3 解:首先估计该市居民日用电量的95%的置信区间。
根据中心极限定理可知,在大_y E y y -=近似服从标准正态分布, _Y 的195%α-=的置信区间为y z y z y y αα⎡⎡-+=-+⎣⎣。
而()21f V y S n-=中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间为,y y ⎡⎤-+⎢⎥⎣⎦。
由题意知道,_29.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得 _21130050000()2060.6825300f v y s n --==⨯=。
将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192⎡⎤⎣⎦。
下一步计算样本量。
绝对误差限d 和相对误差限r 的关系为_d rY =。
根据置信区间的求解方法可知____11P y Y r Y P αα⎫⎪⎧⎫-≤≥-⇒≤≥-⎨⎬⎩⎭根据正态分布的分位数可以知道1P Z αα⎫⎪⎪≤≥-⎬⎪⎪⎭,所以()2_2rY V y z α⎛⎫⎪= ⎪⎝⎭。
也就是2_2_222/221111r Y r Y S n N z S n N z αα⎡⎤⎛⎫⎢⎥⎛⎫⎪⎛⎫⎝⎭⎪⎢⎥-=⇒=+ ⎪ ⎪⎢⎥⎝⎭⎝⎭⎢⎥⎣⎦。
把_29.5,206,10%,50000y s r N ====代入上式可得,861.75862n =≈。
应用抽样技术第三版课后习题答案
![应用抽样技术第三版课后习题答案](https://img.taocdn.com/s3/m/54a6e09327fff705cc1755270722192e45365897.png)
应用抽样技术第三版课后习题答案应用抽样技术第三版课后习题答案抽样技术是统计学中重要的一部分,它用于从总体中选择一部分样本,以便对总体进行推断。
在应用抽样技术的过程中,我们常常会遇到一些难题和疑惑。
为了帮助读者更好地理解和应用抽样技术,本文将为大家提供《应用抽样技术第三版》课后习题的详细解答。
第一章:抽样方法的基本概念1. 抽样方法的基本概念抽样方法是指从总体中选取一部分样本,以代表整个总体。
常用的抽样方法包括简单随机抽样、分层抽样、整群抽样等。
在选择抽样方法时,需要根据具体问题和研究目的来确定最适合的方法。
2. 简单随机抽样简单随机抽样是指从总体中随机选择样本,使每个样本都有相等的机会被选中。
这种抽样方法适用于总体规模较小且分布均匀的情况。
3. 分层抽样分层抽样是将总体划分为若干个层次,然后从每个层次中随机选择样本。
这种抽样方法适用于总体具有明显层次结构的情况,可以提高样本的代表性。
4. 整群抽样整群抽样是将总体划分为若干个群组,然后从每个群组中随机选择样本。
这种抽样方法适用于总体群组之间差异较大的情况,可以减少抽样误差。
第二章:简单随机抽样1. 简单随机抽样的步骤简单随机抽样的步骤包括确定总体、确定样本容量、编制总体名单、进行随机抽样和分析样本数据。
在确定样本容量时,需要考虑总体的大小、抽样误差和置信水平等因素。
2. 简单随机抽样的应用简单随机抽样广泛应用于各个领域的调查和研究中。
例如,在市场调查中,可以使用简单随机抽样来获取消费者的意见和反馈;在医学研究中,可以使用简单随机抽样来选择研究对象。
第三章:分层抽样1. 分层抽样的步骤分层抽样的步骤包括确定总体、划分层次、确定每层样本容量、进行随机抽样和分析样本数据。
在确定每层样本容量时,需要根据每个层次的重要性和变异程度来确定。
2. 分层抽样的应用分层抽样适用于总体具有明显层次结构的情况。
例如,在教育调查中,可以将学校划分为不同的层次,然后从每个层次中随机选择样本;在人口统计调查中,可以将人口按照年龄、性别等因素划分为不同的层次,然后进行抽样。
应用抽样技术答案
![应用抽样技术答案](https://img.taocdn.com/s3/m/a22d9fd504a1b0717fd5dde8.png)
第二章2.1判断题:(1)错;(2)错;(3)对;(4)错;(5)错;(6)错;(7)错;(8)错;(9)对;(10)对;(11)错;(12)错;(13)错。
2.3选择题:(1)b ;(2)b ;(3)d ;(4)c ;(5)c 。
2.7(1)抽样分布:(2)期望为5,方差为4/3 (3)抽样标准误 = = 1.155 (4)抽样极限误差 = 1.96*1.155 = 2.263(5)置信区间 = (5.67-2.263, 5.67+2.263) =(3.407, 7.933)。
若区间两端只考虑抽样分布的可能性取值,则可得该抽样分布作为离散分布的置信区间为[3, 7]第三章3.1 判断题是否为等概率抽样:(1)是;(2)否;(3)是;(4)否。
3.2 (1)5.51==∑iYNY25.6)(122=-=∑Y Y Niσ33.8)(1122=--=∑Y Y N S i (2)样本:(2, 5) (2, 6) (2, 9) (5, 6) (5, 9) (6, 9)()()5.55.775.55.545.361=+++++=∑y E ()∑=+++++=33.8)5.485.05.2485.4(612s E3.3(1) 1682=∑i y 1182662=∑i y03276.0301750/3011=-=-n f 760.5630/1682==y127.8261302^067.503011826611)(11212212=-⨯-=⎪⎭⎫ ⎝⎛--=--=∑∑==y n y n y y n s n i in i i ()07.27271.82603276.012=⨯=-=s nf y v ()203.5)(==y v y se198.10203.596.1)(=⨯=⨯=∆y se t95%置信度下置信区间为(56.067-10.198, 56.067+10.198)=(45.869, 66.265). 因此,对该校学生某月的人均购书支出额的估计为56.07(元),由于置信度95%对应的96.1=t ,所以,可以以95%的把握说该学生该月的人均购书支出额大约在45.87~66.27元之间。
金勇进:《抽样技术(第2版)》课后习题参考答案(精品pdf)
![金勇进:《抽样技术(第2版)》课后习题参考答案(精品pdf)](https://img.taocdn.com/s3/m/cfd1e7285627a5e9856a561252d380eb629423e4.png)
第一章1.1 答:理论上,若要根据调查数据进行统计推断,则需使用概率抽样。
在实际情形中,对概率抽样与非概率抽样的选择基于对调查目的与调查条件的权衡。
按照L. Kish 的说法,适用概率抽样的场合:(1)“当随机化〖即概率抽样〗既简单又重要时,忽视它就等于轻率和无知”;(2)“只有在某一具体研究领域中由于观察到抽选偏差,发现随机性的假设系错误后〖即随机性假设不成立〗,某些研究人员才显示出对概率抽样发生兴趣……在大多数物理学和化学实验中,样本的选择看来并不需要特别注意,在生物学里,随机与不随机兼而有之。
另一个极端是社会科学,事物特征的分布往往与随机分布相去甚远,也正是在这些领域,概率抽样最为需要,也是最为发展的”;(3)“随机化的概率抽样并不是一个教条而是一种策略,特别是对抽样数目大的场合更是如此”。
〖请再次注意由个人随意写下一些数字的例子〗适用非概率抽样的场合:(1)“比较大的挑战是在很多场合实行随机化的花费很大,这时它的价值必须与它的高费用相权衡,而且常常还要与减少对测量和实验变量的控制相权衡〖指调查方法与试验方法的选择〗。
因此,在很多现场操作中作业人员在下列三种情况下,尽量避免使用概率抽样: 第一,如果元素是一致的,那抽样就不重要了,例如,所有重量为一个单位的氢原子都可以认为是一样的;第二,虽然缺乏一致性,但如果预测的变量是可以度量且能够控制的话,抽样仍然可以避免,例如,在对个人进行抽选时对性别的控制是容易的;第三,如果不能控制的变量在总体中是随机分布的,那么对于任何选样设计,都可以提供一个随机样本。
”(2)“很多卓有成就的科学(天文学、物理学和化学)的巨大进步过去和现在都没有用概率抽样,在这些科学的研究里,统计推断是根据对总体有着适当的、自动的和自然的随机化这一主观判断而作出的……科学研究里充满了根据总体天然随机化的假定而获得成功的例子。
”1.2 答(1)(2)(3)皆否。
理由:判断一抽样是否为概率抽样,乃判断其是否为一给定之(),,S P U ,即:是否有确定之有限总体U ,所有可能样本的集合{}S s =是否确定,每个样本的选取概率{}P p =是否确定。
抽样技术 第三版 第二章课后部分答案 R语言
![抽样技术 第三版 第二章课后部分答案 R语言](https://img.taocdn.com/s3/m/aadfb2da84254b35eefd34d8.png)
抽样技术作业一(2.5——2.10)袁闪闪 21205021192.5 解:这里N =200,n =20,由表中的数据可得:2011221211144.5201()826.052611()- 6.097n i i i i n i i y y y n s y y n nv y s n N=======-=-=⨯=∑∑∑(1) 因而该小区平均的文化支出Y 的95%的近似置信区间为:22/2/211[-,-][144.5 1.96 6.097][132.5503,156.4497]n n y z s y z s n N n Nαα-⨯+⨯=±⨯=(1)(1) 所以该小区平均的文化支出Y 的估计为144.5元,其95%的置信区间为 (132.55元,156.45元)。
2.6解:有题意可得:N =350,n =50, y =1120,2s =25600, 所以粮食总产量为:3501120392000()Y N y ∧==⨯=元 代入数据得:22/2/211[-,-][392000 1.967332.12][377629,406371]n n y z Ns y z N s n N n Nαα-⨯+⨯=±⨯=(1)(1) 所以总产值的95%的置信区间为:(377629吨,406371吨)。
2.7解:由题意可得:N =1000,d =2,α=0.05,2S =68,r=70%, 带入公式,可得初始样本量:222/2022222/2/21161.362Nz S d n N z S Nd z S ααα⎛⎫=+==≈ ⎪+⎝⎭ 由于有效回答率为r=70%,,对样本容量进行再调整:0070%87.5788nn n r===≈所以样本最终确定为88。
2.8解:由题意已知:N =100,n =10, X =2135,y =25,x =22, 方法一:简单随机估计:100252500()Y N y ∧==⨯=吨方法二:比估计:由经验可知去年的化肥总产量和今年的总产量之间存在较强的相关性,引入去年的化肥总产量作为辅助变量。
《抽样技术》第四版习题答案
![《抽样技术》第四版习题答案](https://img.taocdn.com/s3/m/53e1d9ec195f312b3069a532.png)
第2章2.1 解:()1 这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是1100。
()2这种抽样方法不是等概率的。
利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是2100,而尚未被抽中的编号为36~63的每个单元的入样概率都是1100。
()3这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是11000,所以这种抽样是等概率的。
2.3 解:首先估计该市居民日用电量的95%的置信区间。
根据中心极限定理可知,在大_y E y y -=近似服从标准正态分布, _Y 的195%α-=的置信区间为2y z y z y y αα⎡⎡-+=-+⎣⎣。
而()21f V y S n-=中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间为,y y ⎡⎤-+⎢⎥⎣⎦。
由题意知道,_29.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得 _21130050000()2060.6825300f v y s n --==⨯=。
将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192⎡⎤⎣⎦。
下一步计算样本量。
绝对误差限d 和相对误差限r 的关系为_d rY =。
根据置信区间的求解方法可知____11P y Y r Y P αα⎫⎪⎧⎫-≤≥-⇒≤≥-⎨⎬⎩⎭根据正态分布的分位数可以知道1P Z αα⎫⎪⎪≤≥-⎬⎪⎪⎭,所以()2_2r Y V y z α⎛⎫⎪= ⎪⎝⎭。
也就是2_2_222/221111r Y r Y S n N z S n N z αα⎡⎤⎛⎫⎢⎥⎛⎫⎪⎛⎫⎝⎭⎪⎢⎥-=⇒=+ ⎪ ⎪⎢⎥⎝⎭⎝⎭⎢⎥⎣⎦。
把_29.5,206,10%,50000y s r N ====代入上式可得,861.75862n =≈。
抽样技术第二章参考答案1
![抽样技术第二章参考答案1](https://img.taocdn.com/s3/m/8d614818b7360b4c2e3f6499.png)
第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同? 解析:抽样理论和数理统计中关于样本均值的定义和性质的不同抽样理论概率统计定义 ∑==ni i y n y 11=y性质1.期望()()()()Y C P E NNC N C ===∑∑==n n 1i n i 1i i i 1y y y2.方差()()()[]()iC i iiP y E y y V n N21∑=-==()()[]n NC i iiCy E y n N121∑=-()21S nf -=1.期望()⎪⎭⎫ ⎝⎛=∑=n i i y n E y E 11()∑==ni y E 1i n 1[]μμ==n n12.方差()[]2μ-=i y E y V211⎥⎦⎤⎢⎣⎡-=∑=n i i y n E μ()ny n 122i σμ=-=E2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s1706366666206*300500003001500001)()ˆ(222=-=-==s nf N y N v YV19.413081706366666(==)y v该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤-即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
抽样技术第三章参考答案
![抽样技术第三章参考答案](https://img.taocdn.com/s3/m/ffdcea8e6529647d272852de.png)
第三单元习题答案(仅供参考)1解:(1)不合适(2)不合适(3)合适(4)不合适2.将800名同学平均分成8组,在每一级中抽取一名“幸运星”。
3.根据表中调查数据,经计算,可得下表:==20.1V()=-=9.7681-0.2962=9.4719=3.0777(2)置信区间为95%相对误差为10%,则有按比例分配的总量:n==185.4407185=n=56,=92,=37按内曼分配:n==175=33,=99,=434.根据调查数据可知:==0.924根据各层层权及抽样比的结果,可得()==0.000396981=1.99%估计量的标准差为1.99%,比例为9.24%按比例分配:n=2663=479,=559,=373,=240,=426,=586内曼分配:n=2565=536,=520,=417,=304,=396,=3925.解:由题意,有==75.79购买冷冻食品的平均支出为75.79元又由V()=+又n=V()=53.8086=7.335495%的置信区间为[60.63,90.95]。
7.解:(1)对(2)错(3)错(4)错(5)对8.解:(1)差错率的估计值=70%+30%=0.027 估计的方差v()==3.1967标准差为S()=0.0179。
(2)用事后分层的公式计算差错率为==0.03估计的方差为;v()=-=2.57269.解:(1)所有可能的样本为:(2)用分别比估计,有=0.4,=0.65,所以用分别比估计可计算得=6.4。
用联合比估计,有=0.5,=0.625,所以用联合比估计可计算得=6.5。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样技术课后答案2.1判定以下抽样方法是否是等概的: (1)总体编号1~64,在0~99中产生随机数r ,假设r=0或r>64那么舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,假设余数为0那么抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原那么抽取样本。
第二,每个单元被抽中的概率是的,或者是能够运算的。
第三,当用样本对总体目标进行估量时,要考虑到该样本被抽中的概率。
因此〔1〕中只有1~64是可能被抽中的,故不是等概的。
〔2〕不是等概的【缘故】〔3〕是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y 9.5〔千瓦时〕,=2s 206.试估量该市居民用电量的95%置信区间。
假如期望相对误差限不超过10%,那么样本量至少应为多少?解:由可得,N=50000,n=300,5.9y =,2062=s1706366666206*300500003001500001)()ˆ(222=-=-==s nf N y N v YV 19.413081706366666(==)y v 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为〔394035.95,555964.05〕 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,那么样本量至少应为8622.4某大学10000名本科生,现欲估量爱暑假期间参加了各类英语培训的学生所占的比例。
随机抽取了两百名学生进行调查,得到P=0.35,是估量该大学所有本科生中暑假参加培训班的比例的95%置信区间。
解析:由得:10000=N 200=n 35.0=p 02.0==N nf又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V 该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据运算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面〔报刊、电视、网络、书籍等〕的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8100181809 110 19 170 10 240 20 120估量该小区平均的文化支出Y ,并给出置信水平95%的置信区间。
解析:由得:200=N 20=n依照表中数据运算得:5.144201201==∑=i i y y()06842.827120120122=--=∑=i iy y s 21808.37)1(1)(2=-=s Nnn y V 10015.6)(=y V ∴ 该小区平均文化支出Y的95%置信区间为:])(y [2y V z α±即是:[132.544 ,156.456]故估量该小区平均的文化支出Y =144.5,置信水平95%的置信区间为[132.544 ,156.456]。
2.6某地区350个乡为了获得粮食总产量的估量,调查了50个乡当年的粮食产量,得到y =1120〔吨〕,25602=S ,据此估量该地区今年的粮食总产量,并给出置信水平95%的置信区间。
解析:由题意知:y =1120 1429.035050n ===N f 25602=S ⇒160=s 置信水平95%的置信区间为:]1y [2s nfz -±α代入数据得: 置信水平95%的置信区间为:[1079.872,1160.872]2.7某次关于1000个家庭人均住房面积的调查中,托付方要求绝对误差限为2平方千米,置信水平95%,现依照往常的调查结果,认为总体方差682=S ,是确定简单随机抽样所需的样本量。
假设估量有效回答率为70%,那么样本量最终为多少?解析:简单随机抽样所需的样本量22222122S Z Nd S NZ n αα+=%7012n n =由题意知:1000=N 2=d 682=S 96.12=αZ代入并运算得:613036.611≈=n87142.87%7012≈==n n故知:简单随机抽样所需的样本量为61,假设估量有效回答率为70%,那么样本量最终为872.8某地区对本地100家化肥生产企业的尿素产量进行调查,一直去年的总产量为2135吨,抽取10个企业调查今年的产量,得到25=y ,这些企业去年的平均产量为22=x 。
试估量今年该地区化肥总产量。
解析:由题可知22x =,35.211002135===N X X ,25y =那么,该地区化肥产量均值Y 的比率估量量为26.24242535.21===∧x y XY该地区化肥产量总值Y 的比率估量量为 242626.24*100ˆˆ===R Y N Y 因此,今年该地区化肥总产量的估量值为2426吨。
2.9假如在解决习题2.5的问题时能够得到这些家庭月总支出,得到如下表:置信水平95%的置信区间,并比较比估量和简单估量的效率。
解析:由题可知1580130017002300201x n 1x n 1i i =+++==∑=)(5.144y =091.015805.144ˆ=≈===x y r R又329.14615805.144*1600x y y ===XR053.826)(11122=--=∑=ni i y y n S158.3463))((111=---=∑=ni i i xyx x y y n S579.8831)(11122=--=∑=n i i xx x n S故平均文化支出的95%的置信区间为,)ˆˆ2(1[2222x yx R S R S R S n f Z y +---α])ˆˆ2(12222xyx R S R S R S n f Z y +--+α代入数据得〔146.329±1.96*1.892〕即为[142.621,150.037]2.10某养牛场购进了120头肉牛,购进时平均体重100千克。
现从中抽取10头,记录重量,3个月后再次测量,结果如下:的结果进行比较。
解:由题可知,6.10210595101x n 1x n 1i i =++==∑=)(163170150101y n 1y n 1i i =+==∑=)(222.2121910*91)(11122==--=∑=n i iy y n S 333.1461317*91))((111==---=∑=n i ii xyx x y y n S933.1064.926*91)(11122==--=∑=n i i xx x n S 故有368.1933.106333.14620===xxy S S β因此总体均值Y 的回来估量量为443.159)6.102100(*368.1163)(0=-+=-+=x X y y lr β 其方差估量为:)2(1)(ˆ02202xyx lr S S S n f y V ββ-+-==)333.146*368.1*2933.106*368.1222.212(101201012-+-=1.097 而21y (ˆS nf V-=) =222.212*10120101- =19.454明显)(ˆ)(ˆy V y V lr< 因此,回来估量的结果要优于简单估第三单元习题答案〔仅供参考〕 1解:〔1〕不合适 〔2〕不合适 〔3〕合适 〔4〕不合适2.将800名同学平均分成8组,在每一级中抽取一名〝幸运星〞。
∴Y ̅̂st =1N∑N h y ̅h 3h=1=20.1V 〔y ̅̂st 〕=∑W h 2s h 2n hL h=1-∑W h s h 2NL h=1=9.7681-0.2962 =9.4719∴√V (y ̅̂st )=3.0777 〔2〕置信区间为95%相对误差为10%,那么有按比例分配的总量:n=∑W h s h2L h=1V+NV∑W h s h 2L h=1=185.4407≈185∴n 1=n W 1=56,n 2=92,n 3=37按内曼分配:n=(∑W h s h 2)2L h=1V+1N∑W h s h h=1=175∴n 1=33,n 2=99,n 3=43P st =∑W h P h L h=1=0.924依照各层层权W h 及抽样比f h 的结果,可得V ̂〔P st 〕=1N2∑N h2(1−f h )p n q n n h −14h=1=0.000396981 ∴√V̂(P st )=1.99% ∴估量量的标准差为1.99%,比例为9.24%按比例分配:n=2663∴n 1=479,n 2=559,n 3=373,n 4=240,n 5=426,n 6=586内曼分配:n=2565∴n 1=536,n 2=520,n 3=417,n 4=304,n 5=396,n 6=3925.解:由题意,有Y ̅=∑y̅W n L h=1=75.79 ∴购买冷冻食品的平均支出为75.79元又由V 〔y ̅〕=1−f n∑W h s h 2L h=1+1n ∑(1−W h )s h 2L h=1又n=∑n h /W h L h=1∴V 〔y ̅〕=53.8086 √V (y ̅)=7.3354∴95%的置信区间为[60.63,90.95]。
7.解:〔1〕对〔2〕错 〔3〕错 〔4〕错 〔5〕对8.解:〔1〕差错率的估量值y ̅=143×70%+257×30%=0.027估量的方差v 〔y ̅〕=∑W h2L h=11−f h n h s h2=3.1967×10−4标准差为S(y ̅)=0.0179。
〔2〕用事后分层的公式运算差错率为y ̅=∑W h (1m h∑y hi )m hi=1L h=1=0.03估量的方差为;v 〔y ̅〕=∑W h 2S h 2m hh-1N∑W h S h 2h =2.5726×10−4〔2〕用分别比估量,有r 1=0.4,r 2=0.65,因此用分别比估量可运算得Y ̅=6.4。