抽样技术 第三版 第三章第四章部分答案 含R语言代码

合集下载

应用抽样技术课后习题答案

应用抽样技术课后习题答案

=(0.0907,0.4433)
N1的95%的置信区间为: (159,776) 95%的置信区间为 (159, 的置信区间为:
(3)N=1750,n=30, (3)N=1750,n=30,n1=8, t=1.96, p=0.267, q=1q=1-0.267=0.733 由此可计算得: t 2q 1.962 × 0.733 n0 = 2 = =1054.64 r p 0.01× 0.267 n = n0/[1+(n0—1)/N] = 1054.64/[1+1053.64/1750]=658.2942 = 659 计算结果说明,至少应抽取一个样本量为659的简单随机 样本,才能满足95%置信度条件下相对误差不超过10%的精度 要求。
t=1.96 (2)易知,N=1750,n=30, n = 8 1 n 8 N − n 1750 − 30 1− f p= 1 = = 0.267 = = = 0.03389 n −1 (n −1)N 29 ×1750 n 30
pq = p(1 − p) = 0.267 × 0.733 = 0.1957
5.5 证明:由(5.6)得:
V ( yR ) ≈ 1− f n (Yi − RX i )2 ∑
i =1 N
N −n 2 令 Sd = V , Nn
2 d
N −1
=
N −n 2 Sd Nn
则n(NV + S ) = NS ,
2 d
S 2 NSd 从而n = = V 2 2 NV + Sd Sd 1+ NV
第五章 比率估计与回归估计
5.2 N=2000, n=36, 1-α=0.95, t=1.96, ˆ f = n/N=0.018, v(R) = 0.000015359, ˆ se(R) =0.00392 置信区间为[40.93%,42.47%]。 置信区间为[40.93%,42.47%]。

抽样技术课后习题_参考答案_金勇进

抽样技术课后习题_参考答案_金勇进

第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。

(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。

然后用r+19999作为被抽选的数。

解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。

第二,每个单元被抽中的概率是已知的,或者是可以计算的。

第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。

因此(1)中只有1~64是可能被抽中的,故不是等概的。

(2)不是等概的【原因】(3)是等概的。

2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。

如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s1706366666206*300500003001500001)()ˆ(222=-=-==s nf N y N v YV 19.413081706366666(==)y v 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。

抽样技术金勇进第三版

抽样技术金勇进第三版

5个黑球,3个白球,大小相同,一次随机地摸取4个球,其中恰有3个白球的概率为A .83B .485C C .81)83(5D .81)83(348C2. 任何一个连续型随机变量的概率密度)(x f 一定满足A .1)(0≤≤x fB .在定义域内单调不减C .()1f x dx +∞-∞=⎰D .0)(>x f3. 设随机变量X 、Y 相互独立,分布函数分别是)(x F 、)(x G ,min{,}Z X Y =,则Z 的分布函数()Z F z =A .()()F z G zB .()()()()F z G z F z G z +-C .[]2()F z D .1(1())(1())F z G z ---4. 设人的体重为随机变量X ,且()E X a =,()D X b =,10个人的平均体重为Y ,则下面成立的是A .()E Y a =B .()0.1E Y a =C .()D Y b = D .b Y D 2.0)(= 5. 设A n 为n 次独立重复试验中A 出现的次数,p 是事件A 在每次试验中的出现概率,ε为大于零的数,则lim A n n P p n ε→∞⎧⎫-<=⎨⎬⎩⎭A .0B . 1C .12 D.21⎛Φ- ⎝6. 设)(~),(~22221221n n χχχχ,2221,χχ独立,则 A .)(~22221n χχχ+ B .~2221χχ+)1(2-n χ C .~2221χχ+()t n D .~2221χχ+212()n n χ+7. 由来自正态总体2~(,2)X N μ容量为400的简单随机样本,样本均值为45,则未知参数μ的置信度为0.95的置信区间是0.025( 1.96,Z =其中 0.05 1.645)Z =A .(44.8355,45.1645)B .(44,46)C .(44.804,45.196)D .(44.9,45.1) 8. 在假设检验中,设1H 为备择假设,那么犯第一类错误的概率为A. 1H 真,接受1HB. 1H 不真,接受1HC. 1H 真,拒绝1HD. 1H 不真,拒绝1H有两批零件,其合格率分别为0.9和0.8,在每批零件中随机地任取一件,则至少有一件是合格品的概率为__________________.2. 设)2.0,2(~2N X ,若9938.0)5.2(=Φ,5.0)0(=Φ,则=<<}5.22{X P ___.3. 设X 的概率密度为23,02()80,x x f x ⎧<<⎪=⎨⎪⎩其它,则2)1(-=X Y 的概率密度函数为 .4. 设随机变量X 与Y 相互独立,且~(0,2),X U Y 服从参数为3的指数分布,则()E XY = .5. 设从总体2(52,6.3)N 中随机抽取容量为36的样本,X 表示样本均值,则X 服从的分布为 . 6. 设是来自正态总体2(,)N μσ的样本, 其中参数μ和2σ未知,若计算出162120,()60,i i x x x ==-=∑则假设0:15H μ=的t 检验选用的T统计量的值t = .7. 设总体),(~2σμN X ,其中2σ未知,容量为n 的样本均值和方差分别为X 、2S ,则参数μ的置信度为α-1)10(<<α的双侧置信区间为 .8. 单因素方差分析中,各个水平(1,2,,)j A j s = 下的样本12,,,j j j n j X X X 均来自2(,),j j N μσμ与2σ未知,,T E A S S S =+称T S 为总偏差平方和,E S 和A S 分别为 .设总体N=4,其变量值分别为(2,5,6,9)。

抽样技术第三版第2、3章习题答案

抽样技术第三版第2、3章习题答案

第2章2.1 解:()1 这种抽样方法是等概率的。

在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是1100。

()2这种抽样方法不是等概率的。

利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是2100,而尚未被抽中的编号为36~63的每个单元的入样概率都是1100。

()3这种抽样方法是等概率的。

在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是11000,所以这种抽样是等概率的。

2.3 解:首先估计该市居民日用电量的95%的置信区间。

根据中心极限定理可知,在大_y E y y -=近似服从标准正态分布, _Y 的195%α-=的置信区间为y z y z y y αα⎡⎡-+=-+⎣⎣。

而()21f V y S n-=中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间为,y y ⎡⎤-+⎢⎥⎣⎦。

由题意知道,_29.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得 _21130050000()2060.6825300f v y s n --==⨯=。

将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192⎡⎤⎣⎦。

下一步计算样本量。

绝对误差限d 和相对误差限r 的关系为_d rY =。

根据置信区间的求解方法可知____11P y Y r Y P αα⎫⎪⎧⎫-≤≥-⇒≤≥-⎨⎬⎩⎭根据正态分布的分位数可以知道1P Z αα⎫⎪⎪≤≥-⎬⎪⎪⎭,所以()2_2r Y V y z α⎛⎫⎪= ⎪⎝⎭。

也就是2_2_222/221111r Y r Y S n N z S n N z αα⎡⎤⎛⎫⎢⎥⎛⎫⎪⎛⎫⎝⎭⎪⎢⎥-=⇒=+ ⎪ ⎪⎢⎥⎝⎭⎝⎭⎢⎥⎣⎦。

把_29.5,206,10%,50000y s r N ====代入上式可得,861.75862n =≈。

2013年春季抽样技术考试范围及答案

2013年春季抽样技术考试范围及答案

2013年春季抽样技术考试范围及答案1、P2定义1.3到本页结束2、P5定义1.143、P6定义1.20和其上一段4、P12黑体三下第一段5、P15 定义1.266、P33第4-8行,定义2.8和其下一段7、P34定义2.118、P37第4-6行9、P38公式(2.1)和其上一段、下一段10、P44定义2.1911、P53第六节和倒数1-3行12、P62公式(3.4)和公式(3.5)13、P66公式(3.10)和公式(3.11)14、P82倒数第7行15、P88公式(3.61)下一段16、P96定义4.217、P97第11-13行18、P105第三节下第一段19、P113第四节下第一段20、P125定义4.9和公式(4.70)21、P126定义4.1022、P141 二、事后分层下第一段23、P145倒数最后一段24、P146定义5.225、P149 黑体二下第一段26、P151 黑体一下的第二段和第三段27、P152倒数第2-3行28、P159最后一段29、P161引理6.1和公式(6.1)30、P163第9-10行31、P204倒数第2段第1句话32、P205黑体二上2段33、P228 第1段和第3段34、P229 第一节下第2段和定义8.3到本页结束35、P231 倒数第3、4行36、P246(一)中心位置法上一段37、P260 第3—6行38、P261第11—13行39、P262定义9.340、P264定义9.541、P265第9—12行42、P272 3个黑方块43、P274(二)和(三)44、P275表9.245、P286第5—8行1、练习册P72第2题2、练习册P74第7题3、练习册P120第1题4、练习册P122第4题5、练习册P151第3题6、练习册P173 第六题单选:1.要了解有逃学行为的8-12岁学生心理,目标客体是:有逃学行为的学生,实际客体为全体8-12岁的学生,实际客体比目标客体范围要大得多。

《抽样技术》习题答案(老杜)

《抽样技术》习题答案(老杜)

2.1 解:1 这种抽样方法是等概率的。

在每次抽取样本单元时,尚未被抽中的编号1为1〜64的这些单元中每一个单元被抽到的概率都是——。

1002这种抽样方法不是等概率的。

利用这种方法,在每次抽取样本单元时,尚未被抽中2的编号为1〜35以及编号为64的这36个单元中每个单元的入样概率都是丄,而尚未被100抽中的编号为36〜63的每个单元的入样概率都是—。

1003这种抽样方法是等概率的。

在每次抽取样本单元时,尚未被抽中的编号为121 000中的每个单元的入样概率都是 -------------- ,所以这种抽样是等概率的。

1 0002.2 解:20 0002.3 解: 首先估计该市居民日用电量的95%勺置信区间。

根据中心极限定理可知, 在大样本的条件下,y E y近似服从标准正态分布,95%的置信区间为y z ;2y 1.96少y , y 1.96& y 。

1 f2 2 2而V y ——S 2中总体的方差S 2是未知的,用样本方差S 2来代替,置信区间 n日用电量的95%置信区间为 7.8808,11.1192 。

根据置信区间的求解方法可知2.4 解:总体中参加培训班的比例为 P ,那么这次简单随机抽样得到的P 的估计值P1 f N的方差V P —-- P1 P ,利用中心极限定理可得 十n N 1J V似服从标准正态分布。

在本题中,样本量足够大,从而可得P Z {2& P ,P Z 占 P 。

为 y 1.96』—s,y 1.96由题意知道,y 9.5, S 2206,而且样本量为n 300, N 50 000,代入可以求得v(y) Js 2 1 300 50 000 n300206 0.682 5。

将它们代入上面的式子可得该市居民 下一步计算样本量。

绝对误差限d 和相对误差限 r 的关系为d rY 。

根据正态分布的分位数可以知道Z/2,所以V y2rY--- OZ,21也就是—nS 2rYZ/22rYZ 2/2S 2把y 本量至少为9.5,s 206,r 10%, N 50 000代入上式可得,n 861.75 862。

应用抽样技术课后习题答案.ppt

应用抽样技术课后习题答案.ppt
3367433556763371101102102102101101102期望为5方差为433抽样标准误11554抽样极限误差22635置信区间34077933应用抽样技术课后习题答案第三章简单随机抽样应用抽样技术课后习题答案33为调查某中学学生的每月购书支出水平在全校名学生中用不放回简单随机抽样的方法抽得一个的样本
3.5要调查甲乙两种疾病的发病率,从历史资料得知, 甲种疾病的发病率为8%,乙种疾病的发病率为5 %,求:
(1)要得到相同的标准差0.05,采用简单随机抽样各 需要多大的样本量?
(2)要得到相同的变异系数0.05,又各需要多大的样 本量?
3.5解:已知 P1= 0.08, Q1= 1-P1 = 0.92;
5.y7Elr解(y:lry)lrEB((EyXlr()ylrx)B) [XYy, VE2(B(xy()lXr])Yx1)nf1nSiYn21(1[ yi
2)
2B(xi
X
)]
V
(
ylr
)
V
{
1 n
n [ yi 2B(xi X )]}=1-nf
i 1
1 N 1
N i 1
[Yi
2B(
Xi
X
6.1解:令 M0 1000
,则可以得到下表,从
1-1000中产生n=3个随机数,设为108,597,754,
则第二、第六和第七个单位入样。
i
Mi
累计Mi
代码
1
98
98
1~98
2
102
200
99~200
3
57
257
201~257
4
251
508
258~508
5

应用抽样技术第三版课后习题答案

应用抽样技术第三版课后习题答案

应用抽样技术第三版课后习题答案应用抽样技术第三版课后习题答案抽样技术是统计学中重要的一部分,它用于从总体中选择一部分样本,以便对总体进行推断。

在应用抽样技术的过程中,我们常常会遇到一些难题和疑惑。

为了帮助读者更好地理解和应用抽样技术,本文将为大家提供《应用抽样技术第三版》课后习题的详细解答。

第一章:抽样方法的基本概念1. 抽样方法的基本概念抽样方法是指从总体中选取一部分样本,以代表整个总体。

常用的抽样方法包括简单随机抽样、分层抽样、整群抽样等。

在选择抽样方法时,需要根据具体问题和研究目的来确定最适合的方法。

2. 简单随机抽样简单随机抽样是指从总体中随机选择样本,使每个样本都有相等的机会被选中。

这种抽样方法适用于总体规模较小且分布均匀的情况。

3. 分层抽样分层抽样是将总体划分为若干个层次,然后从每个层次中随机选择样本。

这种抽样方法适用于总体具有明显层次结构的情况,可以提高样本的代表性。

4. 整群抽样整群抽样是将总体划分为若干个群组,然后从每个群组中随机选择样本。

这种抽样方法适用于总体群组之间差异较大的情况,可以减少抽样误差。

第二章:简单随机抽样1. 简单随机抽样的步骤简单随机抽样的步骤包括确定总体、确定样本容量、编制总体名单、进行随机抽样和分析样本数据。

在确定样本容量时,需要考虑总体的大小、抽样误差和置信水平等因素。

2. 简单随机抽样的应用简单随机抽样广泛应用于各个领域的调查和研究中。

例如,在市场调查中,可以使用简单随机抽样来获取消费者的意见和反馈;在医学研究中,可以使用简单随机抽样来选择研究对象。

第三章:分层抽样1. 分层抽样的步骤分层抽样的步骤包括确定总体、划分层次、确定每层样本容量、进行随机抽样和分析样本数据。

在确定每层样本容量时,需要根据每个层次的重要性和变异程度来确定。

2. 分层抽样的应用分层抽样适用于总体具有明显层次结构的情况。

例如,在教育调查中,可以将学校划分为不同的层次,然后从每个层次中随机选择样本;在人口统计调查中,可以将人口按照年龄、性别等因素划分为不同的层次,然后进行抽样。

R语言数据分析与挖掘知到章节答案智慧树2023年中央财经大学

R语言数据分析与挖掘知到章节答案智慧树2023年中央财经大学

R语言数据分析与挖掘知到章节测试答案智慧树2023年最新中央财经大学第一章测试1.下面哪些是R可以存储的数据对象?()。

参考答案:其余选项都是2.关于 attach( ) 函数说法正确的是?()。

参考答案:其余选项均正确3.下面哪些方式可以查看到帮助文档?()。

mean和help(mean)都正确4.假设 y<-c(1,2,3,-1,0,2), 那么关于语句 y[c(-2,-3)],说法正确的是___.()。

参考答案:执行该语句不会改变y的长度5.下面关于修改向量 x<-c(1,2,-1,-3,-5) 的说法错误的是___.()。

参考答案:执行语句 x<-0 后,x的值为 0,0,0,0,0第二章测试1.若从正态分布总体中抽样得到一组样本,样本的值为 1, -1, 2, 3, 4, 5, 1, 2, 4, 3,那么样本的中位数为?()。

2.52.若从正态分布总体中抽样得到一组样本,样本的值为7, 7, 5, 2, 5, 4, 7, 9, 4, 8,那么样本的众数为?()。

参考答案:73.最大值与最小值之间的差值称为?()。

参考答案:极差4.关于变异系数的说法正确的是?()。

参考答案:其余选项都正确5.若从正态分布总体中抽样得到一组样本,样本的值为 1, -1, 2, 3, 4, 5, 1, 2, 4, 3,4, 4, 那么下面哪些说法是正确的?.()。

参考答案:该样本只有一个众数;若要计算该样本的中位数,需要先对其进行排序;该样本的极差为6第三章测试1.分类变量用下面哪些图形来描述较为合适?()。

参考答案:饼图;条形图2.分类变量用哪些统计量来描述较为合适?()。

参考答案:比率;比例;频数3.下面哪些图形用来描述数值变量的分布情况更为恰当?()。

参考答案:直方图;概率密度曲线;箱线图4.下面哪些说法是正确的?()。

参考答案:在对数值变量离散化处理的情况下,可以使用条形图展示数值变量的分布形状;可以用点图展示数值变量的分布形状5.下面关于table( )函数说法正确的是?()。

最新《抽样技术》第四版习题答案

最新《抽样技术》第四版习题答案

2.1解:(1)这种抽样方法是等概率的。

在每次抽取样本单元时,尚未被抽中的编号为1〜64的这些单元中每一个单元被抽到的概率都是一二0100(2)这种抽样方法不是等概率的。

利用这种方法,在每次抽取样本单元时,尚未被抽中2的编号为1〜35以及编号为64的这36个单元中每个单元的入样概率都是二,而尚未被 100抽中的编号为36〜63的每个单元的入样概率都是」匚,100(3)这种抽样方法是等概率的,在每次抽取样本单元时,尚未被抽中的编号为20 000〜21 000中的每个单元的入样概率都是一L,所以这种抽样是等概率的。

1 0002.3解:首先估计该市居民日用电量的95%的置信区间,根据中心极限定理可知,在大样本的条件下,二=三里!近似服从标准正态分布,『的1-。

=95%的置信区间为[了一2弟27^,? +4任7^]=[》- 1967^,9 + l-967v(y)" o而卜(方=?52中总体的方差T 是未知的,用样本方差『来代替,置信区间由题意知道,y = 95/=206,而且样本量为〃 = 300,N = 50 000,代入可以求得== 1()。

、()。

乂206 = 0682 5。

将它们代入上面的式子可得该市居民 n 300日用电量的95%置信区间为[7.880 8,11.119 2] °下一步计•算样本量。

绝对误差限4和相对误差限r 的关系为“=〃丫。

把 y = 9.5,s2 = 206/ = 10%,N = 50 000代入上式可得,n = 861.75 ^862 o 所以样 本量至少为86202.4 解:总体中参加培训班的比例为P ,那么这次简单随机抽样得到的P 的估计值p尸。

一夕),利用中心极限定理可得 L 在大样本的条件下近 似服从标准正态分布。

在本题中,样本量足够大,从而可得P 的1-2 = 95%的置信区间为 P 一Z R 2/ ( P),P + Z R 2 W ( P)]。

抽样技术 第三版 第二章课后部分答案 R语言

抽样技术 第三版 第二章课后部分答案 R语言

抽样技术作业一(2.5——2.10)袁闪闪 21205021192.5 解:这里N =200,n =20,由表中的数据可得:2011221211144.5201()826.052611()- 6.097n i i i i n i i y y y n s y y n nv y s n N=======-=-=⨯=∑∑∑(1) 因而该小区平均的文化支出Y 的95%的近似置信区间为:22/2/211[-,-][144.5 1.96 6.097][132.5503,156.4497]n n y z s y z s n N n Nαα-⨯+⨯=±⨯=(1)(1) 所以该小区平均的文化支出Y 的估计为144.5元,其95%的置信区间为 (132.55元,156.45元)。

2.6解:有题意可得:N =350,n =50, y =1120,2s =25600, 所以粮食总产量为:3501120392000()Y N y ∧==⨯=元 代入数据得:22/2/211[-,-][392000 1.967332.12][377629,406371]n n y z Ns y z N s n N n Nαα-⨯+⨯=±⨯=(1)(1) 所以总产值的95%的置信区间为:(377629吨,406371吨)。

2.7解:由题意可得:N =1000,d =2,α=0.05,2S =68,r=70%, 带入公式,可得初始样本量:222/2022222/2/21161.362Nz S d n N z S Nd z S ααα⎛⎫=+==≈ ⎪+⎝⎭ 由于有效回答率为r=70%,,对样本容量进行再调整:0070%87.5788nn n r===≈所以样本最终确定为88。

2.8解:由题意已知:N =100,n =10, X =2135,y =25,x =22, 方法一:简单随机估计:100252500()Y N y ∧==⨯=吨方法二:比估计:由经验可知去年的化肥总产量和今年的总产量之间存在较强的相关性,引入去年的化肥总产量作为辅助变量。

《抽样技术》第四版习题答案

《抽样技术》第四版习题答案

第2章2.1 解:()1 这种抽样方法是等概率的。

在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是1100. ()2这种抽样方法不是等概率的。

利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是2100,而尚未被抽中的编号为36~63的每个单元的入样概率都是1100. ()3这种抽样方法是等概率的。

在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是11000,所以这种抽样是等概率的.2.3 解:首先估计该市居民日用电量的95%的置信区间。

根据中心极限定理可知,在_y E y y -=近似服从标准正态分布, _Y 的195%α-=的置信区间为y z y z y y αα⎡⎡-+=-+⎣⎣。

而()21f V y S n-=中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间为,y y ⎡⎤-+⎢⎥⎣⎦. 由题意知道,_29.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得_21130050000()2060.6825300f v y s n --==⨯=.将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192⎡⎤⎣⎦。

下一步计算样本量.绝对误差限d 和相对误差限r 的关系为_d r Y =. 根据置信区间的求解方法可知____11P y Y r Y P αα⎫⎪⎧⎫-≤≥-⇒≤≥-⎨⎬⎩⎭根据正态分布的分位数可以知道1P Z αα⎫⎪⎪≤≥-⎬⎪⎪⎭,所以()2_2r Y V y z α⎛⎫⎪= ⎪⎝⎭。

也就是2_2_222/21111rY rY S n N z S n N z αα⎡⎤⎛⎫⎢⎥⎛⎫⎪⎛⎫⎝⎭ ⎪⎢⎥-=⇒=+ ⎪ ⎪⎢⎥⎝⎭⎝⎭⎢⎥⎣⎦。

把_29.5,206,10%,50000y s r N ====代入上式可得,861.75862n =≈。

应用抽样技术答案.doc

应用抽样技术答案.doc

第一章1.1判断题:(1)对;(2)对;(3)对;(4)对;(5)错;(6)错;(7)错;(8) 错;(9)错;(10)对•;(11)对。

1.2试分析以下几种抽样属于何种抽样(概率或非概率):(1)概率抽样;(2)非概率抽样;(3)非概率抽样;(4)非概率抽样;(5)非概率抽样;(6)非概率抽样。

1.3选择题:(1) c; (2) c; (3) b; (4) co第二章2.1判断题:(1)错;(2)错;(3)对;(4)错;(5)错;(6)错;(7)错;(8) 错;(9)对;(10)对;(11)错;(12)错;(13)错。

2.3选择题:(2)期望为5,方差为4/3(3)抽样标准误=I,= 1.155(4)抽样极限误差= 1.96*1.155 = 2.263(5)置信区间=(5.67-2.263, 5.67+2.263) = (3.407, 7.933)。

若区间两端只考虑抽样分布的可能性取值,则可得该抽样分布作为离散分布的置信区间为[3,7]第三章3.1判断题是否为等概率抽样:(1)是;(2)否;(3)是;(4)否。

3.2p = — == 0.267 n 30 m=g=°°g30-1⑴歹=土£匕=5.5『=§£(匕_区)2=6.2552 =-^—y(K-r)2 =8.33 N-\- 1(2)样本:(2,5) (2,6) (2,9) (5,6) (5,9) (6,9)此=空(3.5 + 4 + 5.5 + 5.5 + 7 + 7.5)= 5.5 8何)=?Z(4.5 + 8 + 24.5 + 0.5 + 84-4.5) = 8.333.3⑴ £叫=1682 Yy,.2 =118266 上£ =上四登= 0.03276 乙’n 30y = 1682/30 = 56.0672 1 -.2 1 fv -2) H8266-30x50.067A2s =—>()',—)') =—7 L H ~ny = ------------------------------ —— ------------ = 826.271 〃一1旨)30-1*时=上匚2 =0.03276x826.271 = 27.07 nse(项)=0(顼)=5.203△ =,x se(项)=1.96 x 5.203 = 10.19895%置信度下置信区间为(56.067-10.198, 56.067+10.198) = (45.869,66.265). 因此,对该校学生某月的人均购书支出额的估计为56.07 (元),由于置信度95% 对应的『= 1.96,所以,可以以95%的把握说该学生该月的人均购书支出额大约在45.87〜66.27元之间。

统计学 第4章 概率分布 样本统计量

统计学 第4章 概率分布 样本统计量

样本比例的分布
(proportion)
1. 总体(或样本)中具有某种属性的单位与全部单 总体(或样本) 位总数之比
不同性别的人与全部人数之比 合格品(或不合格品) 合格品(或不合格品) 与全部产品总数之比
2. 总体比例可表示为 3. 样本比例可表示为
n0 p= n
4 - 36
N0 π= N
N1 或 1−π = N
µ = 2.5
σ2 =1.25
4 - 22
µx = 2.5 2 σx = 0.625
2008年 2008年8月
统计学
STATISTICS (第三版) 第三版)
4 - 23
2008年 2008年8月
统计学
STATISTICS (第三版) 第三版)
样本均值的分布 与中心极限定理
当总体服从正态分布N 当总体服从正态分布 N(µ,σ2)时 , 来自该总体的所有 容量为n的样本的均值 也服从正态分布, 容量为n的样本的均值x也服从正态分布,x 的期 望值为µ 方差为σ 望值为µ,方差为σ2/n。即x~N(µ,σ2/n)
一个任意分 布的总体
σx =
σ
n
当样本容量足够 大时( 大时(n ≥ 30) , 样本均值的抽样 分布逐渐趋于正 态分布
µx = µ
4 - 27
x
2008年 2008年8月
统计学
STATISTICS (第三版) 第三版)
中心极限定理
(central limit theorem) theorem)
x 的分布趋于 正态分布的过 程
1. 样本均值的分布
σ2 x ~ Nµ, n
x −µ
σ
2 σx =

抽样技术(第三版)PPT 讲稿4

抽样技术(第三版)PPT 讲稿4
15 18 26 14 20 28 21 19 31 17
合计 209
作物总产量(乡) 种植面积(乡)
yi(万公斤)
xi(亩)
22.0
800
22.8
780
30.2
1000
21.7
700
25.3
880
31.2
1100
26.0
850
20.5
800
33.8
1200
23.6
830
257.1
8940
yi yi M i
S 2 : 总体方差
S 2 1 N Mt 1 i
M j
2
Yij Y
S
2 b
:
总体群间方差
Sb2
M N 1
N i
(Yi Y )2
S
2 w
:
总体群内方差
S
2 w
1 N (M
1)
N i
M j
Yij Yi 2
第一节 概述
s 2 : 样本方差
s2 1 n nM 1
M
yij y 2
第三节 等概率两阶段抽样节 概述
一、多阶段抽样
1. 什么是多阶段抽样?
分多个阶段抽到最终接受调查的样本。 初级单元(PSU)----Primary Sampling Unit 二级单元 (SSU)----Second-stage Sampling Unit 三级单元(TSU)----Third-stage Sampling Unit 最终单元 (USU)----Ultimate Sampling Unit
i1 jk
NM (M 1) 2
第二节 等概率整群抽样
上式中的分母为:

抽样技术-第三版-全部课后答案

抽样技术-第三版-全部课后答案

抽样技术-第三版-全部课后答案第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。

(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。

然后用r+19999作为被抽选的数。

解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。

第二,每个单元被抽中的概率是已知的,或者是可以计算的。

第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。

因此(1)中只有1~64是可能被抽中的,故不是等概的。

(2)不是等概的【原因】(3)是等概的。

2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。

如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s1706366666206*300500003001500001)()ˆ(222=-=-==s nf N y N v YV 19.413081706366666(==)y v 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。

抽样技术第四版习题答案(供参考)

抽样技术第四版习题答案(供参考)

抽样技术第四版习题答案(供参考)-CAL-FENGHAI.-(YICAI)-Company One1第2章2.1 解:()1 这种抽样方法是等概率的。

在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是1100。

()2这种抽样方法不是等概率的。

利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是2100,而尚未被抽中的编号为36~63的每个单元的入样概率都是1100。

()3这种抽样方法是等概率的。

在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是11000,所以这种抽样是等概率的。

_y E y y -=近似服从标准正态分布, _Y 的195%α-=的置信区间为2y z y z y y αα⎡⎡-+=-+⎣⎣。

而()21f V y S n-=中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间为,y y ⎡⎤-+⎢⎥⎣⎦。

由题意知道,_29.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得_21130050000()2060.6825300f v y s n --==⨯=。

将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192⎡⎤⎣⎦。

下一步计算样本量。

绝对误差限d 和相对误差限r 的关系为_d rY =。

根据置信区间的求解方法可知根据正态分布的分位数可以知道21P Z αα⎫⎪⎪≤≥-⎬⎪⎪⎭,所以()2_2r Y V y z α⎛⎫⎪= ⎪⎝⎭。

也就是2_2_222/221111r Y r Y S n N z S n N z αα⎡⎤⎛⎫⎢⎥⎛⎫ ⎪⎛⎫⎝⎭ ⎪⎢⎥-=⇒=+ ⎪ ⎪⎢⎥⎝⎭⎝⎭⎢⎥⎣⎦。

把_29.5,206,10%,50000y s r N ====代入上式可得,861.75862n =≈。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

抽样技术作业二(3.3,3.4,3.5,4.2,4.3,4.5)袁闪闪 2120502119邮箱:yuanshanshan.110@3.3 解:由数据可得:;hh N h n hh N W N=h h h n f N = 11hn h hi i hy y n ==∑ 2211()1hn h hi h i h s y y n ==--∑ 1 256 10 0.303 0.0391 11.2 94.4 2 420 10 0.498 0.0238 25.5 302.5 3168 100.199 0.0595 20 355.6 总计 844 301(1)求平均支出和标准差的估计。

由表中的数据及先赢得公式可得:3__120.068h h st h y W y ===∑3_22119.472h h h st h h f v y W s n =-⎛⎫== ⎪⎝⎭∑__ 3.077st st s y v y ⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭所以:该小区购买彩票的平均支出为:20.068元,标准差估计为3.077.(2)由区间估计可知相对误差限满足()()____11st st st st y Y r Y P y Y r Y P V y V y αα⎧⎫-⎪⎪⎧⎫⎪⎪-≤≥-⇒≤≥-⎨⎬⎨⎬⎩⎭⎪⎪⎪⎪⎩⎭所以:()_2st r Y z V y α=,()2_2st r Y V y z α⎛⎫⎪= ⎪⎝⎭。

样本均值的方差为()2232221111h h h st hh hhh h h f W S V y WS W Sn n N ω=-==-∑∑∑,从而可以得到在置信度为α,相对误差限为r 条件下的样本量为:()22222_22211hh h h h h st h hh h WS W S n V y W S r Y z W S N Nαωω==⎛⎫++ ⎪⎝⎭∑∑∑∑。

方法一:比例分配:h h W ω= 则: 22_221hhhhW Sn r Y z W SNα=⎛⎫+ ⎪⎝⎭∑∑h h h n n nW ω==把相应的估计值和数值195%,10%r α-==代入后可以计算得到样本量和相应的在各层的样本量分别为:1231218656.457,92.693,18636n n n n n n ==≈=≈=--=,。

方法二:内曼分配: h h h hhW S W Sω=∑则:()22_221hhhhW S n r Y Z W SNα=⎛⎫+ ⎪⎝⎭∑∑h h h hhhn n nW S W Sω==∑把相应的估计值和数值195%,10%r α-==代入后可以计算得到样本量和相应的在各层的样本量分别为:12312175.3717633.7=34,99,17643n n n n n n ≈=≈==--=,3.4 解:由数据可得:N=165000,h=6hh Wh nh a1 0.18 27 0.92 0.21 28 0.933 3 0.14 27 0.9 4 0.09 26 0.8675 0.16 28 0.933 60.22290.97(1)求该市居民在家吃年夜饭的样本比例和标准差的估计:6192.4%st h h h p W p ===∑()()()()662211111h h st hh h h h h h p p v p W v p W f n ==-==--∑∑= 0.0003949379__0.0199st st s y v y ⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭(2)由区间估计可知绝对误差限满足()()__11st st st st y Y d P y Y d P V y V y αα⎧⎫-⎪⎪⎧⎫⎪⎪-≤≥-⇒≤≥-⎨⎬⎨⎬⎩⎭⎪⎪⎪⎪⎩⎭所以:()2st d z V y α=,()22st d V y z α⎛⎫= ⎪ ⎪⎝⎭。

样本均值的方差为()2232221111h h h st hh hhh h h f W S V y WS W Sn n N ω=-==-∑∑∑,从而可以得到在置信度为α,绝对误差限为d 条件下的样本量为:()()2222222211h h h h h hst h h h hW S W S n V y W S d z W S N Nαωω==++∑∑∑∑ 这里的方差是()211h h h h h N S P P N =--,在1h h N N -≈的条件下,近似有()21hh h S P P =-。

方法一:比例分配:h h W ω=则: ()22221hhhhW Sn d z W SNα=+∑∑h h h n n nW ω==把相应的估计值和数值195%,1%d α-==代入后可以计算得到样本量和相应的在各层的样本量分别为:1234562658.32659479,558,372,239,426,585.n n n n n n n ≈=======, 。

方法二:内曼分配: h h h hhW S W Sω=∑则:()()22221h h h h W S n d Z W S N α=+∑∑ h h h hhhn n nW S W Sω==∑把相应的估计值和数值195%,1%d α-==,代入后可以计算得到样本量和相应的在各层的样本量分别为:1234562560.42561535,519,416,304,396,392.n n n n n n n ≈=======,3.5解:层数:10h =,每个层的样本均值_h y ,层权h W ,样本量h n ,样本标准差_h v 已知,可以计算该开发区居民购买冷冻食品的平均支出的估计值为:10175.79st h h h y W y ===∑。

在各层的抽样比可以忽略下,将相应的数据带入方差估计的公式,可得:10_221159.8254h h h st h hf v y W s n =-⎛⎫=≈ ⎪⎝⎭∑__7.74st st s y v y ⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭则这个开发区的居民购买冷冻食品的平均支出195%α-=置信区间为__22,st st y z v y y z v y αα⎡⎤⎛⎫⎛⎫-+=⎢⎥ ⎪ ⎪⎝⎭⎝⎭⎢⎥⎣⎦__1.96, 1.96st st y v y y v y ⎡⎤⎛⎫⎛⎫-+⎢⎥ ⎪ ⎪⎝⎭⎝⎭⎢⎥⎣⎦=[75.79 1.967.74]±⨯=[]60.63,90,95代入数值后,可得最终的置信区间为[]60.63,90,95元。

4.2,解:由题目可得:87=N ,15=n ,8715==N n f (1)将表中的数据带入相应的公式可得:709.0911646ˆ11≈==∑∑==n i ini iMyp733.6011==∑=ni iMnM221111ˆˆ()()0.0005791ni i i f v p y pM M n n =-=-=-∑ 所以此估计量的标准差为:ˆˆ()()0.024s pv p == 所以同意改革人数的比例为70.9%,估计的标准误为:2%。

4.3,解:由题意可得:1048,10,48N n f === 由题意得7361=∑=n i i y ,3651=∑=ni i M ,则办公费用的总支出的估计为:8.35327361048ˆ1=⨯==∑=ni i y nN Y(元) 群总和均值:6.7373610111=⨯==∑=n i i y n y (元)总支出的方差估计为:221()7276( 5.41)ˆ()41nii y y N f v Ynn =--=⋅=-∑=()()ˆˆ269.75s Yv Y == 该集团办公费用总支出支出195%α-=置信区间为:()()()()22ˆˆˆˆˆˆˆ, 1.96, 1.96Y z v Y Y z v Y Y v Y y v Y αα⎡⎤⎡⎤-+=-+⎢⎥⎢⎥⎣⎦⎣⎦=[3532.8 1.96269.75]=[3004.098,4061502]±⨯ 可得最终的置信区间为[3004.098,4061502]元。

4.5,解:由题意可得:200=N ,10=n ,6M =,3=m ,10.05n f N==,5.02==M mf将相应数据带入公式,可得拍摄过艺术照的女生的比例估计为:3.03109ˆ1=⨯==∑=nmypni i估计的标准差为:221111ˆ()()0.0057471ni i f v p y p m m n n =-=⋅⋅-⋅=-∑ 0758.0005747.0)ˆ()ˆ(===p v ps 所以估计拍摄过个人艺术照的女生比例为30%,其估计的标准差为0.00758.Code:#######抽样技术作业第三章3.3income<-read.delim("book3.3.txt",=c('x1','x2','x3'));income#读入数据 attach(income)n1=length(x1);n1#求每层的抽样数 N1=256; N2=420; N3=168;NN=c(N1,N2,N3); N=sum(NN);NW=c(NN/N);W #求每层的层权 f=c(n1/NN);f #求每层的抽样比y=apply(income,2,mean);y#求每层的均值 s=apply(income,2,var);s#求每层的方差估计 y_st=W%*%y;y_st #求均值的简单估计 v_st=W^2%*%(((1-f)/n1)*s);v_sts_st=sqrt(v_st);s_st#求每层的标准差估计#(1)比率分配 r<-0.1;a=W%*%(s);ab=(0.1*y_st/qnorm(1-0.025))^2;b n_1=a/(b+a/N);n_1#总数 n1=n_1*W;n1#各分层样本数 #(2)内曼分配a1=W%*%sqrt(s);a1n_2=a1^2/(b+a/N);n_2 #总数估计n2=n_2*W*sqrt(s)/a1;n2 #各层样本数估计###############抽样技术作业第三章3.4X<-read.delim("book3.4.txt",=c('x1','x2'));X#读入数据attach(X)N=165*10^4;n1=30;n=length(x1);np=x2/n1;p #求每层样本的比率估计W=x1;p_st=W%*%p;p_st #求均值估计v_st=(W^2-n1/(N*W))%*%(p*(1-p)/(n1-1));v_st#求方差估计s_st=sqrt(v_st);s_st#(1)比率分配r=0.01;s=p*(1-p);a=W%*%s;ab=(r/qnorm(1-0.025))^2;bn_1=a/(b+a/N);n_1#总数n1=n_1*W;n1#各分层样本数#(2)内曼分配a1=W%*%sqrt(s);a1n_2=a1^2/(b+a/N);n_2 #总数估计n2=n_2*W*sqrt(s)/a1;n2 #各层样本数估计###############抽样技术作业第三章3.5X<-read.delim("book3.5.txt",=c('x1','x2','x3','x4'));X#读入数据attach(X);y_st=(x1/100)%*%x3;y_stv_st=(x1/100)^2%*%(x4^2/x2);v_sts_st=sqrt(v_st);s_std<-qnorm(1-0.025);d1=y_st-s_st*d;d1d2=y_st+s_st*d;d2###############抽样技术作业第四章4.2rm(list=ls(all=TRUE))#清楚变量X<-read.delim("book4.2.txt",=c('x1','x2'));Xattach(X);N=87;n=15;M_mean=mean(x1);M_meany_mean=mean(x2);y_meanp=sum(x2)/sum(x1);pv_st=1/(M_mean^2)*(1-n/N)*c(x2-p*x1)%*%c(x2-p*x1)/(n*(n-1));v_st s=sqrt(v_st);s###############抽样技术作业第四章4.3rm(list=ls(all=TRUE))#清楚变量X<-read.delim("book4.3.txt",=c('M','y'));Xattach(X);N=48;n=10;y_mean=N*mean(y);y_meanY=N/n*y_mean;Yv=N^2*(1-n/N)/n*var(y);vs=sqrt(v);sd<-qnorm(1-0.025);d1=y_mean-s*d;d1d2=y_mean+s*d;d2 #做置信区间###############抽样技术作业第四章4.5rm(list=ls(all=TRUE))#清楚变量X=read.delim("book4.5.txt");XN=200;n=10;M=6;m=3;f1=n/N;f2=m/M;p=sum(X/m)/n;pv_p=1/(m^2)*(1-n/N)*c(X[,1]-p*m)%*%c(X[,1]-p*p)/(n*(n-1));v_ps_p=sqrt(v_p);s_pd<-qnorm(1-0.025);d1=p-s_p*d;d1d2=p+s_p*d;d2。

相关文档
最新文档