抽样技术第二章参考答案

合集下载

抽样技术课后习题答案

抽样技术课后习题答案
1700
12
160
1700
3
170
2000
13
180
2000
4
150
1500
14
130
1400
5
160
1700
15
150
1600
6
130
1400
16
100
1200
7
140
1500
17
180
1900
8
100
1200
18
100
1100
9
110
1200
19
170
1800
10
140
1500
20
120
1300
20
试估计平均每户家庭订报份数及总的订报份数,以及估计量的方差。
解:由题意得到 , , ,
故 (份)
(份)
(份)
于是由以上的计算结果得到平均每户的订报份数为1.875,估计量方差为0.00391875。该辖区总的订阅份数为7500,估计量方差为62700。
4.2
某工业系统准备实行一项改革措施。该系统共有87个单位,现采用整群抽样,用简单随机抽样抽取15个单位做样本,征求入选单位中每个工人对政策改革措施的意见,结果如下:
1
42
6.2
11
60
6.3
2
51
5.8
12
52
6.7
3
49
6.7
13
61
5.9
4
55
4.9
14
49
6.1
5
47
5.2
15
57
6.0

抽样技术:第2章课后答案

抽样技术:第2章课后答案

第2章2.1 M: (I)这种抽样方法是等機率的・在毎次抽取川本敢尤时.冊未被抽中的编号为1〜64的这兰单元中毎一个m兀被抽刮的槪率都足亠.100(2)这种抽杆方法不艮等嵐略的.利用这种方法.任每次抽収样本恥尤时.尚未被抽中的編号为1-35 U及编号为64的这36个嘏元中毎个敏元的入—.而尚木被捕中的编号为36~63的毎100个唯元的入样執丰祁足丄•100(3)这艸抽样方法是零怨率的.在邰次抽取样木单元时.尚未被抽中的编号为20 000〜21 000中的毎个服元的入样駅率都是詁亦・所以这种抽祥是等槪率的・2.2 W:2.3解:许先(Ail i^iUKKH用电凰的95%的KWK何.根撫中心极RI定理可知.在大样本的条件卜.[升和讣卩药]=[升1・96 皿灯+ 1・96风可•向叫亍)=上上$2中总体的方差S ,是未知的.用样本方差 /来代fh ?¥(SkM 为由聽盘知道.y = 9.5,52= 206 •而且样木址为“ = 300,N = 50 000・代入对以求刁严6)= 乎/二上驾铲°°°x206 = 0.682 5 •将它幻代入上面的式「町能该山居民日用电虽的95%置信区何为[7.880 8,11.119 2].下一步汁舒样木址.绝対谋船Bid和郴対的关系为d = Fp ・ 根区何的求解方注町卸把y = 9.5,s 2= 206.r = 10%,AT = 50 000 代入上式町阳.H = 861.75 ^862 .所以杆木 18至少为2.4 解:总体中套加培训班的比例为P.强么这次简眾閤机抽样紂到的P 的估计ffip 的方溢 1-f N “、 n-PP(l-P)・利用中心极国迷理可得+—在人杆木的条件F 近似眼从标准正念分布.V 的l-a=95%的B!怙区何为v-r> 1 —a根据正念分布的分位数町以知适P庄和g中.样木盘足够大.从m何typ的1-0=95%的置伉区何为]卩・讣卩莎P+Z^JF⑹卜丽这眼的叫P)是未妹的.我们便用它的估计(ftr(p)=v(p)=^p(l-p)=9.652xl0-\所以总体比例P的l-a = 95%的置仃区何可以写为["-二呻庶门“ +兀喘応孑}将p = O.35^ = 2OO.y = IOOOO代入町得K信区何为〔0.284 4.0.4156].2.5解:利用衍到的样木.计ma样本均值为歹=2 890/20 = 144.5.从ifiH占计小区的平均文化支出为144.5 7U.总体均(ftV的l-a = 95%的迓仃区何为卩-二皿灰冰歹匕曲丁^药]用二乎,来估计样本均值的方筮卩@)・计算斜到F =826.025 6,则卩(刃=匕上T =匕巴丄只826・025 6 = 37」72 •n20£/:丿卩(刃=1 %xj37.172 71.95 •代入数W可紂总体肉值的95%的置佰区何为[132.55J 56.45].2.6M:根据样木位息估计对衍毎个乡的平均产诫为1120吨.该地区今年的粮伐总产虽丫的佔计值为X = 350> = 350xl 120 =3.92xl05(吨)•)S2.总体总(ft 的I・a = 95%的盘伉区何为总体总(ft估计值的方差为rM= W•把y = 3.92X10\S2 = 25 600,n = 50,^ = 350,= 1.96代入.可須粮伏总产虽的l-a=95%的置信区何为[377 629.406 371]./ = ^.za/:解:泞先计外简腋皈机抽样条什下所需耍的祥本虽・把N = l 000,d = 2」-a = 95%S'=68 帯入公式%如果彩电到仃效河猝率的问題・亦仃效冋??率为70%时・样本虽应该加终确定为/70% = 88.57 *89./i = no2.8 M:去年的化肥总产虽和今邻的总产量Z何存在较強的WXfte iliifl这种相关关系较为楼定.所以引入去年的化肥产址作为辅助变虽・「•建我的采用比申估计址的形式*估计今年的化肥总产虽•去年化肥总广虽为X = 2I35・利用£年的化肥总严虽・今年的化肥总产虽的估计(ft为y/?X=^X = 2 426.14< =■X2.9駢:木JS中.简險估计址的方羞的估计(ft为v(y)=^L S2 =37.17.n利用比率估itfit进行估计时.我们引入了家庭的总支出作为辅助变fit.记为X・文化支出届F总支岀的一部分.这个上箜变st与辅助变st之何存在较強的相关关系.面11它m之何的关系是比较住定的.11全部家庭的总支出是已知的虽・文化支出的比率估计就为y^RX^X.通过if■算彻到y = 2 890/20 = 144.5・ifijx = l 580.則' V 144 5 ・/? = 1 = 2_£O,O915.文化支岀的比率佔计址的值为儿= 146.3 (元人=•I现在考Jg比率佔计fit的方差.在样木足牧大的条件几卩(耳片MSE(耳片乎(S j2RpS・S,+用S:)・通过计件吋以得到两个变fit的样本方羞为A?=826,.<=9.958xl0\『和X之何的相关系数的佔计值为p = 0.974.代入上面的公式.可U得到比半估计虽的方差的佔计備为v耳=1.94・这个数值比简的方羌佔计值耍小很个部家庭的平均文化支出的l-a = 95%的盘估X何为[斤・%应订•齐+ %応「卜“96^面•齐+1 %応J]・把具体的敌值代入可得置仃区何为[143.57.149.03].y[yA彳元)接下来比较比佔汁和简腋佔计的效札亠亠2 = :^ = 0・052・这是比佔计的设计效应v(y)呛)37.17值,从这里可以看岀比佔计駅比简乐佔计虽的效率史高.2.10 利用简爪佔计址町紂戸=》比/” = 1 630/10二163・样本方澄为? =212.222, AT = 120・样本均值的方左佔计值为v(y)=52 = ^1^120 x212.222 = 19.453 7.利用回贮估计的方注.在这里选取肉牛的KiRfi为辅助变址.迭擇原電虽为緬助矢St是合理的.因为肉牛的很大程皮上彩响荷肉牛的现任的車虽・二折Z何“庄牧冬的相关性.郴关系数的估计血为2 = 0.971 •临II 这种相关关瑕是稳定的.这觇肉牛的原載虽的8(值已经衍到.所以选好肉牛的廉載ft为辅助妞.* * |4 CAQ何粉估计SMM度加高的冋•垠敌“的伕计ffi为/7 = p—= 0.971x^^- = 1.368.现在何以衍到$. 10.341肉牛fltiF.fi 的回归佔计fit 为无=戸+ 0 X^x .代入数值町以月到畀=159.44.囚为恋在肉牛股秋fit 这个牧好的辅助变足,所以冋$1佔计虽的箱度耍好「简冋归估计fit 入的方差为打兀)=MSE (人方差的佔计位为仏卜•代入柿应的敷值・单估计就・。

应用抽样技术课后习题答案

应用抽样技术课后习题答案

=(0.0907,0.4433)
N1的95%的置信区间为: (159,776) 95%的置信区间为 (159, 的置信区间为:
(3)N=1750,n=30, (3)N=1750,n=30,n1=8, t=1.96, p=0.267, q=1q=1-0.267=0.733 由此可计算得: t 2q 1.962 × 0.733 n0 = 2 = =1054.64 r p 0.01× 0.267 n = n0/[1+(n0—1)/N] = 1054.64/[1+1053.64/1750]=658.2942 = 659 计算结果说明,至少应抽取一个样本量为659的简单随机 样本,才能满足95%置信度条件下相对误差不超过10%的精度 要求。
t=1.96 (2)易知,N=1750,n=30, n = 8 1 n 8 N − n 1750 − 30 1− f p= 1 = = 0.267 = = = 0.03389 n −1 (n −1)N 29 ×1750 n 30
pq = p(1 − p) = 0.267 × 0.733 = 0.1957
5.5 证明:由(5.6)得:
V ( yR ) ≈ 1− f n (Yi − RX i )2 ∑
i =1 N
N −n 2 令 Sd = V , Nn
2 d
N −1
=
N −n 2 Sd Nn
则n(NV + S ) = NS ,
2 d
S 2 NSd 从而n = = V 2 2 NV + Sd Sd 1+ NV
第五章 比率估计与回归估计
5.2 N=2000, n=36, 1-α=0.95, t=1.96, ˆ f = n/N=0.018, v(R) = 0.000015359, ˆ se(R) =0.00392 置信区间为[40.93%,42.47%]。 置信区间为[40.93%,42.47%]。

抽样技术第二章参考答案

抽样技术第二章参考答案

抽样技术第⼆章参考答案第⼆章习题判断下列抽样⽅法是否是等概的:(1)总体编号1~64,在0~99中产⽣随机数r ,若r=0或r>64则舍弃重抽。

(2)总体编号1~64,在0~99中产⽣随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产⽣随机数r 。

然后⽤r+19999作为被抽选的数。

解析:等概抽样属于概率抽样,概率抽样具有⼀些⼏个特点:第⼀,按照⼀定的概率以随机原则抽取样本。

第⼆,每个单元被抽中的概率是已知的,或者是可以计算的。

第三,当⽤样本对总体⽬标进⾏估计时,要考虑到该样本被抽中的概率。

因此(1)中只有1~64是可能被抽中的,故不是等概的。

(2)不是等概的【原因】(3)是等概的。

抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同解析:抽样理论和数理统计中关于样本均值的定义和性质的不同为了合理调配电⼒资源,某市欲了解50000户居民的⽇⽤电量,从中简单随机抽取了300户进⾏,现得到其⽇⽤电平均值=y (千⽡时),=2s 206.试估计该市居民⽤电量的95%置信区间。

如果希望相对误差限不超过10%,则样本量⾄少应为多少解:由已知可得,N=50000,n=300,5.9y =,2062=s1706366666206*300500003001500001)()?(222=-=-==s nf N y N v YV19.413081706366666(==)y v该市居民⽤电量的95%置信区间为[])(y [2y V z N α±=[475000±*]即为(,)由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤-即n ≥862欲使相对误差限不超过10%,则样本量⾄少应为862某⼤学10000名本科⽣,现欲估计爱暑假期间参加了各类英语培训的学⽣所占的⽐例。

抽样技术课后习题_参考答案_金勇进

抽样技术课后习题_参考答案_金勇进

第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。

(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。

然后用r+19999作为被抽选的数。

解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。

第二,每个单元被抽中的概率是已知的,或者是可以计算的。

第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。

因此(1)中只有1~64是可能被抽中的,故不是等概的。

(2)不是等概的【原因】(3)是等概的。

2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。

如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。

随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。

解析:由已知得:10000=N 200=n 35.0=p 02.0==Nnf 又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。

抽样技术第二章_简单随机抽样

抽样技术第二章_简单随机抽样

目前,世界上已编有许多种随机数表。其中较 大的有兰德公司编制,1955年出版的100万数 字随机数表,它按五位一组排列,共有20万组 ;肯德尔和史密斯编制,1938年出版的10万 数字随机数表,它也按五位一组排列,共有 25000组。我国常用的是中国科学院数学研究 所概率统计室编印的《常用数理统计表》中的 随机数表。
率都等于1/ CNn,这种抽样称为简单随机抽样。
注意:定义2.1与定义2.3是等价的。
三个定义之间的联系
简单随机抽样的具体实施方法
常用的有抽签法和随机数法两种。 (一)抽签法 抽签法是先对总体N个抽样单元分别编上1到N的号码,再制作与
之相对应的N个号签并充分摇匀后,从中随机地抽取n个号签(可以 是一次抽取n个号签,也可以一次抽一个号签,连续抽n次),与抽 中号签号码相同的n个单元即为抽中的单元,由其组成简单随机样 本。 抽签法在技术上十分简单,但在实际应用中,对总体各单元编号 并制作号签的工作量可能会很繁重,尤其是当总体容量比较大时 ,抽签法并不是很方便,而且也往往难以保证做到等概率。因此 ,实际工作中常常使用随机数法。
s2 / n
s(y)
y
t
1
2
s(y),y
t
1
2
s(y)
概述
一、简单随机抽样(或单纯随机抽样) 本书一般局限于不放回随机抽样
二、实施方法 三、地位、作用
是其他抽样方法基础
2.1定义与符号
定义2.1 从总体的N个单元中,一次整批抽取n 个单元,使任何一个单元被抽中的概率都相等 ,任何n个不同单元组成的组合被抽中的概率 也都相等,这种抽样称为简单随机抽样.
此外,简单随机抽样要求在抽样前编制出抽样 框,并对每一个总体抽样单元进行编号,而且 当总体抽样单元的分布比较分散时,样本也可 能会比较分散,这些都会给简单随机抽样方法 的运用造成许多的不便,甚至在某些情况下干 脆无法使用。因此,在此基础上研究其它抽样 技术显得更加重要。

《抽样技术》第四版习题答案

《抽样技术》第四版习题答案

第2章(一)创作者(人):历恰面日期:贰零贰贰年1月1日解:这种抽样方法是等概率的。

在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是。

这种抽样方法不是等概率的。

利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是,而尚未被抽中的编号为36~63的每个单元的入样概率都是。

这种抽样方法是等概率的。

在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是,所以这种抽样是等概率的。

解:项目相同之处不同之处定义都是根据从一个总体中抽样得到的样本,然后定义样本均值为。

抽样理论中样本是从有限总体中按放回的抽样方法得到的,样本中的样本点不会重复;而数理统计中的样本是从无限总体中利用有放回的抽样方法得到的,样本点有可能是重复的。

性质(1)样本均值的期望都等于总体均值,也就是抽样理论和数理统计中的样本均值都是无偏估计。

(2)不论总体原来是何种分布,在样本量足够大的条件下,样本均值近似服从正态分布。

(1)抽样理论中,各个样本之间是不的;而数理统计中的各个样本之间是相互的。

(2)抽样理论中的样本均值的方差为,其中。

在数理统计中,,其中为总体的方差。

解:首先估计该市居民日用电量的95%的置信区间。

根据中心极限定理可知,在大样本的条件下,近似服从正态分布,的的置信区间为。

而中总体的方差是未知的,用样本方差来代替,置信区间为。

由题意知道,,而且样本量为,代入可以求得。

将它们代入上面的式子可得该市居民日用电量的95%置信区间为。

下一步计算样本量。

绝对误差限和相对误差限的关系为。

根据置信区间的求解方法可知根据正态分布的分位数可以知道,所以。

也就是。

把代入上式可得,。

所以样本量至少为862。

解:总体中参加培训班的比例为,那么这次简单随机抽样得到的的估计值的方差,利用中心极限定理可得在大样本的条件下近似服从正态分布。

金勇进:《抽样技术(第2版)》课后习题参考答案

金勇进:《抽样技术(第2版)》课后习题参考答案

1 但:曾有实验,欲检验人列数字果随机 10 100
(等可能选取各数字)否。结果表明,各有偏好, P p 实未给定。 (3)之U 、 S s 、 P p 皆未定。 1 . 3 [ 以下资料引译自 “STATISTICAL ESTIMATION METHODS IN VOLUNTEER PANEL WEB SURVEYS”,Sunghee Lee, Ph.D., 2004] 网络调查(Web surveys)并非互联网调查(Internet surveys)之同义语,通常所谓互联网调 查包括网络调查与电子邮件调查(e-mail surveys) ,而网络调查则仅指通过 WWW 浏览器呈 现的调查,故也称网页调查。由于存储与软件兼容性方面的局限性,电子邮件调查远不及网 页调查应用广泛,故对互联网调查的研究主要集中于网页调查。
什么是收视率调查 收视率调查最早是用于了解节目的收视情况,为媒体决策和广告主的媒体选择提供依据。后来由于收视率 调查技术的革新பைடு நூலகம்一种叫做 Audimeter 视听记录仪在调查中的运用,使广告收视率调查变得简单化。 在电视收视率调查方面比较著名的市场调研公司有美国的尼尔逊公司( Nielsen ) 、日本的电通、英国的 TNSOFRES 集团等。它们都能以每分钟为单位来记录分析电视节目的收视情况。所以收视率调查便成为一 种电视广告传播效果的测量方法。 收视率调查的步骤 收视率调查过程包括以下几个步骤: 1、随机抽出一定量的观众样本户构成相对稳定的调查网(观众小组) 。样本大小视研究精度和地区规模而 定。例如台湾益利市场研究顾问公司,在台湾地区建立的调查网样本户是 245 个。 2、在样本户家中的电视机上装上 Audimeter 这种仪器,它能自动地记录受调查对象家中收看电视节目的时 间和频道。 3、每隔一段时间(如一周)把自动记录仪内的软片或磁带取下带回公司分析,就可以算出每日全部节目每 一分钟的收视率。现在由于技术的进步,研究机构甚至可以通过电话连线随时从被调查户提取记录信息。 一般来说,收视率愈高,说明广告的传播效果愈好。

抽样技术_第三版_全部课后答案

抽样技术_第三版_全部课后答案

第二章习题判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。

(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。

然后用r+19999作为被抽选的数。

解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。

第二,每个单元被抽中的概率是已知的,或者是可以计算的。

第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。

因此(1)中只有1~64是可能被抽中的,故不是等概的。

(2)不是等概的【原因】(3)是等概的。

抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y (千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。

如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s1706366666206*300500003001500001)()ˆ(222=-=-==s nf N y N v YV 19.413081706366666(==)y v 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±*]即为(,) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为862某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。

随机抽取了两百名学生进行调查,得到P=,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。

《抽样技术》习题答案(老杜)

《抽样技术》习题答案(老杜)

2.1 解:1 这种抽样方法是等概率的。

在每次抽取样本单元时,尚未被抽中的编号1为1〜64的这些单元中每一个单元被抽到的概率都是——。

1002这种抽样方法不是等概率的。

利用这种方法,在每次抽取样本单元时,尚未被抽中2的编号为1〜35以及编号为64的这36个单元中每个单元的入样概率都是丄,而尚未被100抽中的编号为36〜63的每个单元的入样概率都是—。

1003这种抽样方法是等概率的。

在每次抽取样本单元时,尚未被抽中的编号为121 000中的每个单元的入样概率都是 -------------- ,所以这种抽样是等概率的。

1 0002.2 解:20 0002.3 解: 首先估计该市居民日用电量的95%勺置信区间。

根据中心极限定理可知, 在大样本的条件下,y E y近似服从标准正态分布,95%的置信区间为y z ;2y 1.96少y , y 1.96& y 。

1 f2 2 2而V y ——S 2中总体的方差S 2是未知的,用样本方差S 2来代替,置信区间 n日用电量的95%置信区间为 7.8808,11.1192 。

根据置信区间的求解方法可知2.4 解:总体中参加培训班的比例为 P ,那么这次简单随机抽样得到的P 的估计值P1 f N的方差V P —-- P1 P ,利用中心极限定理可得 十n N 1J V似服从标准正态分布。

在本题中,样本量足够大,从而可得P Z {2& P ,P Z 占 P 。

为 y 1.96』—s,y 1.96由题意知道,y 9.5, S 2206,而且样本量为n 300, N 50 000,代入可以求得v(y) Js 2 1 300 50 000 n300206 0.682 5。

将它们代入上面的式子可得该市居民 下一步计算样本量。

绝对误差限d 和相对误差限 r 的关系为d rY 。

根据正态分布的分位数可以知道Z/2,所以V y2rY--- OZ,21也就是—nS 2rYZ/22rYZ 2/2S 2把y 本量至少为9.5,s 206,r 10%, N 50 000代入上式可得,n 861.75 862。

应用抽样技术第三版课后习题答案

应用抽样技术第三版课后习题答案

应用抽样技术第三版课后习题答案应用抽样技术第三版课后习题答案抽样技术是统计学中重要的一部分,它用于从总体中选择一部分样本,以便对总体进行推断。

在应用抽样技术的过程中,我们常常会遇到一些难题和疑惑。

为了帮助读者更好地理解和应用抽样技术,本文将为大家提供《应用抽样技术第三版》课后习题的详细解答。

第一章:抽样方法的基本概念1. 抽样方法的基本概念抽样方法是指从总体中选取一部分样本,以代表整个总体。

常用的抽样方法包括简单随机抽样、分层抽样、整群抽样等。

在选择抽样方法时,需要根据具体问题和研究目的来确定最适合的方法。

2. 简单随机抽样简单随机抽样是指从总体中随机选择样本,使每个样本都有相等的机会被选中。

这种抽样方法适用于总体规模较小且分布均匀的情况。

3. 分层抽样分层抽样是将总体划分为若干个层次,然后从每个层次中随机选择样本。

这种抽样方法适用于总体具有明显层次结构的情况,可以提高样本的代表性。

4. 整群抽样整群抽样是将总体划分为若干个群组,然后从每个群组中随机选择样本。

这种抽样方法适用于总体群组之间差异较大的情况,可以减少抽样误差。

第二章:简单随机抽样1. 简单随机抽样的步骤简单随机抽样的步骤包括确定总体、确定样本容量、编制总体名单、进行随机抽样和分析样本数据。

在确定样本容量时,需要考虑总体的大小、抽样误差和置信水平等因素。

2. 简单随机抽样的应用简单随机抽样广泛应用于各个领域的调查和研究中。

例如,在市场调查中,可以使用简单随机抽样来获取消费者的意见和反馈;在医学研究中,可以使用简单随机抽样来选择研究对象。

第三章:分层抽样1. 分层抽样的步骤分层抽样的步骤包括确定总体、划分层次、确定每层样本容量、进行随机抽样和分析样本数据。

在确定每层样本容量时,需要根据每个层次的重要性和变异程度来确定。

2. 分层抽样的应用分层抽样适用于总体具有明显层次结构的情况。

例如,在教育调查中,可以将学校划分为不同的层次,然后从每个层次中随机选择样本;在人口统计调查中,可以将人口按照年龄、性别等因素划分为不同的层次,然后进行抽样。

东北林业大学《抽样技术》第二章抽样调查基本原理

东北林业大学《抽样技术》第二章抽样调查基本原理




影响抽样误差的因素: 1.抽样误差通常会随样本量的大小而增减。 2.所研究现象总体变异程度的大小。 3.抽样的方式方法。 非抽样误差不是由于抽样引起的。它又包括: 调查误差;无回答误差;抽样框误差;登记性误差。 同抽样误差相反,非抽样误差是随着样本量的增加 而增大的。由于抽样调查的访问和资料整理都比普 查更便于进行,因此非抽样误差也远远小于普查。 有时,普查中的非抽样误差甚至大于抽样调查中抽 样误差与非抽样误差的总和。



(1)作业总体单位与目标总体单位是一一对应的。这 是最常见的形式。例如,要调查某地区的住户总体, 以该地区的住户名册为抽样框,那么,从抽样框中 抽中的住户即作为估计总体的单位。 (2)多个作业总体单位对应着一个目标总体单位。例 如,要调查某学校学生家庭情况,以该学校学生名 单为抽样框,而在这份学生名单中可能有二个或更 多个学生同属于一个家庭。 (3)一个作业总体单位对应着多个目标总体单位。例 如,人口调查中以各居(村)民委员会的顺序排列表 为抽样框,这时,所抽中的每个居(村)民委员会内 就包含许多人口。



确定抽样框必须着重考虑的问题: 第一,要能反映出作业总体与目标总体的关系,表 明这二个总体单位属于哪种对应形式。 第二,要能达到对目标总体进行有效的抽样估计的 目的。这一方面要求抽样框应尽可能地包括被用于 估计目标总体的单位,另一方面要求在抽样框单位 中能获得估计总体的信息。 第三,设计和编制抽样框要有利于实施抽样调查和 节省各项费用开支。


在抽样调查实践中,表现作业总体的抽样框通常可 为下列几种形式: (抽样框是在抽样前,为便于抽样工作的组织,在可 能条件下编制的用来进行抽样的、记录或表明总体 所有抽样单元的框架,在抽样框中,每个抽样单元 都被编上号码。) (1)名单抽样框。这是以名单一览表形式列出总体的 所有单位。例如,居民住户调查中按住户地址编码 的顺序列出全部住户的名单表;再如,我国目前的 农产量抽样中,按粮食平均亩产量的大小顺序列出 总体单位(县、乡、村)。

抽样技术第二章简单随机抽样

抽样技术第二章简单随机抽样

2.2 简单估计量及其性质
2.2.1简单估计量的性质
引理2.1 从大小为N的总体中抽取一个样本量为n
的简单随机样本,则总体中每个特定单元入样
的概率为
n N
,两个特定单元都入样的概率
为 nn 1。
N N 1
一、总体均值的估计 1.简单估计及其无偏性:
在没有其他总体信息的 条件下,
第三步:确定所抽样本单元的号码。从上述确定的起 点开始向下(或向右),每次取一个r位数。通常,若所 需抽的数是一位数或两位数(即r=1或2),则由起点开 始,依次向右抽取较方便,达到该行右端时,从下一
行左端开始继续向右抽取;若所需抽的数是三位及以 上(即r≥3)则由起点开始依次向下抽取较方便,达到最 后一行时,向右移10位(或r位),再从第一行开始向下 继续抽取,直到取足所需的n个r位数为止,以这n个r 位数所对应的总体单元组成样本。
第二章 简单随机抽样
第二章 简单随机抽样
1、简单估计量 2、比率估计量 3、回归估计量
例:从某个总体抽取一个n=50的独立同分布样本,样本数据如下: 567 601 665 732 366 937 462 619 279 287 690 520 502 312 452 562 557 574 350 875 834 203 593 980 172 287 753 259 276 876 692 371 887 641 399 442 927 442 918 11 178 416 405 210 58 797 746 153 644 476
(二)随机数法
随机数法就是利用随机数表、随机数骰子或计 算机产生的随机数进行抽样。由于计算机产生 的随机数实际上是伪随机数,不是真正的随机 数,特别是直接采用一般现成程序时,产生的 随机数往往不能保证其随机性。因此,一般使 用随机数表,或用随机数骰子产生的随机数, 特别在n比较大时。

抽样技术课后习题_参考答案_金勇进

抽样技术课后习题_参考答案_金勇进

第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。

(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。

然后用r+19999作为被抽选的数。

解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。

第二,每个单元被抽中的概率是已知的,或者是可以计算的。

第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。

因此(1)中只有1~64是可能被抽中的,故不是等概的。

(2)不是等概的【原因】(3)是等概的。

2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。

如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。

随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。

解析:由已知得:10000=N 200=n 35.0=p 02.0==Nnf 又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。

抽样技术课后习题答案

抽样技术课后习题答案
解:由已知可得,N=50000,n=300, ,
该市居民用电量的95%置信区间为
[ =[475000±1.96*41308.19]
即为(394035.95,555964.05)
由相对误差公式 ≤10%
可得
即n≥862
欲使相对误差限不超过10%,则样本量至少应为862
2.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。
因此(1)中只有1~64是可能被抽中的,故不是等概的。(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值 的定义和性质有哪些不同?
解析:抽样理论和数理统计中关于样本均值的定义和性质的不同
抽样理论
概率统计
定义
性质
1.期望
2.方差
1.期望
2.方差
2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值 9.5(千瓦时), 206.试估计该市居民用电量的95%置信区间。如果希望相对误差限不超过10%,则样本量至少应为多少?
20
试估计平均每户家庭订报份数及总的订报份数,以及估计量的方差。
解:由题意得到 , , ,
故 (份)
(份)
(份)
于是由以上的计算结果得到平均每户的订报份数为1.875,估计量方差为0.00391875。该辖区总的订阅份数为7500,估计量方差为62700。
4.2
某工业系统准备实行一项改革措施。该系统共有87个单位,现采用整群抽样,用简单随机抽样抽取15个单位做样本,征求入选单位中每个工人对政策改革措施的意见,结果如下:

抽样技术 第三版 第二章课后部分答案 R语言

抽样技术 第三版 第二章课后部分答案 R语言

抽样技术作业一(2.5——2.10)袁闪闪 21205021192.5 解:这里N =200,n =20,由表中的数据可得:2011221211144.5201()826.052611()- 6.097n i i i i n i i y y y n s y y n nv y s n N=======-=-=⨯=∑∑∑(1) 因而该小区平均的文化支出Y 的95%的近似置信区间为:22/2/211[-,-][144.5 1.96 6.097][132.5503,156.4497]n n y z s y z s n N n Nαα-⨯+⨯=±⨯=(1)(1) 所以该小区平均的文化支出Y 的估计为144.5元,其95%的置信区间为 (132.55元,156.45元)。

2.6解:有题意可得:N =350,n =50, y =1120,2s =25600, 所以粮食总产量为:3501120392000()Y N y ∧==⨯=元 代入数据得:22/2/211[-,-][392000 1.967332.12][377629,406371]n n y z Ns y z N s n N n Nαα-⨯+⨯=±⨯=(1)(1) 所以总产值的95%的置信区间为:(377629吨,406371吨)。

2.7解:由题意可得:N =1000,d =2,α=0.05,2S =68,r=70%, 带入公式,可得初始样本量:222/2022222/2/21161.362Nz S d n N z S Nd z S ααα⎛⎫=+==≈ ⎪+⎝⎭ 由于有效回答率为r=70%,,对样本容量进行再调整:0070%87.5788nn n r===≈所以样本最终确定为88。

2.8解:由题意已知:N =100,n =10, X =2135,y =25,x =22, 方法一:简单随机估计:100252500()Y N y ∧==⨯=吨方法二:比估计:由经验可知去年的化肥总产量和今年的总产量之间存在较强的相关性,引入去年的化肥总产量作为辅助变量。

抽样技术课后习题_参考答案_金勇进

抽样技术课后习题_参考答案_金勇进

第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。

(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。

然后用r+19999作为被抽选的数。

解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。

第二,每个单元被抽中的概率是已知的,或者是可以计算的。

第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。

因此(1)中只有1~64是可能被抽中的,故不是等概的。

(2)不是等概的【原因】(3)是等概的。

2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。

如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。

随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。

解析:由已知得:10000=N 200=n 35.0=p 02.0==Nnf 又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二章习题
判断下列抽样方法是否是等概的:
(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。

(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.
(3)总体20000~21000,从1~1000中产生随机数r 。

然后用r+19999作为被抽选的数。

解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。

第二,每个单元被抽中的概率是已知的,或者是可以计算的。

第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。

因此(1)中只有1~64是可能被抽中的,故不是等概的。

(2)不是等概的【原因】(3)是等概的。

抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同 解析:抽样理论和数理统计中关于样本均值的定义和性质的不同
为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y (千瓦时),=2
s 206.试估计该市居民用电量的95%置信区间。

如果希望相对误差限不超过10%,则样本量至少应为多少
解:由已知可得,N=50000,n=300,5.9y =,2062=s
1706366666206*300
50000300
1500001)()ˆ(22
2
=-
=-==s n
f N y N v Y
V
19.413081706366666(==)y v
该市居民用电量的95%置信区间为
[])(y [2
y V z N α±=[475000±*]
即为(,) 由相对误差公式
y
)
(v u 2y α≤10%
可得%10*5.9206*n
50000
n 1*
96.1≤-
即n ≥862
欲使相对误差限不超过10%,则样本量至少应为862
某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。

随机抽取了两百名学生进行调查,得到P=,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。

解析:由已知得:10000=N 200=n 35.0=p 02.0==
N
n
f 又有:35.0)()(===∧p p E p E 0012.0)1(1
1)(=---=∧p p n f
p V
该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2


±P V Z P E α
代入数据计算得:该区间为[,]
研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:
编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 10
240
20
120
估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。

解析:由已知得:200=N 20=n
根据表中数据计算得:5.14420120
1
==∑=i i y y ()
06842.827120120
1
22
=--=∑=i i
y y s 21808.37)1(1)(2=-=
s N
n
n y V 10015.6)(=y V
∴ 该小区平均文化支出Y 的95%置信区间为:])(y [2
y V z
α
±即是:[ ,]
故估计该小区平均的文化支出Y =,置信水平95%的置信区间为[ ,]。

某地区350个乡为了获得粮食总产量的估计,调查了50个乡当年的粮食产量,得到y =1120(吨),25602
=S ,据此估计该地区今年的粮食总产量,并给出置信水平95%的置信区间。

解析:由题意知:y =1120 1429.0350
50n ===
N f 25602=S ⇒160=s 置信水平95%的置信区间为:]1y [2
s n
f
z -±α
代入数据得: 置信水平95%的置信区间为:[,]
某次关于1000个家庭人均住房面积的调查中,委托方要求绝对误差限为2平方千米,置信水平95%,现根据以前的调查结果,认为总体方差682
=S ,是确定简单随机抽样所需的样本量。

若预计有效回答率为70%,则样本量最终为多少
解析:简单随机抽样所需的样本量2
2
22
2
12
2
S Z Nd S NZ n αα+=
%
701
2n n =
由题意知:1000=N 2=d 682
=S 96
.12
=αZ
代入并计算得:613036.611≈=n
87142.87%701
2≈==
n n
故知:简单随机抽样所需的样本量为61,若预计有效回答率为70%,则样本量最终为87
某地区对本地100家化肥生产企业的尿素产量进行调查,一直去年的总产量为2135吨,抽取10个企业调查今年的产量,得到25=y ,这些企业去年的平均产量为22=x 。

试估计今
年该地区化肥总产量。

解析:由题可知22x =,
35.211002135===
N X X ,25y =
则,该地区化肥产量均值Y 的比率估计量为
26
.242425
35.21===∧
x y X
Y
该地区化肥产量总值Y 的比率估计量为 242626.24*100ˆˆ===R Y N Y
所以,今年该地区化肥总产量的估计值为2426吨。

如果在解决习题的问题时可以得到这些家庭月总支出,得到如下表:
全部家庭的总支出平均为1600元,利用比估计的方法估计平均文化支出,给出置信水平95%的置信区间,并比较比估计和简单估计的效率。

解析:由题可知1580
130017002300201
x n 1x n 1i i =+++==∑=)(Λ
5.144y =
091.015805.144ˆ=≈===x y r R

329.14615805.144*1600x y y ===X
R
053.826)(111
22
=--=∑=n
i i y y n S
158.3463))((111
=---=∑=n
i i i xy
x x y y n S
579.8831)(111
22
=--=∑=n i i
x
x x n S
故平均文化支出的95%的置信区间为
,)ˆˆ2(1[2222
x yx R S R S R S n f Z y +---α])ˆˆ2(1222
2x
yx R S R S R S n f Z y +--+α
代入数据得(±*)
即为[,]
某养牛场购进了120头肉牛,购进时平均体重100千克。

现从中抽取10头,记录重量,3个月后再次测量,结果如下:
用回归估计法计算120头牛现在的平均重量,计算其方差的估计,并和简单估计的结果进行比较。

解:由题可知,6.10210595101
x n 1x n 1i i =++==∑=)
(Λ 16317015010
1
y n 1y n 1i i =+==∑=)(
Λ 222.2121910*9
1)(1112
2
==--=∑=n i i
y y n S 333.1461317*91))((111==---=∑=n i i
i xy
x x y y n S 933.1064.926*9
1)(11122
==--=∑=n i i x
x x n S 故有368.1933
.106333
.1462
0==
=
x
xy S S β
所以总体均值Y 的回归估计量为
443.159)6.102100(*368.1163)(0=-+=-+=x X y y lr β 其方差估计为:
)2(1)(ˆ02202xy
x lr S S S n f y V ββ-+-=
=
)333.146*368.1*2933.106*368.1222.212(10
1201012-+-
=
而2
1y (ˆS n
f V -=
) =
222.212*10
12010
1- =
显然)(ˆ)(ˆy V y V lr
< 所以,回归估计的结果要优于简单估。

相关文档
最新文档