抽样技术第二章参考答案1
抽样计划与检验培训教材.答案
不良品个数
X 100%
检验之产品单位数
计点型
百件产品缺陷数 =
缺陷之总数 检验之产品单位数
X 100%
抽样检验的类型
按产品质量指标特性分类
(2)计量抽检方法 是从批量产品中抽取 一定数量的样品数(样本),检验该样本 中每个样品的质量,然后与规定的标准值 或技术要求进行比较,以决定该批产品是 否合格的方法。
(实践中,这些假定并不完全靠得住) 1、检验员是按照指定的抽样方案进行工作的。 2、所做的检验是没有误差的,即在测量或鉴定 产品是否合格时,不存在人为的过失或设备 的误差。
挑选样本应注意
抽样范围要全面 抽样数量要准确 抽样一定要随机 抽样要亲自动手
挑选样组
抽样偏差
最常见的偏差是由下列情况所造成的: ◎ 只是从所有容器的同一位置抽样; ◎ 预先观察过产品,然后只挑选那些看上去是不合格 的(或合格的)产品; ◎ 对产品批中那些抽样不方便的部分,置之不理; ◎ 在对产品批是如何组成一无所知的情况下,就对分 层取样的方式作出决定。
一般检验水平Ⅲ级的选用原则
使用方对产品质量有特殊要求时选用 单位产品的价格较高时选用 产品生产过程中随机因素的影响显著时选用 各交验批之间质量均匀性差时选用 当拒收交验批时,平均处理费用大于检验费用时选 用 对质量状况掌握不多时的新产品检验时选用
另一类是特殊检查水平,用于希望样本 大小n较少的场合。GB2828规定有S—1、 S—2、S—3和S—4共四级。一般用于检查 费用极高场合。如破坏性检查,寿命试验, 产品的单价又较昂贵。 其中S—l、S—2又 适用于加工条件较好,交验批内质量较均匀 的状况,而S—3、S—4则适用于交验批内 质量均匀性稍差的场合。
应用抽样技术课后习题答案
=(0.0907,0.4433)
N1的95%的置信区间为: (159,776) 95%的置信区间为 (159, 的置信区间为:
(3)N=1750,n=30, (3)N=1750,n=30,n1=8, t=1.96, p=0.267, q=1q=1-0.267=0.733 由此可计算得: t 2q 1.962 × 0.733 n0 = 2 = =1054.64 r p 0.01× 0.267 n = n0/[1+(n0—1)/N] = 1054.64/[1+1053.64/1750]=658.2942 = 659 计算结果说明,至少应抽取一个样本量为659的简单随机 样本,才能满足95%置信度条件下相对误差不超过10%的精度 要求。
t=1.96 (2)易知,N=1750,n=30, n = 8 1 n 8 N − n 1750 − 30 1− f p= 1 = = 0.267 = = = 0.03389 n −1 (n −1)N 29 ×1750 n 30
pq = p(1 − p) = 0.267 × 0.733 = 0.1957
5.5 证明:由(5.6)得:
V ( yR ) ≈ 1− f n (Yi − RX i )2 ∑
i =1 N
N −n 2 令 Sd = V , Nn
2 d
N −1
=
N −n 2 Sd Nn
则n(NV + S ) = NS ,
2 d
S 2 NSd 从而n = = V 2 2 NV + Sd Sd 1+ NV
第五章 比率估计与回归估计
5.2 N=2000, n=36, 1-α=0.95, t=1.96, ˆ f = n/N=0.018, v(R) = 0.000015359, ˆ se(R) =0.00392 置信区间为[40.93%,42.47%]。 置信区间为[40.93%,42.47%]。
第二章 简单随机抽样
第二章简单随机抽样§2.1 引言§2.2 估计量§2.3 样本量的确定§2.4 其他问题§2.1 引言➢简单随机抽样也称为纯随机抽样.从抽样框内的N个抽样单元中随机地、逐个抽取n个单元组成样本,在每次抽选时,总体中每个单元入样的概率都相等,这n个被抽中的单元就构成了简单随机样本。
➢简单随机样本也可以从总体中一次取得全部n 个单元,要求全部可能的样本每种样本被抽得的概率都相等。
➢放回抽样与不放回抽样⏹抽选方法➢抽签法当总体不大时,可以用均匀同质的材料制作N个签,将其充分混合,然后一次抽取n个签,或一次抽取一个签但不放回,接着抽下一个签直到第n个签为止,则这n个签上所示的号码表示入样的单元号。
➢随机数法当总体较大时,抽签法实施起来很困难,这时可以利用随机数表、随机数骰子、计算机产生的伪随机数进行抽样。
※随机数表随机数表是由数字0,1,…,9组成的表,每个数字都有同样的机会被抽中。
常用的做法:根据总体大小N的位数决定在随机数表中随机抽取几列,如N=678,要取n=5的样本,则在随机数表中随机抽取3列,顺序往下,选出头5个001~678之间互不相同的数,如果这3列随机数字不够,可另选其他3列继续,直到抽满n个单元为止。
※随机数骰子随机数骰子是由均匀材料制成的正20面体,面上标有0~9的数字各2个。
我国“运筹”牌随机数骰子一盒有6个不同颜色的骰子,使用时,根据总体大小N的位数,如N=327的位数是3,则将3个不同颜色的骰子放入盒中,并规定每种颜色所代表的位数,如红色代表个位数,蓝色代表十位数,黄色代表百位数等,盖上盒盖,摇动盒子,使骰子充分旋转,然后打开盒盖,读出骰子所表示的数字,重复上述步骤,直到产生n个不同的随机数。
※计算机产生伪随机数不少统计软件都有现成的产生随机数的程序,利用计算机产生的随机数具有快捷、方便的特点,但需要注意的事,利用计算机产生的随机数是伪随机数,并不能保证其随机性。
《抽样技术》练习题及标准答案
《抽样技术》练习题及答案————————————————————————————————作者:————————————————————————————————日期:习题一1.请列举一些你所了解的以及被接受的抽样调查。
2.抽样调查基础理论及其意义;3.抽样调查的特点。
4.样本可能数目及其意义;5.影响抽样误差的因素;6.某个总体抽取一个n=50的独立同分布样本,样本数据如下:567 601 665 732 366 937 462 619 279 287690 520 502 312 452 562 557 574 350 875834 203 593 980 172 287 753 259 276 876692 371 887 641 399 442 927 442 918 11178 416 405 210 58 797 746 153 644 4761)计算样本均值y与样本方差s2;2)若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式;3)根据上述样本数据,如何估计v(y)?4)假定y的分布是近似正态的,试分别给出总体均值μ的置信度为80%,90%,95%,99%的(近似)置信区间。
习题二一判断题1 普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。
2 概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。
3 抽样单元与总体单元是一致的。
4 偏倚是由于系统性因素产生的。
5 在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。
6 偏倚与抽样误差一样都是由于抽样的随机性产生的。
7 偏倚与抽样误差一样都随样本量的增大而减小。
8 抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。
9 抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。
10 总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。
抽样技术 第三版 全部课后答案 金勇进共28页
第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+20199作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?机抽取了300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。
解析:由已知得:10000=N 200=n 35.0=p 02.0==Nnf又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。
抽样技术
第一章绪论一、单选1、下面属于非概率抽样的方式的有()A. 典型调查B. 等距抽样C. 分层抽样D. 整群抽样2、下列抽样方法中,属于概率抽样的是()。
A.判断抽样B.配额抽样C.方便抽样D.整群抽样3、抽样误差产生于( )。
A.随机性的代表性误差B.登记性误差C.系统性误差D. 登记性误差与系统性误差4、某工厂实行流水线连续生产,为检验产品质量,在每天24小时中每隔1小时抽取一分钟的产量作全面检查,这是( )。
A.简单随机抽样B.分类抽样C.等距抽样D.整群抽样5、概率抽样中,抽取样本单位时应遵循的原则是()A.最大化原则B.平均化原则C.最优化原则D.随机原则二、多选1、下列属于非概率抽样的方法是()A、分层抽样B、定额抽样C、偶遇抽样D、立意抽样E、雪球抽样2、概率抽样的方式有很多种,下面属于概率抽样的方式的有()A. 简单随机抽样B. 等距抽样C. 分层抽样D. 整群抽样E. 重点调查3、抽样调查的特点有()。
A.只调查样本单位B.抽样误差可以计算和控制C.遵循随机原则D.用样本统计量估计总体参数E.以上都对4、从总体500个单位中,抽取50个单位进行调查,则()。
A.样本单位数量是50个B.样本数量是50个C.样本容量是50个D.样本必要数目为500个E.总体单位数目是500个三、判断1、普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。
2、概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。
3、抽样单元与总体单元是一致的。
4、偏差是由于系统性因素产生的。
5、在没有偏差的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。
6、偏差与抽样误差一样都是由于抽样的随机性产生的。
7、偏差与抽样误差一样都随样本量的增大而减小。
8、抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。
9、典型调查所得样本可以计算抽样误差,并能推断总体情况。
金勇进:《抽样技术(第2版)》课后习题参考答案
1 但:曾有实验,欲检验人列数字果随机 10 100
(等可能选取各数字)否。结果表明,各有偏好, P p 实未给定。 (3)之U 、 S s 、 P p 皆未定。 1 . 3 [ 以下资料引译自 “STATISTICAL ESTIMATION METHODS IN VOLUNTEER PANEL WEB SURVEYS”,Sunghee Lee, Ph.D., 2004] 网络调查(Web surveys)并非互联网调查(Internet surveys)之同义语,通常所谓互联网调 查包括网络调查与电子邮件调查(e-mail surveys) ,而网络调查则仅指通过 WWW 浏览器呈 现的调查,故也称网页调查。由于存储与软件兼容性方面的局限性,电子邮件调查远不及网 页调查应用广泛,故对互联网调查的研究主要集中于网页调查。
什么是收视率调查 收视率调查最早是用于了解节目的收视情况,为媒体决策和广告主的媒体选择提供依据。后来由于收视率 调查技术的革新பைடு நூலகம்一种叫做 Audimeter 视听记录仪在调查中的运用,使广告收视率调查变得简单化。 在电视收视率调查方面比较著名的市场调研公司有美国的尼尔逊公司( Nielsen ) 、日本的电通、英国的 TNSOFRES 集团等。它们都能以每分钟为单位来记录分析电视节目的收视情况。所以收视率调查便成为一 种电视广告传播效果的测量方法。 收视率调查的步骤 收视率调查过程包括以下几个步骤: 1、随机抽出一定量的观众样本户构成相对稳定的调查网(观众小组) 。样本大小视研究精度和地区规模而 定。例如台湾益利市场研究顾问公司,在台湾地区建立的调查网样本户是 245 个。 2、在样本户家中的电视机上装上 Audimeter 这种仪器,它能自动地记录受调查对象家中收看电视节目的时 间和频道。 3、每隔一段时间(如一周)把自动记录仪内的软片或磁带取下带回公司分析,就可以算出每日全部节目每 一分钟的收视率。现在由于技术的进步,研究机构甚至可以通过电话连线随时从被调查户提取记录信息。 一般来说,收视率愈高,说明广告的传播效果愈好。
应用抽样技术第三版课后习题答案
应用抽样技术第三版课后习题答案应用抽样技术第三版课后习题答案抽样技术是统计学中重要的一部分,它用于从总体中选择一部分样本,以便对总体进行推断。
在应用抽样技术的过程中,我们常常会遇到一些难题和疑惑。
为了帮助读者更好地理解和应用抽样技术,本文将为大家提供《应用抽样技术第三版》课后习题的详细解答。
第一章:抽样方法的基本概念1. 抽样方法的基本概念抽样方法是指从总体中选取一部分样本,以代表整个总体。
常用的抽样方法包括简单随机抽样、分层抽样、整群抽样等。
在选择抽样方法时,需要根据具体问题和研究目的来确定最适合的方法。
2. 简单随机抽样简单随机抽样是指从总体中随机选择样本,使每个样本都有相等的机会被选中。
这种抽样方法适用于总体规模较小且分布均匀的情况。
3. 分层抽样分层抽样是将总体划分为若干个层次,然后从每个层次中随机选择样本。
这种抽样方法适用于总体具有明显层次结构的情况,可以提高样本的代表性。
4. 整群抽样整群抽样是将总体划分为若干个群组,然后从每个群组中随机选择样本。
这种抽样方法适用于总体群组之间差异较大的情况,可以减少抽样误差。
第二章:简单随机抽样1. 简单随机抽样的步骤简单随机抽样的步骤包括确定总体、确定样本容量、编制总体名单、进行随机抽样和分析样本数据。
在确定样本容量时,需要考虑总体的大小、抽样误差和置信水平等因素。
2. 简单随机抽样的应用简单随机抽样广泛应用于各个领域的调查和研究中。
例如,在市场调查中,可以使用简单随机抽样来获取消费者的意见和反馈;在医学研究中,可以使用简单随机抽样来选择研究对象。
第三章:分层抽样1. 分层抽样的步骤分层抽样的步骤包括确定总体、划分层次、确定每层样本容量、进行随机抽样和分析样本数据。
在确定每层样本容量时,需要根据每个层次的重要性和变异程度来确定。
2. 分层抽样的应用分层抽样适用于总体具有明显层次结构的情况。
例如,在教育调查中,可以将学校划分为不同的层次,然后从每个层次中随机选择样本;在人口统计调查中,可以将人口按照年龄、性别等因素划分为不同的层次,然后进行抽样。
东北林业大学《抽样技术》第二章抽样调查基本原理
影响抽样误差的因素: 1.抽样误差通常会随样本量的大小而增减。 2.所研究现象总体变异程度的大小。 3.抽样的方式方法。 非抽样误差不是由于抽样引起的。它又包括: 调查误差;无回答误差;抽样框误差;登记性误差。 同抽样误差相反,非抽样误差是随着样本量的增加 而增大的。由于抽样调查的访问和资料整理都比普 查更便于进行,因此非抽样误差也远远小于普查。 有时,普查中的非抽样误差甚至大于抽样调查中抽 样误差与非抽样误差的总和。
(1)作业总体单位与目标总体单位是一一对应的。这 是最常见的形式。例如,要调查某地区的住户总体, 以该地区的住户名册为抽样框,那么,从抽样框中 抽中的住户即作为估计总体的单位。 (2)多个作业总体单位对应着一个目标总体单位。例 如,要调查某学校学生家庭情况,以该学校学生名 单为抽样框,而在这份学生名单中可能有二个或更 多个学生同属于一个家庭。 (3)一个作业总体单位对应着多个目标总体单位。例 如,人口调查中以各居(村)民委员会的顺序排列表 为抽样框,这时,所抽中的每个居(村)民委员会内 就包含许多人口。
确定抽样框必须着重考虑的问题: 第一,要能反映出作业总体与目标总体的关系,表 明这二个总体单位属于哪种对应形式。 第二,要能达到对目标总体进行有效的抽样估计的 目的。这一方面要求抽样框应尽可能地包括被用于 估计目标总体的单位,另一方面要求在抽样框单位 中能获得估计总体的信息。 第三,设计和编制抽样框要有利于实施抽样调查和 节省各项费用开支。
在抽样调查实践中,表现作业总体的抽样框通常可 为下列几种形式: (抽样框是在抽样前,为便于抽样工作的组织,在可 能条件下编制的用来进行抽样的、记录或表明总体 所有抽样单元的框架,在抽样框中,每个抽样单元 都被编上号码。) (1)名单抽样框。这是以名单一览表形式列出总体的 所有单位。例如,居民住户调查中按住户地址编码 的顺序列出全部住户的名单表;再如,我国目前的 农产量抽样中,按粮食平均亩产量的大小顺序列出 总体单位(县、乡、村)。
《抽样技术(第二版)金勇进等编著》习题解答
《抽样技术(第二版)金勇进等编著》习题解答第二章2.22.3 解:已知2ˆ9.5,206,50000,300500009.5475000y s N n Y Ny ====∴==⨯=, 222211300/50000ˆ()50000206500000.6825170636666730041308.19128,80964.05491f v YN s n --∴==⨯⨯=⨯===所以居民日用电量的95%的置信区间为 ˆˆ[[47500080964.05491,47500080964.05491] [394035.9451,555964.0549]YY -+=-+=相对误差为ˆd Y Y r Y-=2.4 解:ˆ0.35Pp == , 11200/1000010000()(1)0.35(10.35)0.0011512009999f N V p P P n N --=-=⨯⨯⨯-=-0.03339=∴P 的95%置信区间为:[[0.35 1.960.03339,0.35 1.960.03339][0.2846,0.4154]p p -+=-⨯+⨯=2.5 解:已知200,20N n ==,根据已知数据计算得:2144.5,826.0526,() 6.096915y s v y ==∴== ∴Y 的95%置信区间为:[[144.5 1.96 6.096915,144.5 1.96 6.096915][132.55,156.45]y y -+=-⨯+⨯=2.6 解:已知2ˆ1120,25600,350,503501120392000y S N n Y Ny ====∴==⨯=,2221150/350ˆ()350256003840000506196.773,12145.68f V YN S n --∴==⨯⨯===∴ˆY的95%置信区间为:ˆˆ[[379854.3,404145.7]Y Y -+= 2.7 解:已知21000,2,68,10.95N d S α===-=,222022221000 1.966861.3010002 1.9668Nt S n Nd t S ⨯⨯∴===+⨯+⨯0161.387.571430.7n n r === 样本量最终为88个家庭。
抽样技术 第三版 第二章课后部分答案 R语言
抽样技术作业一(2.5——2.10)袁闪闪 21205021192.5 解:这里N =200,n =20,由表中的数据可得:2011221211144.5201()826.052611()- 6.097n i i i i n i i y y y n s y y n nv y s n N=======-=-=⨯=∑∑∑(1) 因而该小区平均的文化支出Y 的95%的近似置信区间为:22/2/211[-,-][144.5 1.96 6.097][132.5503,156.4497]n n y z s y z s n N n Nαα-⨯+⨯=±⨯=(1)(1) 所以该小区平均的文化支出Y 的估计为144.5元,其95%的置信区间为 (132.55元,156.45元)。
2.6解:有题意可得:N =350,n =50, y =1120,2s =25600, 所以粮食总产量为:3501120392000()Y N y ∧==⨯=元 代入数据得:22/2/211[-,-][392000 1.967332.12][377629,406371]n n y z Ns y z N s n N n Nαα-⨯+⨯=±⨯=(1)(1) 所以总产值的95%的置信区间为:(377629吨,406371吨)。
2.7解:由题意可得:N =1000,d =2,α=0.05,2S =68,r=70%, 带入公式,可得初始样本量:222/2022222/2/21161.362Nz S d n N z S Nd z S ααα⎛⎫=+==≈ ⎪+⎝⎭ 由于有效回答率为r=70%,,对样本容量进行再调整:0070%87.5788nn n r===≈所以样本最终确定为88。
2.8解:由题意已知:N =100,n =10, X =2135,y =25,x =22, 方法一:简单随机估计:100252500()Y N y ∧==⨯=吨方法二:比估计:由经验可知去年的化肥总产量和今年的总产量之间存在较强的相关性,引入去年的化肥总产量作为辅助变量。
《抽样技术》第四版习题答案
第2章2.1 解:()1 这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是1100。
()2这种抽样方法不是等概率的。
利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是2100,而尚未被抽中的编号为36~63的每个单元的入样概率都是1100。
()3这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是11000,所以这种抽样是等概率的。
2.3 解:首先估计该市居民日用电量的95%的置信区间。
根据中心极限定理可知,在大_y E y y -=近似服从标准正态分布, _Y 的195%α-=的置信区间为2y z y z y y αα⎡⎡-+=-+⎣⎣。
而()21f V y S n-=中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间为,y y ⎡⎤-+⎢⎥⎣⎦。
由题意知道,_29.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得 _21130050000()2060.6825300f v y s n --==⨯=。
将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192⎡⎤⎣⎦。
下一步计算样本量。
绝对误差限d 和相对误差限r 的关系为_d rY =。
根据置信区间的求解方法可知____11P y Y r Y P αα⎫⎪⎧⎫-≤≥-⇒≤≥-⎨⎬⎩⎭根据正态分布的分位数可以知道1P Z αα⎫⎪⎪≤≥-⎬⎪⎪⎭,所以()2_2r Y V y z α⎛⎫⎪= ⎪⎝⎭。
也就是2_2_222/221111r Y r Y S n N z S n N z αα⎡⎤⎛⎫⎢⎥⎛⎫⎪⎛⎫⎝⎭⎪⎢⎥-=⇒=+ ⎪ ⎪⎢⎥⎝⎭⎝⎭⎢⎥⎣⎦。
把_29.5,206,10%,50000y s r N ====代入上式可得,861.75862n =≈。
抽样技术第二章_简单随机抽样[1]
的简单Y (jiǎyndān)估计 , 是无偏的。
注意定理可以表示成更简洁的形式:
Ey Y
精品资料
证明(zhèngmíng)1:(定义法)
y
E(y) CnN
(y1 yn )/ n CnN
y1 n
(y1
yn
)
1 n
Cn1 N1
N i1
Yi
E(y)
y CnN
1 n
Cn1 N1
精品资料
定义2.3 按照从总体的N个单元中抽取n个单元的
所有可能不同组合构造所有可能的 CNn个样本,从 中随机(suí jī)抽取一个样本,使每个样本被抽到的
概率都等于1C/Nn ,这种抽样称为简单随机(suí jī)抽 样。
注意:定义2.1与定义2.3是等价的。
三个定义之间的联系
精品资料
简单(jiǎndān)随机抽样的具体实 施方法
(1)计算样本均值与样本方差。
(2)若用 y 估计总体均值μ,按数理统计结果,是否无偏,并
写出它的方差表达式。 (3)根据上述样本数据,如何估计? (4)假定的分布是近似正态的,试分别给出总体均值μ的置信度
为95%的近似置信区间。
精品资料
(1)计算样本均值与样本方差(fānɡ chà)。
n
n
(2写)出若y它用的i方y1n估y差i计(,sf总2ān体ɡ 均ic1h值(àny)μ表i ,1达y按式)2数。理n统1计1 (结in1果y,i2 是n否y无2 )偏,并
抽样技术第二章参考答案1
第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同? 解析:抽样理论和数理统计中关于样本均值的定义和性质的不同抽样理论概率统计定义 ∑==ni i y n y 11=y性质1.期望()()()()Y C P E NNC N C ===∑∑==n n 1i n i 1i i i 1y y y2.方差()()()[]()iC i iiP y E y y V n N21∑=-==()()[]n NC i iiCy E y n N121∑=-()21S nf -=1.期望()⎪⎭⎫ ⎝⎛=∑=n i i y n E y E 11()∑==ni y E 1i n 1[]μμ==n n12.方差()[]2μ-=i y E y V211⎥⎦⎤⎢⎣⎡-=∑=n i i y n E μ()ny n 122i σμ=-=E2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s1706366666206*300500003001500001)()ˆ(222=-=-==s nf N y N v YV19.413081706366666(==)y v该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤-即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
抽样技术第二章_简单随机抽样xx
不放回无序SRSWOR(不考虑样本单元的顺序):C n 1,1 1,2 1,3 1,4 1,5 2,1 2,2 2,3 2,4 2,5 3 ,1 3,2 3 ,3 3 ,4 3,5 4,1 4,2 4,3 4,4 4,5 5,1 5,2 5,3 5,4 5,5
N
n CN 10
每个样本被抽中的概率相同,即为
2 6
3, 1 3, 2 3, 3 3, 4 3, 5
4, 1 4, 2 4, 3 4, 4 4, 5
5, 1 5, 2 5, 3 5, 4 5, 5
C
n N n1
C 2510 15
特点: 每次抽样时,总体的结构不变,抽样是 相互独立进行的; 总体单元有可能多次被抽中的机会。
不放回简单随机抽样
此外,简单随机抽样要求在抽样前编制出抽样 框,并对每一个总体抽样单元进行编号,而且 当总体抽样单元的分布比较分散时,样本也可 能会比较分散,这些都会给简单随机抽样方法 的运用造成许多的不便,甚至在某些情况下干 脆无法使用。因此,在此基础上研究其它抽样 技术显得更加重要。
第二章 简单随机抽样
第二章 简单随机抽样
2.1 2.2 2.3 2.4 2.5 概述 简单估计量及其性质 比率估计量及其性质 回归估计量及其性质 简单随机抽样的实施
概述
一、简单随机抽样(或单纯随机抽样) 本书一般局限于不放回随机抽样 二、实施方法 三、地位、作用 是其他抽样方法基础
案例 在1936年美国总统选举前,一份颇有名气的杂 志进行了民意测验,调查兰登与罗斯福谁将当选下 届总统。为了了解公众意向,调查者通过电话簿和 汽车登记簿给大批人发了调查表,通过分析回收的 调查表,显示兰登非常受欢迎。因此该杂志预测兰 登将获胜。 实际选举结果正好相反,最后罗斯福在选举中 获胜。其数据如下:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同? 解析:抽样理论和数理统计中关于样本均值的定义和性质的不同抽样理论概率统计定义 ∑==ni i y n y 11=y性质1.期望()()()()Y C P E NNC N C ===∑∑==n n 1i n i 1i i i 1y y y2.方差()()()[]()iC i iiP y E y y V n N21∑=-==()()[]n NC i iiCy E y n N121∑=-()21S nf -=1.期望()⎪⎭⎫ ⎝⎛=∑=n i i y n E y E 11()∑==ni y E 1i n 1[]μμ==n n12.方差()[]2μ-=i y E y V211⎥⎦⎤⎢⎣⎡-=∑=n i i y n E μ()ny n 122i σμ=-=E2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s1706366666206*300500003001500001)()ˆ(222=-=-==s nf N y N v YV19.413081706366666(==)y v该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤-即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。
解析:由已知得:10000=N 200=n 35.0=p 02.0==N nf 又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V 该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。
解析:由已知得:200=N 20=n根据表中数据计算得:5.144201201==∑=i i y y ()06842.827120120122=--=∑=i iy y s 21808.37)1(1)(2=-=s Nnn y V 10015.6)(=y V∴ 该小区平均文化支出Y 的95%置信区间为:])(y [2y V zα±即是:[132.544 ,156.456]故估计该小区平均的文化支出Y =144.5,置信水平95%的置信区间为[132.544 ,156.456]。
2.6某地区350个乡为了获得粮食总产量的估计,调查了50个乡当年的粮食产量,得到y =1120(吨),25602=S ,据此估计该地区今年的粮食总产量,并给出置信水平95%的置信区间。
解析:由题意知:y =1120 1429.035050n ===N f 25602=S ⇒160=s 置信水平95%的置信区间为:]1y [2s nfz -±α代入数据得: 置信水平95%的置信区间为:[1079.872,1160.872]2.7某次关于1000个家庭人均住房面积的调查中,委托方要求绝对误差限为2平方千米,置信水平95%,现根据以前的调查结果,认为总体方差682=S ,是确定简单随机抽样所需的样本量。
若预计有效回答率为70%,则样本量最终为多少?解析:简单随机抽样所需的样本量22222122S Z Nd S NZ n αα+=%7012n n =由题意知:1000=N 2=d 682=S 96.12=αZ代入并计算得:613036.611≈=n87142.87%7012≈==n n故知:简单随机抽样所需的样本量为61,若预计有效回答率为70%,则样本量最终为872.8某地区对本地100家化肥生产企业的尿素产量进行调查,一直去年的总产量为2135吨,抽取10个企业调查今年的产量,得到25=y ,这些企业去年的平均产量为22=x 。
试估计今年该地区化肥总产量。
解析:由题可知22x =,35.211002135===N X X ,25y =则,该地区化肥产量均值Y 的比率估计量为26.24242535.21===∧x y XY该地区化肥产量总值Y 的比率估计量为 242626.24*100ˆˆ===R Y N Y所以,今年该地区化肥总产量的估计值为2426吨。
2.9如果在解决习题2.5的问题时可以得到这些家庭月总支出,得到如下表: 单位:元 编号 文化支出 总支出 编号 文化支出 总支出 1 200 2300 11 150 1600 2 150 1700 12 160 1700 3 170 2000 13 180 2000 4 150 1500 14 130 1400 5 160 1700 15 150 1600 6 130 1400 16 100 1200 7 140 1500 17 180 1900 8 100 1200 18 100 1100 9 110 1200 19 170 1800 101401500201201300全部家庭的总支出平均为1600元,利用比估计的方法估计平均文化支出,给出置信水平95%的置信区间,并比较比估计和简单估计的效率。
解析:由题可知1580130017002300201x n 1x n 1i i =+++==∑=)(5.144y =091.015805.144ˆ=≈===x y r R又329.14615805.144*1600x y y ===X R053.826)(11122=--=∑=ni i y y n S158.3463))((111=---=∑=ni i i xyx x y y n S579.8831)(11122=--=∑=n i ixx x n S故平均文化支出的95%的置信区间为,)ˆˆ2(1[2222x yx R S R S R S n f Z y +---α])ˆˆ2(12222xyx R S R S R S n f Z y +--+α代入数据得(146.329±1.96*1.892)即为[142.621,150.037]2.10某养牛场购进了120头肉牛,购进时平均体重100千克。
现从中抽取10头,记录重量,3个月后再次测量,结果如下:单位:千克 编号 原重量 现重量 1 95 150 2 97 155 3 87 140 4 120 180 5 110 175 6 115 185 7 103 165 8 102 160 9 92 150 10105170用回归估计法计算120头牛现在的平均重量,计算其方差的估计,并和简单估计的结果进行比较。
解:由题可知,6.10210595101x n 1x n 1i i =++==∑=)(163170150101y n 1y n 1i i =+==∑=)(222.2121910*91)(11122==--=∑=n i iy y n S 333.1461317*91))((111==---=∑=n i ii xyx x y y n S 933.1064.926*91)(11122==--=∑=n i i xx x n S 故有368.1933.106333.14620===xxy S S β所以总体均值Y 的回归估计量为443.159)6.102100(*368.1163)(0=-+=-+=x X y y lr β 其方差估计为:)2(1)(ˆ02202xyx lr S S S n f y V ββ-+-==)333.146*368.1*2933.106*368.1222.212(101201012-+-=1.097而21y (ˆS nf V-=) =222.212*10120101- =19.454显然)(ˆ)(ˆy V y V lr< 所以,回归估计的结果要优于简单估。