抽样估计一般问题1
抽样推断的一般问题抽样误差
抽样平均误差是抽样平均数或抽样成数的标准差,反映了抽样指标与总体指标的平均误差程度。
例如:假设总体包含1、2、3、4、5,五个数字。
则:总体平均数为 =(1+2+3+4+5)/5=3
现在,采用重复抽样从中抽出两个,组成一个样本。可能组成的样本数目:25个。
如:(1+3)/2=2、(1+4)/2=2.5、(2+4)/2=3、(3+5)/2=4…
二、抽样推断的内容
参数估计:参数估计是依据所获得的样本观察资料,对所研究现象总体的水平、结构、规模等数量特征进行估计。
假设检验:假设检验是利用样本的实际资料来检验事先对总体某些数量特征所作的假设是否可信的一种统计分析方法。
三、有关抽样的基本概念
(一)总体和样本
总体:又称全及总体。指所要认识的研究对象全体。总体单位总数用“N”表示。
上式可变形为:Δ=tμ(极限误差是t倍的抽样平均误差)
例题二:某厂生产一种新型灯泡共2000只,随机抽出400只作耐用时间试验,测试结果
平均使用寿命为4800小时,样本标准差为300小时,求抽样推断的平均误差?
解:已知:N=2000n=400σx=300 =4800
则:
计算结果表明:根据部分产品推断全部产品的平均使用寿命时,采用不重复抽样比重复抽样的平均误差要小。
②抽样平均数的标准差仅为总体标准差的
③可通过调整样本单位数来控制抽样平均误差。
例题:假定抽样单位数增加2倍、0.5倍时,抽样平均误差怎样变化?
解:抽样单位数增加2倍,即为原来的3倍
则:
即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。
抽样单位数增加0.5倍,即为原来的1.5倍
抽样技术简答题及答案
抽样技术各类简答题参考答案习题一1. 请列举一些你所了解的以及被接受的抽样调查。
略2. 抽样调查基础理论及其意义;答:大数定律,中心极限定理,误差分布理论,概率理论。
大数定律是统计抽样调查的数理基础,也给统计学屮的大量观察法提供了理论和数学方面的依据;屮心极限定理说明,用样本平均值产生的概率来代替从总体中直接抽出来的样本计算的抽取样本的概率,为抽样推断奠定了科学的理论基础;认识抽样误差及其分布的目的是希望所设计的抽样方案所取得的绝大部分的估计量能较好的集屮在总体指标的附近,通过计算抽样误差的极限是抽样误差处于被控制的状态;概率论作为数学的一个分支而引进统计学屮,是统计学发展史上的重要事件。
3. 抽样调查的特点。
答:1)随机抽样;2)以部分推断总体;3)存在抽样误差,但可计算,控制;4)速度快、周期短、精度高、费用低;5)抽样技术灵活多样;6)应用广泛。
4. 样本可能数目及其意义;答:样本可能数目是在容量为N的总体屮抽取容量为n的样本时,所有可能被抽中的不同样本的个数,用A 表示。
意义:正确理解样本可能数目的概念,对于准确理解和把握抽样调查误差的计算,样本统计量的抽样分布、抽样估计的优良标准等一系列理论和方法问题都有十分重要的帮助。
5. 影响抽样误差的因素;答:抽样误差是用样本统计量推断总体参数时的误差,它属于一・种代表性误差,在抽样调查中抽样误差是不可避免的,但可以计算,并且可以被控制在任意小的范围内;影响抽样误差的因素:1)有样本量大小,抽样误差通常会随着样本量的大小而增减,在某些情形下,抽样误差与样本量大小的平方根成反比关系;2)所研究现象总体变异程度的大小,一般而言,总体变异程度越大则抽样误差可能越大;3)抽样的方式方法,如放回抽样的误差大于不放回抽样,各种不同的抽样组织方式也常会有不同的抽样误差。
在实际工作屮,样本量和抽样方式方法的影响是可以控制的,总体变异程度虽不可以控制,但却可通过设计一些复杂的抽样技术而将其影响加以控制。
抽样推断是利用样本资料对总体的数量特征进行估计的一...
作业三一、判断题1、抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。
(×)2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。
(×)3、抽样成数的特点是,样本成数越大,则成数方差越大。
6、在总体方差一定的条件下,样本单位数越多,则抽样平均误差越大(×)4、抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。
√5、在其它条件不变的情况下,提高抽样估计的可*程度,可以提高抽样估计的精确度。
(×)6、抽样极限误差总是大于抽样平均误差。
(×)7、相关系数是测定变量之间相关关系的唯一方法(×)8、甲产品产量与单位成本的相关系数是-0.8,乙产品单位成本与利润率的相关系数是-0.95,则乙比甲的相关程度高(√)9、利用一个回归方程,两个变量可以互相推算(×)10、估计标准误指的就是实际值y与估计值yc 的平均误差程度(√)二、单项选择题1、在一定的抽样平均误差条件下(A )A、扩大极限误差范围,可以提高推断的可*程度B、扩大极限误差范围,会降低推断的可*程度C、缩小极限误差范围,可以提高推断的可*程度D、缩小极限误差范围,不改变推断的可*程度2、反映样本指标与总体指标之间的平均误差程度的指标是(C )A、抽样误差系数B、概率度c、抽样平均误差D、抽样极限误差3、抽样平均误差是(D )A、全及总体的标准差B、样本的标准差c、抽样指标的标准差D、抽样误差的平均差4、当成数等于(C )时,成数的方差最大A、1B、0 c、0.5 D、-15、对某行业职工收入情况进行抽样调查,得知其中80%的职工收入在800元以下,抽样平均误差为2%,当概率为95.45%时,该行业职工收入在800元以下所占比重是( C )A、等于78%B、大于84% c、在此76%与84%之间D、小于76%6、对甲乙两个工厂工人平均工资进行纯随机不重复抽样调查,调查的工人数一样,两工厂工资方差相同,但甲厂工人总数比乙厂工人总数多一倍,则抽样平均误差(B )A、甲厂比乙厂大B、乙厂比甲厂大c、两个工厂一样大D、无法确定7、反映抽样指标与总体指标之间抽样误差可能范围的指标是(B)。
管理统计学习题参考答案第八章
第八章1. 解:(1)假设检验的基本思想是,样本平均数与总体平均数出现差异不外乎两种可能:一是改革后的总体平均长度不变,但由于抽样的随机性使样本平均数与总体平均数之间存在抽样误差;二是由于工艺条件的变化,使总体平均数发生了显著的变化。
因此,可以这样推断:如果样本平均数与总体平均数之间的差异不大,未超出抽样误差范围,则认为总体平均数不变;反之,如果样本平均数与总体平均数之间的差异超出了抽样误差范围,则认为总体平均数发生了显著的变化。
根据样本平均数的抽样分布定理,有x Z σx μ±=或Z /σμx x ≤-。
当0=Z 时,表明样本均值等于总体均值,即μx =;当Z 很大时,表明样本均值离总体均值很远,即∆很大。
后一种情况是小概率事件。
在正常情况下,小概率事件是不会发生的,那么在一次抽样中小概率事件居然发生了,我们就有理由认为样本均值是不正常的,它与原总体相比,性质已经发生变化,应该拒绝接受原假设。
(2)假设检验的一般步骤包括:① 提出原假设和备择假设;对每个假设检验问题,一般可同时提出两个相反的假设:原假设和备择假设。
原假设又称零假设,是正待检验的假设,记为H 0;备择假设是拒绝原假设后可供选择的假设,记为H 1。
原假设和备择假设是相互对立的,检验结果二者必取其一。
接受H 0,则必须拒绝H 1;反之,拒绝H 0则必须接受H 1。
② 选择适当的统计量,并确定其分布形式;不同的假设检验问题需要选择不同的统计量作为检验统计量。
在例中,我们所用的统计量是Z ,在H 0为真时,N Z ~(0,1)。
③选择显著性水平α,确定临界值;显著性水平表示H 0为真时拒绝H 0的概率,即拒绝原假设所冒的风险,用α表示。
假设检验就是应用了小概率事件实际不发生的原理。
这里的小概率就是指α。
但是要小到什么程度才算小概率? 对此并没有统一的标准。
通常取α=0.1,0.05,0.01。
给定了显著性水平α,就可由有关的概率分布表查得临界值,从而确定H 0的接受区域和拒绝区域。
人教版2019必修二统计之随机抽样与样本估计总体
人教版2019必修二统计之随机抽样与样本估计总体一、单选题(共8题;共16分)1.(2分)某企业有职工150人,其中高级职称有15人,中级职称有45人,一般职员有90人,现抽取30人,进行分层抽样,则各职称人数分别为()A.5,10,15B.3,9,18C.3,10,17D.5,9,162.(2分)现有50件产品编号从1到50,现在从中抽取5件检验,用系统抽样确定所抽取的编号为()A.5,10,15,20,25B.5,15,20,35,40C.5,11,17,23,29D.10,20,30,40,503.(2分)一高铁列车共有节车厢,铁路部门为了给旅客提供优质服务,在列车上做了一项民意调查在该高铁内选取每一节车厢号座位的乘客填写调查信息.这里运用的抽样方法是()A.抽签法B.随机数法C.系统抽样D.分层抽样4.(2分)数据12,12,12,14,15的平均数与众数的差为()A .2B.1C .-1D .-25.(2分)某校要调查该校1200名学生的身体健康情况,中男生700名,女生500名,现按性别用分层抽样的方法从中抽取120名学生的体检报告,下列说法错误的是()A.总体容量是1200B.样本容量是120C .男生应抽取70名D.女生应抽取40名6.(2分)一位高三学生在半年时间里经历了七次大考,他把这七次考试的历史成绩统计为如图所示的茎叶图,则该学生成绩的平均数和中位数分别为()A.84,83B.84,84C.85,84D.85,857.(2分)随机抽取骑行共享单车的市民进行问卷调查,得到样本的频率分布直方图如图所示.再从这些市民中用分层抽样的方法抽取一个样本进行调查,若第二次抽取的样本中年龄段的人数为14,则第二次抽取的样本中年龄段的人数为()A.2B.3C.5D.68.(2分)一年内,某单位组织员工进行了六次业务知识考试.一员工将其六次成绩绘成如图所示的茎叶统计图,其中第五次考试成绩以表示.若该员工成绩的中位数是93,则该员工六次业务知识考试成绩的方差是()A .B .C.D.二、多选题(共4题;共12分)9.(3分)下列命题是真命题的有()A.有甲、乙、丙三种个体按的比例分层抽样调查,如果抽取的甲个体数为9,则样本容量为30 B.数据1,2,3,3,4,5的平均数、众数、中位数相同C.若甲组数据的方差为5,乙组数据为5,6,9,10,5,则这两组数据中较稳定的是乙D.一组数6,5,4,3,3,3,2,2,2,1的85%分位数为510.(3分)某特长班有男生和女生各10人,统计他们的身高,其数据(单位:cm)如下面的茎叶图所示,则下列结论正确的是()A.女生身高的极差为12B.男生身高的均值较大C.女生身高的中位数为165D.男生身高的方差较小11.(3分)已知一组数据,,,,的平均数和方差均为2,则下列叙述正确的有()A.,,,,的平均数为3B.,,,,的方差为3C.,,,,的方差为4D.,,,,的方差为812.(3分)下图是某市6月1日至14日的空气质量指数趋势图,空气质量指数小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,某人随机选择6月1日至6月13日中的某一天到达该市,并停留2天.下列说法正确的有()A.该市14天空气质量指数的平均值大于100B.此人到达当日空气质量优良的概率为C.此人在该市停留期间只有1天空气重度污染的概率为D.每连续3天计算一次空气质量指数的方差,其中第5天到第7天的方差最大三、填空题(共4题;共6分)13.(1分)有下列结论:①某年级有男生560人,女生420人,用分层抽样的方法从该年级学生中抽取一个容量为280的样本,则此样本中男生人数为160;②一个容量为80的样本中数据的最大值是140,最小值是51,组距是10,则列频率分布表时应将样本数据分为9组;③若关于的线性回归方程为,其中的取值依次为2,8,6,14,20,则;④用一组样本数据8,,10,11,9估计总体的标准差,若样本的平均数为10,则估计总体的标准差为.其中正确的有.(填写所有正确结论的序号)14.(1分)水痘是一种传染性很强的病毒性疾病,易在春天爆发.市疾控中心为了调查某校高年级学生注射水症疫苗的人数,在高一年级随机抽取5个班级,每个班抽取的人数互不相同,若把每个班级抽取的人数作为样本数据.已知样本平均数为7,样本方差为4,则样本数据中的最小值是.15.(1分)下表是关于某校高一年级男女生选科意向的调查数据,人数如表所示:选修物理选修历史男生16040女生80120现要在所有参与调查的人中用分层抽样的方法抽取n个人做进一步的调查,若在“选修物理的男生”中抽取了8人,则n的值为.16.(3分)某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图,如图,估计这次测试中数学成绩的平均分约为、众数约为、中位数约为.(结果不能整除的精确到0.1)四、解答题(共4题;共40分)17.(10分)某教练统计了甲、乙两名三级跳远运动员连续5次的跳远成绩(单位:米),统计数据如图所示.(1)(5分)分别求甲、乙跳远成绩的平均数;(2)(5分)通过平均数和方差分析甲、乙两名运动员的平均水平和发挥的稳定性.18.(5分)某饭店共有36名厨师,其中特级厨师6名,一级厨师12名,二级厨师18名.该饭店用分层抽样的方法从这36名厨师中选派人参加饮食行业的比武大会.但是,即将参加比武大会时,被选出的厨师中恰有一名因病退出,如果再采用系统抽样(等距)方法选派,则选派的人数减少1,且需要从这36名厨师中剔除2人,求的值.19.(10分)某工厂有工人1000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人),现用分层抽样方法(按A类,B类分二层)从该工厂的工人中共抽取100名工人,调查他们的生产能力(生产能力指一天加工的零件数).(1)(5分)A类工人和B类工人各抽取多少人?(2)(5分)将A类工人和B类工人的抽查结果分别绘制成频率分布直方图(如图1和图2).①就生产能力而言,A类工人中个体间的差异程度与B类工人中个体间的差异程度哪个更小?(不用计算,可通过观察直方图直接回答结论)②分别估计A类工人和B类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表).20.(15分)某校高一(1)班全体男生的一次数学测试成绩的茎叶图和频率分布直方图都受到不同程度的破坏,但可见部分如图所示,据此解答如下问题:(1)(5分)求该班全体男生的人数;(2)(5分)求分数在之间的男生人数,并计算频率公布直方图中之间的矩形的高;(3)(5分)根据频率分布直方图,估计该班全体男生的数学平均成绩(同一组中的数据用该组区间的中点值代表).答案解析部分1.【答案】B【解析】【解答】,即应按照的比例来抽取,高级职称应抽取(人);中级职称应抽取(人);一般职员应抽取(人).故答案为:B.【分析】由分层抽样的定义计算出结果即可。
《国民经济统计学概论》_第六章_抽样推断
总体分组: 2 (X X )2 F F
总体成数的方差为 P(1 - P)
2.统计量,又称样本指标,反映样本特 征的统计指标
(1)样本平均数( x ),样本各 单位数量标志值的平均数
未分组: x x
n
分组: x xf f
(2)样本成数(p) 是指样本中具有某一相同标志表现的单
要有四个:
(1)总体平均数( X )
总体各单位数量标志值的平均数
X
总体未分组情况下:X N
总体分组情况下:
XF
X
F
(2)总体成数(P)
是指总体中具有某一相同标志表现的单 位数占全部总体单位数的比重
多为交替指标
总体中具有相同标志表现的单位数用N1 表示
P N1 N
(3)总体方差和标准差 总体方差(σ2)
特点: 1.抽样方式组织简便,便于实施 2.在已知总体某些有关信息的情况下,
采用等距抽样能保证样本单位在总体中 均匀的分布,从而提高了样本对总体的 代表性,有利于降低抽样误差。
无关标志排队 有关标志排队
(三)类型抽样 首先把总体按某一标志分成若干个类型
组,使各组组内标志值比较接近,然后 分别在各组内按随机原则抽取样本单位。 特点:在于把分组法和随机抽样原则结 合起来。
i2ni
n
抽样成数的平均误差:
重置抽样:
p
P(1 P) n
不重置抽样:
第四节 抽样的组织形式及抽样方 案设计
一、抽样的组织形式 (一)简单随机抽样 从总体全部单位中直接按随机原则抽取
样本单位,使每个总体单位都有同等机 会被抽中
最基本形式
(1)直接抽选法 直接从调查对象中随机抽选。
第七章抽样习题
一、填空题1.总体参数估计有和两种。
2.抽样调查的组织方式一般有、、和四种。
3.样本指标是一个变量。
4.在简单随机抽样条件下,抽样误差受、和、等因素的影响。
5.在其他条件不变的情况下,抽取单位越多,抽样平均误差。
6.类型抽样的抽样平均误差受方差的影响,而整群抽样的抽样平均误差受方差的影响。
7.抽样调查是按原则抽取样本,用推断的一种非全面调查。
8. 在假设检验中,第Ⅰ类错误就是弃真错误,弃真是指_____状况;第Ⅱ类错误就是纳伪(取伪)错误,纳伪是指______状况。
9.抽样成数是指样本中具有某一标志表现的占的比重。
10.抽样方法按抽取样本的方式不同分为和。
11、正态总体均值的假设检验,H0:u =u0,H1:u≠u0,若总体方差已知,样本量为n,则其检验的统计量为_______,其公式为_________,若显著性水平为a,接受域为_________。
12、假设检验中若其他条件不变,显著性水平a的取值越小,接受H0的可能性______,原假设为真而被拒绝的概率____。
13、假设检验是利用_____资料来检验事先对总体某些数量特征所作的____是否可信的一种统计分析方法。
14、在假设检验过程中,依据显著性水平a 的大小把概率分布划分为两个区间:小于给定标准的概率区间称为_____;大于给定标准的概率区间称为_____。
15、假设一般包括两部分即___和____。
二、判断题1.抽样误差大小与总体各单位标志值的差异程度成正比。
()2.抽样误差大小与样本单位数目的平方根成反比。
()3.不重复抽样的抽样误差小于重量复抽样的抽样误差。
()4.抽样误差范围是一个绝对可靠的范围。
()5.抽样单位数越多,抽样误差越大。
6.通常所说的抽样误差一般是指抽样平均误差。
()7.抽样误差是人的主观因素造成,因此应该避免。
()8.如果不知道总体方差或标准差,就无法计算抽样平均误差。
()9.整群抽样一般采取不重复抽样。
10.纯随机抽样时,所有可能的样本平均数的平均数等于总体平均数。
统计学简答题(1)
1.如何理解统计的含义答:所谓统计,使人们认识客观世界总体数量变动关系和变动规律的活动的总称,是人们认识客观世界的一种有力工具。
2.如何理解统计的研究对象试述统计研究对象的特点。
答:统计学的研究对象是指统计研究所要认识的客体。
一般来说,统计学的研究对象是客观现象总体的数量特征和数量关系,以及通过这些数量方面反映出来的客观现象发展变化的规律性。
统计研究对象的特征:(1)数量性:这是统计研究对象的基本特征,因为,数字是统计的语言,数据资料是统计的原料;(2)总体性:统计的数量研究是对现象总体中各单位普遍存在的事实进行大量观察和综合分析,得出反映现象总体的数量特征。
(3)变异性:统计研究同类现象总体的数量特征,它的前提是总体各单位的特征表现存在差异。
而且这些差异并不是事先可以预知的。
就是说,总体各单位除了必须有某一共同标志表现作为它们形成统计总体的客观依据以外,还必须要在所要研究的标志上存在变异的表现。
否则,就没有必要进行统计分析研究了。
3.什么是统计总体其基本特征是什么什么是总体单位答:统计总体:是指客观存在的,在同一性质基础上结合起来的许多个别事物的整体基本特征:同质性大量性总体单位:组成总体的各个个体4.举例说明标志和指标之间的关系。
答:指标和标志之间存在密切的联系。
标志反映总体单位的属性和特征,而指标反映总体的数量特征。
标志和指标的关系是个别和整体的关系,需要通过对各单位标志的具体表现进行汇总和计算,才能得到相应的指标。
如果要研究某一企业的职工状况,企业职工人数是统计指标,每个职工的文化程度、技术等级、性别、年龄等是标志。
5.什么是统计指标和指标体系统计指标的构成要素有哪些答:统计指标:反映统计总体数量特征的概念和数值。
统计指标体系:由一系列相互联系的统计指标所组成的有机整体,用以反映所研究现象各方面相互依存、相互制约的关系。
构成要素:指标的概念和指标的取值1.什么是统计数据整理简述统计数据整理的原则和步骤。
抽样估计
人生得意须尽欢,莫使金樽空对月。0 1:45:29 01:45:2 901:45 11/17/2 020 1:45:29 AM
做一枚螺丝钉,那里需要那里上。20. 11.1701 :45:290 1:45No v-2017 -Nov-2 0
日复一日的努力只为成就美好的明天 。01:45:2901:4 5:2901:45Tues day , November 17, 2020
2
x ( R r ),
x r R 1
2
P(Rr) P r R 1
2
2 x
(xi x)
R
,
2 P
(
pi
R
p)2
注:整群抽样是对中选 群进行全面调查,所以 只存在群间抽样误差不 存在群内抽样误差
抽样方案的检查:
主要有(1)准确性检查(以方案所要求的 允许误差范围为标准)
(2)代表性检查(方案中的样本指
二、抽样推断的内容
(一)参数估计。特点是不知道总体的数 量特征,依据所获得的样本观察资料,对所研究 现象总体的水平、规模等数量特征进行估计
(二)假设检验。特点是对总体的变化情 况不了解,不妨对总体的状况作某种假设,然后 再根据抽样推断的原理,根据样本观察资料对所 作假设进行检验,来判断着种假设的 真伪,以决 定行动的取舍。
l估计值
x x
l估计值的误差范围
t
x
x
注意:t=1 F(t)-68.27%
t=2 F(t)=95.45% t=3 F(t)=99.73% 需要熟记
区间估计:
x x X x x
p p P p p
区间估计的步骤:
(x
t ) X
(p
t ) p
《统计学原理》第5章:抽样推断
n
抽样推断的基本原理
统计推断的理论基础—样本的概率分布
按一定方法随机抽取样本时,所有可能样本的 特征值及其所对应的概率分布情况
学生 A B C D E F G 成绩 30 40 50 60 70 80 90
按随机原则考虑顺序重复抽样抽选出4名学生。
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示.
考虑顺序的不重复抽样 考虑顺序的重复抽样
M N! (N n)!
M Nn
不考虑顺序的不重复抽样 不考虑顺序的重复抽样
M N! n!(N n)!
全及指标与样本指标
•根据全及总体中各单位的标志值或标志属性计算得 来,反映总体某种特征的指标 •根据样本总体中各单位的标志值或标志属性计算得 来的综合指标.
抽样推断的一般问题
抽样方法
•重复抽样和不重复抽样
•考虑顺序的抽样和不考虑顺序的抽样
抽样推断的一般问题
抽样方法—重复抽样
从总体N个单位中随机抽取一个容量为n的样本,每 次抽取一个单位,把结果登记后再放回到总体中,重新 参加下一次的抽取.
抽出个体
登记特征
放回总体
继续抽取
抽样推断的一般问题
抽样方法—不重复抽样
从总体N个单位中随机抽取一个容量为n的样本, 每次抽取一个单位,把结果登记后不再放回到 总体参加下一次的抽取.
抽出 个体
登记 特征
继续 抽取
抽样推断的一般问题
抽样方法—考虑顺序的抽样
从总体N个单位中抽取n个单位构成样本,不但考虑样本 各单位成分的不同,而且还要考虑样本各单位的中选顺 序.
5 应用统计学(教案)-抽样推断
4、抽样估计的一般步骤
设计抽样方案 抽取样本单位 收集样本资料
整理样本资料
推断总体指标
(1)抽样方案设计的基本准则
随机原则: 确保每个总体单位都有 被抽取的可能。 抽样误差最小: 控制和选择抽样数 目及抽样组织方式 费用最少: 在误差达到一定要求的 条件下,选择费用最少 的方案。
(2)抽样方案设计的主要内容 ① 编制抽样框 抽样框即总体单位的名单。 主要形式: 名单抽样框 区域抽样框 时间表抽样框 编制要求: 应包括全部总体单位 总体单位不应重复 应便于抽样的实施 应尽量利用资料,提高抽 样效果
第五章 抽样推断
基本概念
抽样误差
抽样估计 抽样组织方式
第一节 抽样估计的基本概念
一、抽样估计的意义和一般步骤 1、抽样估计的概念
抽样估计 按随机原则从总体中抽取一部 分单位进行调查,并以调查结 果对总体数量特征作出具有一 定可靠程度的估计与推断,从 而认识总体的一种统计方法。 也是一种收集资料的方法,所以也称为抽 样调查。
另外,分两个以上阶段完成抽取样本的多阶段抽 样,多在总体单位数量多分布广时采用。一般前阶段 采用分层或有关标志排队等距抽样;后阶段采用简单 随机或无关标志排队等距抽样。
④ 确定抽样数目 抽样数目: 即样本容量、样本单位数 大样本:n ≥ 30 小样本:n < 30 抽样数目的确定,与抽样误差、费 用及抽样组织方式有直接的关系。 误差小费用多时抽样数目多,误差 大费用少时抽样数目少;分层抽样除确 定整个样本容量外,还需确定子样本容 量;整群抽样需确定样本群数;多阶段 抽样需确定各阶段抽样数目。
| x - X |≤△ x (在一定概率下) 置信度、概率保证度、 可信度、把握程度,)与△x 是一对矛盾
初级-抽样推断模拟题
[模拟] 初级-抽样推断单项选择题第1题:抽样推断的主要目的是____。
A.用样本指标来推算总体指标B.对调查单位作深入研究C.计算和控制抽样误差D.广泛运用数学方法参考答案:A抽样推断是指按照随机的原则从调查的总体中抽取一部分样本单位进行观察,并以样本指标对总体指标做出具有一定可靠性的估计和推断,从而达到对调查总体的认识的一种统计方法。
抽样推断的主要目的是用已知的样本指标来推断未知的总体指标。
第2题:某大学的一位研究人员希望估计该大学本科生平均每月的生活费支出,为此,他调查了该大学200名本科生,发现他们每月平均生活费支出是500元。
该研究人员感兴趣,的样本指标是____。
A.该大学的所有本科生人数B.该大学所有本科生月平均生活费支出C.该大学所有本科生的月生活费支出D.所调查的200名本科生的平均月生活费支出参考答案:D样本指标是指根据样本各单位标志值计算的综合指标,常用的样本指标有样本平均数、样本成数、样本方差和样本标准差。
题中,研究人员想通过所调查的200名学生的平均月生活费支出来推断该大学所有本科生月平均生活费支出,感兴趣的指标是样本平均数,即所调查的200名学生的平均月生活费支出。
A项属于总体单位总量指标;B项属于总体指标;C项属于总体标志总量指标。
第3题:在抽样推断中,总体成数是一种____。
A.总体中某一部分的单位数占总体单位总数之比重B.总体中某一部分的单位数与另一部分的单位数之比例C.总体的某一指标与另一相联系的指标对比的比率D.一个总体的某一指标与另一总体的同类指标对比的比率参考答案:A总体成数是指一个现象有两种表现时,其中具有某种标志的单位数,在总体中所占的比重。
第4题:在理论上最符合随机原则的抽样组织方式是____。
A.简单随机抽样B.分层抽样C.等距抽样D.整群抽样参考答案:A简单随机抽样是指对总体不作任何处理,不进行分类也不进行排队,而是完全按随机的原则,直接从总体全部单位中抽选样本单位。
第五章 抽样估计
步骤: 步骤:
例题1.(题型一)
某乡水道总面积2000亩,从中随机抽取40亩(重复抽样),每亩产量资料如下:
每亩产量(斤)
亩数
x
xf
(x- ) f
400—450
450—500
500—550
550—600
600—650
650—700
1)常用的参数和统计量(指标:平均指标和变异指标)
对于数量标志,计算平均指标和变异指标( )
对于品质标志,计算成数指标(结构相对指标)来表示某种性质的单位数在总体全部单位数中所占的比重。即p=(n1/n),则总体中不具有某种性质的单位数在总体中所占的比重为:q=1-p
如果进行对品质标志是非标志进行赋值,即:定义为“1”和“0”,则有:
(五)抽样估计的置信度
前面我们学习了两种误差,即平均误差和极限误差,这两种误差有着不同的含义。
抽样平均误差反映抽样误差一般水平,是样本资料和总体之间所有离差值的一个平均数。极限误差指进行抽样在统计工作前设立的一个误差最大值。二者的关系是 ( )用抽样误差概率度来表示的。
我们客观地承认,只要进行抽样调查,必然存在误差,并且根据经验或工作要求,我们可以设置一个误差最大值,但要使抽样调查结果一定符合误差在极限误差范围内,却并非能够实现。所以要保证误差不超过一定范围的,只能给一定程度的概率保证程度。抽样估计置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。
如:t=1 F(t)=P=68.27%查《正态分布概率分t=2 F(t)=F(2)=P=95.45%布表》
t=3 F(t)=F(3)=P=99.73%
t=1.64 F(t)=90%
简单随机抽样的抽样估计
间 及 优 质 产 品 的 数 量 ?
15
总体方差的区间估计
大样本情况下,样本标准差S的分布近似于正 态分布:
其均值为总体标准差,其标准差为 ,
2n
所以标准标准差置信度1的置信区间为:
(SZ2
S 2n,SZ2
S) 2n
18
抽样数目的确定 (大样本)
必要的抽样数目:指为了使抽样误差不超过 给定的允许范围至少应抽取的样本单位数 目。 一般根据抽样极限误差与抽样数目关系来 确定必要的抽样数目。
19
采用重复抽样,则抽样极限误差为
x Z 2x Z 2( n)
若规定在一定概率保证程度下允许误差为 , x
则由 x
Z
2x
Z
651(件)
不重复抽样:
n
Z2 2 P(1 P)N
2 p
N
Z2
2 P (1
P)
32 0.93 0.07 5000 0.032 5000 32 0.93 0.07
576(件)
25
确定抽样单位数目应注意的问题
1. 以上四个计算公式只适用于简单随机抽样。 2. 在同样条件下,不重复抽样比重复抽样要求 的抽样单位数目少。 3. 同一总体往往同时需要计算抽样平均数和抽 样成数,由于它们的方差和允许误差要求不同, 因此,对于抽样单位数目多少的要求也不一样, 为了防止抽样单位数目的不足,而扩大抽样误 差,在实际工作中,往往根据抽样单位数目比 较大的一个数目进行抽样,以满足共同要求。
9
设待估计的总体参数为,L,U为样本 确定的两个统计量,对于给定的(0 1),
有:
P(L U ) 1 则称(L,U )为参数的置信度(1)的置信 区间.该区间的两个端点L,U分别称为置 信下限和置信上限,统称为置信限.为显 著性水平,(1)为置信度.
抽样与抽样估计
第四章抽样与抽样估计一、单项选择题1.抽样估计的基本内容是()A.参数估计B.假设检验C.参数估计和假设检验两方面D.数据的收集2.估计量的标准差实质上就是()A.总体标准差B.抽样总体的标准差C.抽样总体方差D.样本统计量的标准差3.不放回抽样的误差()A.总是大于放回抽样的误差B.总是小于放回抽样的误差C.总是等于放回抽样的误差D.上情况都可能发生4.在简单随机抽样中,当其它条件保持不变,样本量增加一倍,则估计量的标准差()A.缩小为原来的81.6%B.缩小为原来的50%C.缩小为原来的25%D.扩大为原来的四倍5.概率抽样中,样本的形成是()A.随机的B.随意的C.非随机的D.确定的6.抽样误差之所以产生是由于()A.破坏了抽样的随机原则B.抽样的随机性C.破坏了抽样的系统D.调查人员的素质7.抽样误差指的是()A.系统性误差B.抽样框误差C.代表性误差D.随机性误差8.抽样误差的大小()A.可以事先计算,但不能控制B.不能事先计算,但能控制C.可以事先计算并进行控制D.能够控制,但不能消除9.随机抽出100个工人,占全体工人1%,工龄不到一年的比重为10%。
在概率为0.9545时,工龄不到一年的工人比重的估计标准差应为()A.0.6%B. 6%C.0.9%D. 3%10.根据抽样调查25个工厂(抽样比为2%)资料,采购阶段流动资金平均周转时间为52天,方差100,在概率为0.9545时,流动资金平均周转时间估计量的标准差为()A.0.8B.3.96C.4D.22611.假定10亿人口大国和100万人口小国的居民年龄的变异程度相同,现在各自用重复抽样方法抽取本国的1%人口计算平均年龄,则平均年龄的抽样标准差()A.两者相等B.前者比后者大C.前者比后者小D.不能确定12.根据抽样调查的资料,某城市人均日摄入热量2500千卡,抽样标准差150千卡,则在多大的置信度下可以断定该市人均摄入热量在2350千卡至2650千卡之间()A.0.9545B.0.6827C.1D.0.9013.在抽样调查某企业工人生产定额完成情况时,从工人按姓氏笔划多少的顺序名单中进行每五人抽样。
抽样调查习题答案
抽样调查习题答案【篇一:抽样调查习题及答案】ss=txt>1. 抽样调查是遵循随机的原则抽选样本,通过对样本单位的调查来对研究对象的总体数量特征作出推断的。
2. 采用不重复抽样方法,从总体为n的单位中,抽取样本容量为n的可能样本个数为n(n-1)(n-2)??(n-n+1)。
3. 只要使用非全面调查的方法,即使遵守随机原则,抽样误差也不可避免会产生。
4. 参数估计有两种形式:一是点估计,二是区间估计。
5. 判别估计量优良性的三个准则是:无偏性、一致性和有效性。
6. 我们采用“抽样指标的标准差”,即所有抽样估计值的标准差,作为衡量抽样估计的抽样误差大小的尺度。
7. 常用的抽样方法有简单随机抽样、类型(分组)抽样、等距抽样、整群抽样和分阶段抽样。
9. 如果总体平均数落在区间960~1040内的概率是95%,则抽样平均数是1000,极限抽样误差是40.82,抽样平均误差是20.41。
10. 在同样的精度要求下,不重复抽样比重复抽样需要的样本容量少,整群抽样比个体抽样需要的样本容量多。
二、判断题3. 重复抽样条件下的抽样平均误差总是大于不重复抽样条件下的抽样平均误差。
(√) 4. 在其他条件不变的情况下,抽样平均误差要减少为原来的1/3,则样本容量必须增大到9倍。
(√)1. 用简单随机抽样(重复)方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩大为原来的(c)a. 2倍b. 3倍c. 4倍d. 5倍2. 事先将全及总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样组织方式叫做(d)a. 分层抽样b. 简单随机抽样c. 整群抽样d. 等距抽样3. 计算抽样平均误差时,若有多个样本标准差的资料,应选哪个来计算(b)a. 最小一个 b. 最大一个 c. 中间一个 d. 平均值 4. 抽样误差是指(d)a. 计算过程中产生的误差b. 调查中产生的登记性误差c. 调查中产生的系统性误差 d. 随机性的代表性误差5. 抽样成数是一个(a)a. 结构相对数b. 比例相对数c. 比较相对数d. 强度相对数 6. 成数和成数方差的关系是(c)A.成数越接近于0,成数方差越大B.成数越接近于1,成数方差越大C.成数越接近于0.5,成数方差越大D.成数越接近于0.25,成数方差越大 7. 整群抽样是对被抽中的群作全面调查,所以整群抽样是(b)a. 全面调查b. 非全面调查c. 一次性调查d. 经常性调查8. 对400名大学生抽取19%进行不重复抽样调查,其中优等生比重为20%,概率保证程度为95.45%,则优等生比重的极限抽样误差为(40%)a. 4% b. 4.13% c. 9.18% d. 8.26%9. 根据5%抽样资料表明,甲产品合格率为60%,乙产品合格率为80%,在抽样产品数相等的条件下,合格率的抽样误差是(b)a. 甲产品大b. 乙产品大c. 相等d. 无法判断10. 抽样调查结果表明,甲企业职工平均工资方差为25,乙企业为100,又知乙企业工人数比甲企业工人数多3倍,则随机抽样误差(b)a. 甲企业较大b. 乙企业较大c. 不能作出结论d. 相同四、多项选择题抽样调查中的抽样误差是(abcde)a. 是不可避免要产生的b. 是可以通过改进调查方法来避免的c. 是可以计算出来的d. 只能在调查结果之后才能计算e. 其大小是可以控制的 2. 重复抽样的特点是(ac)a. 各次抽选相互影响b. 各次抽选互不影响c. 每次抽选时,总体单位数始终不变 d 每次抽选时,总体单位数逐渐减少e. 各单位被抽中的机会在各次抽选中相等 3. 抽样调查所需的样本容量取决于(abe)a. 总体中各单位标志间的变异程度b. 允许误差c. 样本个数d. 置信度e. 抽样方法4. 分层抽样误差的大小取决于(bcd)a. 各组样本容量占总体比重的分配状况b. 各组间的标志变异程度c. 样本容量的大小d. 各组内标志值的变异程度e. 总体标志值的变异程度 5. 在抽样调查中(acd)a. 全及指标是唯一确定的b. 样本指标是唯一确定的c. 全及总体是唯一确定的d. 样本指标是随机变量e. 全及指标是随机变量五、名词解释 1.抽样推断 2.抽样误差3.重复抽样与不重复抽样4.区间估计六、计算题1.某公司有职工3000人,现从中随机抽取60人调查其工资收入情况,得到有关资料如下:(1)试以0.95的置信度估计该公司工人的月平均工资所在范围。
情境四、抽样估计方法
学习目标
理解抽样估计的概念、特点、作用以及几个 基本概念; 掌握抽样误差的含义和影响抽样误差的主要 因素; 熟练掌握抽样平均误差的计算; 熟练掌握抽样估计的两种方法:点估计和区 间估计; 掌握必要抽样数目的确定方法。
任务
任务1 任务2 任务3 任务4 抽样推断的一般问题 抽样误差 抽样估计的方法 抽样组织设计
N 15000 n 150 147 p 98% 150 p(1 p) 0.98 (1 0.98) p 1.14% n 150 若按不重复抽样方式:
p
p(1 p ) n 0.98 (1 0.98) 150 (1 ) (1 ) 1.1374% n N 150 15000
4.1抽样推断的一般问题
4.1.1抽样推断的意义与特点
1.意义
对于无限总体,统计上无法进行全面调查了解,只有借助于抽样 推断的方法来认识总体的数量特征。 许多产品的例行质量检验是带有破坏性的或消耗性的。对这些总 体只能进行抽样调查。 对于某些现象,虽然可以进行全面调查,但需要花费大量的人力、 物力、财力和时间,若采用抽样调查,可以达到事半功倍的效果。 对全面调查的资料进行评价与修正。 在对工业生产过程的质量控制。
n
有效性 当 为 的无偏 估计时, 方差
估计量
的数学期望等于总 ˆ 体参数,即 E 该估计量称为无偏 估计
ˆ | ) 0 Lim P(| n
E(ˆ )2
越小,
无偏估计越有效。
4.3抽样估计的方法
4.3.2总体指标的区间估计
1.抽样估计的置信度
2 ( 样本指标 总体指标 )
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本章导学:登陆省电大网站 在线学习平台
/teacher.php 教学辅导(三) IP课件第十讲 参考资料
中华人民共和国国家统计局 /
中国人口信息网(1%人口抽样调查) /index.asp
4、非随机抽样 根据市场调查者的主观分析判断来选取样本单 位。包括偶遇抽样、主观抽样、定额抽样。
5、参数
根据总体各单位的标志值或标志特征计算的, 反映总体数量特征的综合指标,称为全及指标, 由总体各单位的标志值或标志特征所决定,全 及指标的指标值是确定的,唯一的,称为参数。
对 于 总 体 中 的 数 量 标,志常 用 的 总 体 参 数 有体总均 值
第五章 抽样估计
教学目的:通过对本章的学习,了解 抽样估计的基本原理,掌握抽样估计 的基本方法。
教学设计:对主要的知识点进行讲解,通过在线 学习平台的“教学辅导”与“参考资料”栏目获 取相关知识,从而对重要的知识点有进一步的认 识,在此基础上通过练习来加深对相关问题的理 解,同时通过网上实时与非实时的答疑解决疑难 问题。
推断
样本 (非唯一)
总体 (唯一)
(4)抽样推断的误差可以计算并加以控制。
二、抽样推断的内容
(一)参数估计
用样本的观察资料来估计所研究现象总体的水 平、结构、规模等数量特征,这种推断方法称为 参数估计。
(二)假设检验
对总体的状况作出某种假设,然后根据样本所 提供的信息来判断总体未知参数事先所作的假设 是否成立的统计分析方法称为假设检验。
重难点讲解:抽样误差的概念及计算;抽样估计 的方法
第五章 抽样估计
第一节 抽样推断的一般问题 第二节 抽样误差 第三节 抽样估计的方法 第四节 抽样组织设计
相关知识回顾:
统计调查方法
全面调查
非全面调查普Biblioteka 统查计 报
表
抽重典 样点型 调调调 查查查
抽样调查:按照随机原则,从总体中抽取一部分 样本单位,根据对样本单位的调查结果来推断 总体的数量特征。
第二节 抽样误差
一、抽样误差的概念 概念: 指由于随机抽样的偶然因素使样本各单 位的结构不足以代表总体各单位的结构,而引起 抽样指标和全及指标之间的绝对离差。
影响抽样误差大小的因素: (1)总体各单位标志值的差异程度; (2)样本单位数; (3)抽样方法; (4)抽样组织形式。
二、抽样平均误差(抽样指标的标准差) 反映抽样误差一般水平的指标。是所有可能
7、样本容量 指一个样本所包含的单位数。
8、样本个数 又称样本可能数目,是指从一个总体中可能抽
取的样本个数。 9、重复抽样
从总体N个单位中随机抽取样本容量为n的样 本,每次从总体中抽取一个,连续进行n次实验 构成抽样样本。每次抽出一个单位把结果登记 下来又放回,重新参加下一次的抽选。共可抽 取容量为n的样本 N个n 。
10、不重复抽样 从总体N个单位中随机抽取容量为n的样本,
每次从总体中抽取一个,连续进行n次实验构 成抽样样本。但每次抽选出的单位就不再放回 参加下一次抽选。共可抽取容量为n的样本 N(N-1)(N-2)….(N-n+1)个。
结论:总体单位数一致,在相同样本容量的情 况下,重复抽样的样本个数大于不重复抽样的 样本个数。
出现的样本指标和总体指标的平均离差。
1、抽样平均数的平均误差,也可称为抽样平均 数的标准差(表明各样本均值与总体均值离差 的一般水平)
(1)重复抽样情况下
μx
σ n
(计 算 公 式)
: 总体标准差
n:样本单位数
例:设有三个数8、10、12,这一总体的均值、 标准差分别为:
X 8 10 12 10 3
第一节 抽样推断的一般问题
一、抽样推断的意义
1、概念:
抽样推断是在抽样调查的基础上,利用样本 的实际资料计算样本指标,并据以推算总体相 应数量特征的一种统计分析方法。
总体
推断
样本
2、特点 (1)由部分推算整体的一种方法; (2)抽样推断建立在随机抽样的基础上; (3)抽样推断是运用概率估计的方法;
X和 总 体 方 差 2
X
X
N
XF F
2 X X 2 X X 2 F
N
F
X:表示总体变量,有N个单位,所以可以表示为
X , X , X
1
2
n
对于总体中的品质标志:
由于不能用数量来表示,总体参数通常用成数P表示。
成数:总体中具有某种性质的单位数在总体全部单位数
中的比重,用P表示。总体中不具有某种性质的单位数在
总体中所占的比重,用Q表示。有P+Q=1
用N表 示 总 体 单 位 数 ,N1表 示 总 体 中 具 有 某 种质性的 单 位 数
N0表 示 总 体 中 不 具 有 某性种质 的 单 位 数 , 可 以道知
N N N
1
0
N /N P 1
N0 / N Q 1 P
当某种标志,它的标志表现只有是非两种,可
以用“1”表示标志表现为“是”的标志的标志 表现,“0”表示标志表现为“非”的标志的 标志表现,在此情况下:
1 N 0 N N
X
1
0 1 P
P
N
N
2
0 P 2 N 1 P 2 N P2N Q2N
0
1
0
1 P2Q Q2P
P
N
N
PQP Q PQ
6、统计量
根据样本各单位标志值或标志属性计算的综合 指标称为统计量。样本统计量是用来估计总体 参数的。反映样本的数量特征。
三、抽样的几个基本概念
1、总体
也称全及总体,指所要认识的研究对象全体, 由具有某种共同性质许多单位组成的集合体, 一般用N表示。
无限总体、有限总体
2、样本
又称子样,是从全及总体中随机抽取出来, 作为代表这一总体的那部分单位组成的集合体, 一般用n表示。
总体
样本
3、随机抽样 按随机原则从总体中抽取样本单位。
x x xf n f
2 ( x x)2 ( x x)2 f
n
f
xp p
2 p
pq
参数 统计量
总体
样本
例题:某批产品共500件,合格品480件, 不合格品20件,要求计算成数合格品率、
X P、 P
480 P 96%
500
X P 96%
P PQ 96% 4% 0.196