第四章 抽样调查
(完整版)抽样调查习题及答案
第四章习题抽样调查一、填空题1.抽样调查是遵循随机的原则抽选样本,通过对样本单位的调查来对研究对象的总体数量特征作出推断的。
2.采用不重复抽样方法,从总体为N的单位中,抽取样本容量为n的可能样本个数为N(N-1)(N-2)……(N-N+1)。
3.只要使用非全面调查的方法,即使遵守随机原则,抽样误差也不可避免会产生。
4.参数估计有两种形式:一是点估计,二是区间估计。
5.判别估计量优良性的三个准则是:无偏性、一致性和有效性。
6.我们采用“抽样指标的标准差”,即所有抽样估计值的标准差,作为衡量抽样估计的抽样误差大小的尺度。
7.常用的抽样方法有简单随机抽样、类型(分组)抽样、等距抽样、整群抽样和分阶段抽样。
8.对于简单随机重复抽样,若其他条件不变,则当极限误差范围Δ缩小一半,抽样单位数必须为原来的4倍。
若Δ扩大一倍,则抽样单位数为原来的1/4。
9.如果总体平均数落在区间960~1040内的概率是95%,则抽样平均数是1000,极限抽样误差是40.82,抽样平均误差是20.41。
10.在同样的精度要求下,不重复抽样比重复抽样需要的样本容量少,整群抽样比个体抽样需要的样本容量多。
二、判断题1.抽样误差是抽样调查中无法避免的误差。
(√)2.抽样误差的产生是由于破坏了随机原则所造成的。
(×)3.重复抽样条件下的抽样平均误差总是大于不重复抽样条件下的抽样平均误差。
(√)4.在其他条件不变的情况下,抽样平均误差要减少为原来的1/3,则样本容量必须增大到9倍。
(√)5.抽样调查所遵循的基本原则是可靠性原则。
(×)6.样本指标是一个客观存在的常数。
(×)7.全面调查只有登记性误差而没有代表性误差,抽样调查只有代表性误差而没有登记性误差。
(×)8.抽样平均误差就是抽样平均数的标准差。
(×)三、单项选择题1.用简单随机抽样(重复)方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩大为原来的(C)A.2倍B.3倍C.4倍D.5倍2.事先将全及总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样组织方式叫做(D)A.分层抽样B.简单随机抽样C.整群抽样D.等距抽样3.计算抽样平均误差时,若有多个样本标准差的资料,应选哪个来计算(B)A.最小一个B.最大一个C.中间一个D.平均值4.抽样误差是指(D)A.计算过程中产生的误差B.调查中产生的登记性误差C.调查中产生的系统性误差D.随机性的代表性误差5.抽样成数是一个(A)A.结构相对数B.比例相对数C.比较相对数D.强度相对数6.成数和成数方差的关系是(C)A.成数越接近于0,成数方差越大B.成数越接近于1,成数方差越大C.成数越接近于0.5,成数方差越大D.成数越接近于0.25,成数方差越大7.整群抽样是对被抽中的群作全面调查,所以整群抽样是(B)A.全面调查B.非全面调查C.一次性调查D.经常性调查8.对400名大学生抽取19%进行不重复抽样调查,其中优等生比重为20%,概率保证程度为95.45%,则优等生比重的极限抽样误差为(40%)A. 4%B. 4.13%C. 9.18%D. 8.26%9.根据5%抽样资料表明,甲产品合格率为60%,乙产品合格率为80%,在抽样产品数相等的条件下,合格率的抽样误差是(B)A.甲产品大B.乙产品大C.相等D.无法判断10.抽样调查结果表明,甲企业职工平均工资方差为25,乙企业为100,又知乙企业工人数比甲企业工人数多3倍,则随机抽样误差(B)A.甲企业较大B.乙企业较大C.不能作出结论D.相同四、多项选择题抽样调查中的抽样误差是(ABCDE)A.是不可避免要产生的B.是可以通过改进调查方法来避免的C.是可以计算出来的D.只能在调查结果之后才能计算E.其大小是可以控制的2.重复抽样的特点是(AC)A.各次抽选相互影响B.各次抽选互不影响C.每次抽选时,总体单位数始终不变D每次抽选时,总体单位数逐渐减少E.各单位被抽中的机会在各次抽选中相等3.抽样调查所需的样本容量取决于(ABE)A.总体中各单位标志间的变异程度B.允许误差C.样本个数D.置信度E.抽样方法4.分层抽样误差的大小取决于(BCD)A.各组样本容量占总体比重的分配状况B.各组间的标志变异程度C.样本容量的大小D.各组内标志值的变异程度E.总体标志值的变异程度5.在抽样调查中(ACD)A.全及指标是唯一确定的B.样本指标是唯一确定的C.全及总体是唯一确定的D.样本指标是随机变量E.全及指标是随机变量五、名词解释1.抽样推断2.抽样误差3.重复抽样与不重复抽样4.区间估计六、计算题1.某公司有职工3000人,现从中随机抽取60人调查其工资收入情况,得到有关资料如下:(1)试以0.95的置信度估计该公司工人的月平均工资所在范围。
第4章__抽样调查
4.1.3抽样误差的确定
❖1)抽样误差的概念
❖2)影响抽样平均误差的因素
1、全及总体标志变异程度 2、样本容量 3、抽样组织方式 4、抽样方法
❖3)降低调查误差的途径
1、提高样本的代表性
2、注重样本量的控制
3、提高抽样设计的效率 4、重视抽样方案的审评
5、努力降低调查员的误差 6、努力调查被调查者的误差
❖ (4)如果这一地区街对面从第一号开始都没有住户,在第一号对面的街区转 一圈,并遵循右手法则。(即按顺时针方向在街区转一圈。)试着沿路线每 隔两户访问一户。
❖ (5)在起始门牌号对面邻近的街区绕过一圈后,如果你没有完成所需的访问, 就按顺时针方向到下一个街区访问。
❖ (6)如果第三个街区的住户数不够完成你的任务,就再做几个街区直到要求 的户数完成为止;这些区要按顺时针方向绕原有的街区来找。
❖5)简单随机抽样方式的优缺点
随机抽样方式的优点
方法简单直观,当总体名单完整时,可直接从中随机抽取样本。由于 抽取概率相同,计算抽样误差及对总体指标加以推断比较方便。
随机抽样方式的缺点
尽管简单随机抽样在理论上是最符合随机原则的,但是在实际应用中 有一定的局限性。第一,采用简单随机抽样,一般需对总体各单位加以 编码,而实际市场调查活动中所需调查总体往往是十分庞大的,单位非 常多,逐一编码几乎是不可能的;第二,对于某些事物无法使用简单随 机抽样,如对连续不断产生的大量产品进行质量检验,就不能对全部产 品进行编号抽样;第三,当总体的标志变异程度较大时,简单随机抽样 的代表性就不如经过分组后再抽样的代表性高;第四,由于抽出样本单 位较为分散,所以调查人力、物力、费用消耗较大。
2)抽样调查的特征
❖(1)抽取样本的客观性 ❖(2)抽样调查可以比较准确地推断总体
第四章 抽样
主讲人: 张建鹏 要内容
一、抽样的意义与作用 二、概率抽样的原理与程序 三、概率抽样方法 四、非概率抽样方法 五、样本规模与抽样误差
2
一、抽样的意义与作用
1. 相关概念 (1). 总体(population):构成它的所有元素的集合 N 表示。元素则是构成总体的基本的单元。 如:海医学生新闻获得方式调查 某市居民家庭生活状况 (2). 样本(sample):从总体中按一定方式抽取的一部 分元素的集合。用n表示 如:从海医1万名学生中,按一定方式抽取300人进行 调查,这300人构成该总体的一个样本。
28
分层(最佳)抽样法
定义:又称非比例抽样法,根据各层样本标准差 的大小确定各层的样本数目的方法。 计算公式为:
ni = n * ( N i Si / ∑ N i Si )
(1)
式中:ni ----- 各类型应抽选的样本单位数 n ----- 样本单位数 Ni ----- 各类型的调查单位数 Si ----- 各类型调查单位数的样本标准差
14
抽样设计的五个步骤 1)定义目标总体 (如上述案例中正在上学的 年龄在8-17岁的年轻人) 2)制定抽样框 (例如上述案例中的所有县及 县内的城市和城镇) 3)选择一种抽样技术 (如上述案例中的三段 分层概率抽样) 4)实际抽取样本 (样本容量,1000名;执行 抽样过程和对调查员指令) 5)评估样本质量 (如检测样本平均年龄是否 与全国普查数据一致或接近)
33
整群抽样与分层抽样的比较
特征 样本来源 抽样目的 划分原则 整群抽样 一个或几个 不提高成本而提 高抽样效率 分层抽样 所有层 不提高成本而提 高精度
群中的个体异质, 层中个体同质, 群间同质 层间异质
第四章 抽样调查
抽样分布原理
(一)基本符号 1.总体 A = {a1 , a2 ,, aN }, A = N . 1.总体 2.从总体中抽取n个对象构成样本,共有k个样 2.从总体中抽取n个对象构成样本,共有k 本,设样本的符号为:
A1 , A2 ,, Ak , k = C , Ai = n, i = 1, 2,, k
本章复习思考题
1,什么叫抽样?从总体中抽样样本需满足哪些 条件? 2,简单随机抽样?机械抽样?抽样调查法的性 质?随机抽样的原则? 3,抽样误差?影响抽样误差大小的因素?抽样 误差与调查误差,系统误差的区别? 4,抽样分布?平均误差?抽样分布原理? 5,教材第三章课后习题P84的第二题,P85的第 ,教材第三章课后习题P84的第二题,P85的第 四题,P86的第六题. 四题,P86的第六题.
(三)问卷设计的原则 (三)问卷设计的原则 题意清楚,明确,易懂;口语化;避免一题两问;避免 诱导;公正客观;逻辑一致性;完整性(问题和备选 答案);不要用否定形式提问;不要直接询问敏感性 问题. (四)问卷的结构 1,四结构说:标题(简明扼要,概括专项调查的主 题);指导语(包括调查的目的和意义;问题及备选 答案的必要解释,调查须知及其他事项说明等;如涉 及需为被调查者保密的内容,需申明予以保密);主 体内容(内容不宜过多,过繁,应根据需要而确定); 结束语(提出几个开放性的问题或让被试提出对本研 究的建设性的意见;表示对被试合作的感谢). 2,六结构说:在四结构说的基础上,加上被调查者的 基本信息;作业证明的记载.
无限总体时, 有限总体时,
σ σx = n
σ N n σx = × N 1 n
对于有限总体,样本容量与总体容量的 比n/N称为抽样比例. n/N称为抽样比例. 一般认为,n/N<0.05时,就可以省略修 一般认为,n/N<0.05时,就可以省略修 正系数.
[高等教育]现代社会调查 第四章 抽样
3.分层抽样
——又称类型抽样,它是先将总体中的所有单位按某种特征或标 志(如性别、年龄、职业或地域等)划分成若干类型或层次,然后 再在各个类型或层次中采用简单随机抽样或系统抽样的办法抽取 一个子样本,最后,将这些子样本合起来构成总体的样本。 操作方法:
将总体中的所有单位按某种特征或标志(如性别、年龄、职业或地
特点 简单随机抽样 一阶段抽样 系统抽样
分层抽样
整群抽样 多阶段抽样 多段抽样 PPS抽样
样本一次直接从 总体中抽出
样本分多阶段从 总体中抽出
17
1.简单随机抽样
——是概率抽样的最基本形式,它是按等概率原则直 接从含有N个元素的总体中随机抽取n个元素组成样本 (N>n)。
常用方法:直接抽样法、抽签法、随机数表法
25
当抽样间距(K=N/n)不是整数时:
循环等距抽样法 A+K A A+2K
A+3K
A+4K
A+(n-1)K
调整直线等距抽样 如:N=2580, n=300, 则K=8.6
……
调整:在1-86之间选择整数的随机起点,如27;将小数 点调回,得到非整数的随机起点2.7,由此得到号码:2.7, 11.3, 19.9, 28.5,……。将小数点后面的部分略去,就是迁 中单位的号码:2, 11, 19, 28, …… 26
抽5个区
抽4个区 抽3个区
抽12所学校
抽10所学校 抽10所学校
每所学校抽20名教师
每所学校抽30名教师 每所学校抽40名教师
方案8
方案9
根据抽取对象的具体方式的不同,把抽样分为概率抽 样和非概率抽样。
6
抽样的类型
第四章 抽样技术
• (五)多阶段抽样
– 含义:multistage sampling-----即先抽大的调 查单元,在大单元中抽小单元,再在小单元 中抽更小的单元。如:我国的城市职工家计 调查,采用三阶段抽样,先城市-基层单位调查户。
第四章 抽样技术
– 应用:在复杂、大规模的市场调查中。
• (六)抽样技术的选用原则
• (四)常用术语
– 1.总体(population)与样本(sample) – 2.总体指标和样本指标
• 总体指标-------反映总体数量特征的指标,有总 体平均数µ,总体比例P, 总体方差 σ 2
第四章 抽样技术
– 样本指标------又称样本估计量或统计量,用 以估计和推断相应总体指标的综合指标,有 样本平均数 x ,样本比例p ,样本方差S2。
第四章 抽样技术
• 成数------分总体成数与样本成数 • 含义------总体中具有某种特征的单位占全部单 位的比例,称总体成数(总体比例) • 如:产品的合格率,市场占有率等。 • 样本成数的抽样分布
– 当从总体中抽出一个容量为n的样本时,样本中具有 某种特征的单位数x服从二项分布,即有x~B(n, π),且 有E(x)=n π V(x)=n π(1- π). – 因而样本比例p=x/n也服从二项分布,且有: – E(p)=E(x/n)= π – V(p)=V(x/n)=1/n π(1- π)
第四章 抽样技术
第四章 抽样技术
第四章 抽样技术
本章要点
• 1.抽样调查的含义、特点与程序; • 2.随机抽样技术的类型及其各自的特点、 方法; • 3.非随机抽样技术的类型及其各自的特 点、方法; • 4.抽样误差的含义及其计算方法 。
第四章 抽样技术
第四节抽样调查
共同定义:总体是构成它的所有元素的集合,而元 素则是构成总体的最基本单位。 样本(Sample)样本就是从总体中按一定方式抽取出 的一部分元素的集合。 抽样(Sampling) 指从组成某个总体的所有元素的集 合中,按一定的方式选择或抽取一部分元素的过程, 或者说抽样是从总体中按一定方式选择或抽取样本 的过程。
第二节 概率抽样的原理与程序
统计值(Statistic)也称为样本值,它是关于样本中某
一变量的综合描述。统计值是从样本中计算出来的, 它是相应的参数值的估计量。 置信度(Confidence level)与置信区间 (Confidence Interval)。置信度也称为置信水平,它是指总体参 数值,落在样本统计值某一区间内的概率,或者说 是总体参数值落在样本统计值某一区间中的把握性 程度。它反映的是抽样的可靠性程度。例子:P64。 置信区间指的是样本统计值与总体参数值之间的误 差范围,置信区间反映的是抽样的精确性程度。
第二节 概率抽样的原理与程序
确定抽样框:确立总体后,收集总体中全部
抽样单位的名单。有两种确立方法:一是全 选法,一个不能漏。如大学生社会实习调查。 选定总体为全日制大学在校本科生与研究生, 就要从各院系花名册中统一编号。 另一种是分层次的样本框:如调查一个城市 小学生的学习状况。全市500小学,选10所, 再从10所中每个学校选3个班;最后每个班选 10名学生。
第一节 抽样的意义与作用
(3)所抽选的调查样本数量,是根据调查误差的要求,
经过科学的计算确定的,在调查样本的数量上有可 靠的保证。 (4)抽样调查的误差,是在调查前就可以根据调查样 本数量和总体中各单位之间的差异程度进行计算, 并控制在允许范围以内,调查结果的准确程度较高。 基于以上特点,抽样调查被公认为是非全面调查方 法中用来推算和代表总体的最完善、最有科学根据 的调查方法。
第四章 抽样
• 3.设计抽样方案 • 4.制定抽样框
– 制定抽样框就是依据已经明确界定的总体范围,收集总体中全部抽样单位 的名单,并统一编号。
• 5.实际抽取样本 • 6.样本评估
– 样本评估就是对样本的质量和代表性进行检验,其目的是防止因样本的偏 差过大而导致的失误。
– 实际抽取样本就是在上述几个步骤的基础上,严格按照所选定的抽样方法, 从抽样框中抽取一个个的抽样单位,构成样本。
运用:
• 从侨光分校的7000位学生中,抽取100位学 生进行调查查,以研究学生对学校教学条 件的满意度。之前所做的普查表现出的对 学校教学条件的平均满意度为85%,现通 过抽查统计后的满意度为80%。 • 请说出本次抽查中的总体、样本、抽样元 素、抽样单位、抽样框、参数值、统计值、 抽样误差。
二、抽样的作用
• 分类抽样有着突出的优点: 第一,分类抽样能够克服简单随机抽样的缺 点,适用于总体内个体数目较多,结构较复杂, 内部差异较大的情况。 第二,精确度较高。 第三,便于对不同层面的问题进行探索。 第四,便于分工,使工作效率提高。 分类抽样的缺点是,如何分类通常由人们主 观判定,因此要求调查者具备较高的素质与能力, 并且必须事先对总体各单位的情况有较多的了解, 而它们在实际工作中有时难以完全实现,这就会 影响分类的科学性和精确性。
三、抽样的类型
• 概率抽样 • 非概率抽样
– 根据抽取对象的具体方式,人们把抽样分为许多不同 的类型。总的来说,各种抽样都可以归为概率抽样与 非概率抽样两大类。这是两种有着本质区别的抽样类 型。概率抽样是依据概率论的基本原理,按照随机原 则进行的抽样,因而它能够避免抽样过程中的人为误 差,保证样本的代表性;而非概率抽样则主要是依据 研究者的主观意愿、判断或是否方便等因素来抽取对 象,它不考虑抽样中的等概率原则,因而往往产生较 大的误差,难以保证样本的代表性。 概率抽样与非概率抽样又各自包括了许多具体类 型。分别适用于不同调查对象。联系实际认识概率抽 样的不同类型及其适用性是掌握抽样方法的关键。
第四章 抽样
(1)概率抽样:简单随机抽样、系统抽样、 分层抽样、整群抽样、多段抽样、PPS抽样、 户内抽样 (2)非概率抽样:偶遇抽样、判断抽样、 定额抽样、雪球抽样
二、概率抽样的原理与程序
(一)概率抽样的基本原理 1、总体的同质性与异质性 同质性:如果某个总体中的每一个成员在所有方 面都相同,那么,我们就说这个总体具有完全的 同质性。 否则,就存在不同程度的异质性。 同质性总体不需要抽样。 社会各种总体的异质性决定了严格的概率抽样的 必要性。
(二)系统抽样
3、系统抽样优缺点: <1>优点: ①易于实施,工作量少。 ②样本在总体中分布更为均匀,抽样误差 小于或至多等于简单随机抽样。
(二)系统抽样
<2>系统抽样缺点: ①系统抽样是以总体的随机排列为前提, 如果总体的排列出现有规律分布时,会使 系统抽样产生极大误差。 ②当总体内个体类别之间的数目悬殊过大 时,样本的代表性可能较差。 <3>适用范围:系统抽样最适用于同质性较 高的总体。
人们通常采用下列几组数字
有90%的样本统计值落在u〒1.65SE(样本 平均数的标准差)之间; 有95%的样本统计值落在u〒1.96SE之间; 有98%的样本统计值落在u〒2.33SE之间; 有99%的样本统计值落在u〒2.58SE之间。 其中,百分数表示置信水平,u〒1.65SE等 表示置信区间。
随机数表抽样举例
3、简单随机抽样方法
①当总体元素较少时:常用的办法类似于 抽签,即把总体中每一个单位都编号,将 这些号码写在一张张小纸条上,然后放入 一容器如纸盒、口袋中,搅拌均匀后,从 中任意抽取,直到抽够预定的样本数目。 这样,由抽中的号码所代表的元素组成就 是一个简单随机样本。
抽样及抽样分布
分层抽样 概念:分层抽样又称类型抽样。首先将总体单
位按某一个标志分层;然后在各层按随机抽样的方 法分别抽出各层的样本。
特点:分层抽样在层内是抽样调查,层间是全面调
查,所以分层时应该尽量让每层内的变异程度小,
而层间的变异程度大。分层抽样的抽样误差较简单 随机抽样小,样本具有很好的代表性。
抽样平均误差的计算公式:
z
(
X 1
X
)
2
( 1
2
)
s2 1
s2 2
n1 n2
渐近服从标准正态分布。
如果: X1 和 X2 是两个非正态总体,当和样本容
量足够大,
z
(
X1
X
2
)
(1
2
)
s2 1
s2 2
n1 n2
渐近服从标准正态分布。
NEXT
二、样本成数及成数差的抽样 分布
成数的概念 样本成数的分布 两个总体样本成数差的分布
,则样本的成数为p n1
n
。
例如,某工厂生产某种电子元件,某批产品
共10000件,其中不合格品100件原则抽100件,其中
有3件不合格品,则样本的成数为p 3% 。
NEXT
样本成数的分布
用途:推断或估计总体的成数。例如某项改革 方案工人的支持率,产品的正品率等。
假设A、B、C、D、E5位同学的统计学成绩分别为: 80、 86、90、92、96。可计算得总体均值为88.8,总体方 差为29.76。现在随机从中抽容量为2的样本。
重复抽样的所有可能的样本:
样本(AA)(AB)(AC)(AD)(AE)
均值 80 83 85
86 88
样本 (BA)(BB) (BC) (BD)(BE)
第四章 抽样调查
(五)多阶段随机抽样
• 1.多阶段随机抽样的概念 • 多阶段随机抽样,是把将整个抽样过程分成两个或两个以上的阶段进行随机抽样的方
式。通常在总体层次比较多或层次内个体数目比较多时,采用多阶段随机抽样,以求 更加经济实用。 • 2.多阶段随机抽样的步骤 • 首先,将调查总体各单位按一定标准分为若干子集,作为第一级单位,;然后将第一 级单位再分成若干小子集,作为第二级单位;依此类推,可按研究问题的需要和现象 本身的特点,分成第三级单位、第四级单位等。 • 其次,依照随机原则在第一级单位中抽取第一级样本;然后在第一级被抽中的单位中 抽取第二级样本; • 依此类推,还可以抽取第三级样本、第四级样本。由此形成了两阶段随机抽样、三阶 段随机抽样或四阶段随机抽样等。
• 5、电商户崛起产来了大量网上交易数据,包含支付数据,查询行为,物流运输、购买喜好,点击顺序,评 价行为等,其是信息流和资金流数据。
• 6、传统的互联网入口转向搜索引擎之后,用户的搜索行为和提问行为聚集了海量数据。单位存储价格的下 降也为存储这些数据提供了经济上的可能。
第三节 随机抽样
一、随机抽样的概念及特点 二、随机抽样的方式
4.分层随机抽样的优点及适用范围
首先,当总体内部类型明显时,分层随机抽样按总体中各类 型的分布特征,在不同类型确定样本的分布,使样本结构与总体 结构接近,增强了样本对总体的代表性。
其次,在市场现象存在明显不同层次的条件下,分层随机抽 样比简单随机抽样和等距随机抽样的误差都要小,或者说在同样 的精度要求下,分层随机抽样的样本容量较小,从而减少了搜集 资料的工作量。
五、抽样调查的基本概念
• (一)总体、个体、样本、样本单位和样本框 • (二)总体指标和样本指标 • (三)重复抽样与不重复抽样
第4章 抽样调查技术要点
抽样调查
• 时间短、效率高,投入资源较少
• 调查结果的正确性较高,但是获取 的信息全面性不如普查
细性要求高时可采用这种方法,比如
人口普查,农业普查、企业员工整体 素质普查等。
• 可以通过统计推断技术来估计调查
总体的各项指标,是企业经常使用 的调查研究方法。
抽样调查的定义
抽样调查又称样本调查,是指按照随机原则,
几种概率抽样方法的选择与比较
对抽样误差大小的要求:
抽样误 差大小
• 有关标志值排队的系统抽样方式误差最小; • 分层抽样、按无标志值排队的系统抽样方式其次; • 简单随即抽样和整群抽样方式误差较大。 调查对象本身特点的要求:
调查对 象特点
• 有无总体的全面、详细的资料,如果没有就无法 按有关标志值排队进行系统抽样; • 与对调查对象了解的程度 也有关系。 人、财、物和事件等各种调查条件的要求: • 样本的分散程度大、调查往返的时间长和费用大的情况 下可以考虑整群抽样。
系统抽样的方法,将士兵的编号按班排序(每班10
人),进行抽样,从1号开始抽取,接下来是11号、
21号„„,调查发现士兵对待战争的积极性很高。但
是经过对样本进行研究发现,被抽到的士兵都是每班
的班长,样本的代表性就有问题了!
分层抽样
分层抽样,是指先将调查总体的所有个体按某一重要标志进行
分类(分组),然后在各类(组)中采用简单随即抽样或系统
配额抽样
配额抽样也叫定额抽样,是指将总体中的各单位按 一定的标准划分为若干个类别,将样本数额分配到
个类别中,在规定的数额内由调查人员任意抽选样
本。 配额抽样可分为独立控制配额抽样和相互控制配 额抽样两类。
的样本个体数。 非等比分层抽样主要在于减低各层之间的标准差,使母 非等比分层抽样适用于各层之间相差悬殊或标准差相差较 体平均数的估计更加精确。 大的情况。
抽样调查第4章分层抽样
分层抽样的步骤
分层:将总(体 N)分成互不K个 相子 交总 的体
K
K
(N) (Ni) N N i
i1
i 1
抽样:从每层抽取一个样本构成总的样本
K
y i 1 ,y i2 , ,y iin ,i 1 ,2 , ,K n ni
i 1
采用分层抽样的理由
可同时对子总体进行参数估计 便于组织实施,可根据各层特点采用不同抽样方式
第四章 分层抽样
§4.1 估值法(一) §4.2 估值法(二)—— 组合比估计和回归估计 §4.3 样本量的分配 §4.4 与简单随机抽样之比较 §4.5 如何适当分层 §4.6 后分层估计和定额抽样
抽样调查第4章分层抽样
4.1 估值法(一)
分层抽样的提法 估值法(一)
抽样调查第4章分层抽样
分层抽样的提法 (Stratified sampling)
组合比估计 (Ratio combined)
组合比估计的含义
有辅助变量X用于估值分析的,先分别对各层进 行简单估计,再用比估值法获得目标指标量的估计
K
yst Wi yi i1
K
xst Wi xi i1
yRC
yst xst
X
rC X
组合比估计只体需的 X或 知 X,道 无总 需知道 Xi或Xi
抽样调查第4章分层抽样
组合比估计
估值定理
定理4.2.1 对分层抽样的组合比估计,有
| E(yRCY)| V(xst)
V(yRC)
| X|
其V中 (yR)C , V(xs)t分别是 yR, Cx 估 s的 t 计 均量 .
抽样调查第4章分层抽样
组合比估计
当分层抽样 合 的 ,理 且 x样 st本 0(分 不配 依n赖 )时
社会调查方法 社会调查方法第四章 抽样之案例分析
4、CLHLS,中国老人健康长 寿影响因素研究
全国老年人口健康状况调查研究
选题阶段:研究意义与目标、选择问题 调查设计:研究设计 抽取样本:1998、2000、2002、2005、 2008和2011年调查样本分布
4、CLHLS,中国老人健康长 寿影响因素研究
研究意义与研究目标
我国65岁及以上老人数将从2000年的0.94亿(占总 人口的7%)增加到2050年的3.34亿(占总人口的 22.6%);我国80岁以上高龄老人将从2000年的 1150万人迅猛增加到2020年的2700万人及2050年的 一亿以上!本世纪上半叶五十年我国高龄老人每年 平均增长率为4.4%,等于65岁及以上所有老年人口 年平均增长率的2倍,等于总人口年平均增长率的 6.1倍。调查数据表明,我国65-69,80-84,90-94 与100-105岁老人生活不能自理的比例分别为5%, 20%,40%与 60%。
整群抽样: 从总体中随机抽取一些小的 群体,然后由所抽出的若干小群体内 的所有元素构成调查样本。
多段抽样: 按抽样元素的隶属关系或层 次关系,把抽样过程分为几个阶段进 行。
2、CHIP,中国家庭收入调查
本次调查由来自北京师范大学、澳大利亚 国立大学的学者发起,并得到国家统计局 和德国劳动研究所的支持。
1、CHNS,中国家庭健康调查
1、CHNS,中国家庭健康调查
抽样方法
抽样阶段 抽样方法 分层抽样: 将总体中所有元素按某种特 征划分成若干层次,然后再各 层中抽取子样本的抽样方法 分层抽样
阶段一:按照经济发展水平,抽取东 中西部9个省份
阶段二:在每个省中按照高、中、低 的收入水平抽取不同的城市 阶段三:在所选城市中选取区或者县 阶段四:在所选区或者县中随机选取 城市社区,社区成员作为调查对象 阶段五:在区和县的郊区随机选取郊 区社区,郊区社区的成员作为调查对象 阶段六:在区和县中选取农村,农村 中的农民成为调查对象。
第四章 抽样调查
p
p1 p
n
0.2 0.8 0.02 400
即:根据样本资料推断全部学生中戴眼镜的学 生所占的比重时,推断的平均误差为2%。
例: :
一批食品罐头共60000桶,随机抽查300桶,发 现有6桶不合格,求合格品率的抽样平均误差?
解: 已知 N 60000 n 300 n1 6
解:
x xf 12600 126件 f 100
s x x 2 f 4144 6.47件
f 1
99
x
s 2 1 n n N
6.472 1 100 0.614件
100 1000
x
通过例题可说明以下几点:
①样本平均数的平均数等于总体平均数。 ②抽样平均数的标准差仅为总体标准差的 1
n
③可通过调整样本单位数来控制抽样平均误差。
例:假定抽样单位数增加 2 倍、0.5倍时, 抽样平均误差怎样变化?
解:抽样单位数增加 2 倍,即为原来的 3 倍
则:
x
3n
1 0.577 3
二、抽样调查的特点
1、 是专门组织的一次性的非全面调查 2、 抽选样本单位遵循随机原则 3、 用样本指标数值去推断总体指标数值 (与重点调查的区别) 4、 抽样误差可计算并控制在一定范围内 (与典型调查的区别)
三、抽样调查的几个基本概念 (一) 全及总体和抽样总体
全及总体 指研究对象的全体。其单位数 (总体) 用N 表示。
即:当根据样本学生的平均体重估计全部学生的平均 体重时,抽样平均误差为1公斤。
例: 某厂生产一种新型灯泡共2000只,随机抽出 400只作耐用时间试验,测试结果平均使用寿 命为4800小时,样本标准差为300小时,求抽 样推断的平均误差?
第4章 抽样调查作业答案(1)
第4章抽样调查作业答案一.单项选择题1.抽样调奁的主要目的在于( 3 )。
①计算和控制误差:②了解总体单位情况③用样本来推断总体:④对调查单位作深入的研究2.抽样调查所必须遵循的基本原则是( 4 )。
①随意原则:②可比性原则:③准确性原则:④随机原则。
3.极限误差与抽样平均误差数值之间的关系为( 4 )①前者一定小于后者②前者一定大于后者③前者一定等于后者④前者既可以大于后者,也可以小于后者4.无偏性是指( 1 )。
①抽样指标等于总体指标:②样本平均数的平均数等于总体平均数:③样本平均数等于总体平均数;④样本成数等于总体成数。
5.一致性是指当样本的单位数充分大时,抽样指标( 4 )。
①小于总体指标;②等于总体指标:③大予总体指标:④充分靠近总体指标6.有效性是指作为优良估计量的方差与其他估计量的方差相比有( 1 )。
①前者小于后者;②前者大于后者:③两者相等;④两者不等。
7.能够事先加以计算和控制的误差是( 1 )。
①抽样误差:②登记误差:③代表性误差;④系统性误差。
8.从总体N个不同单位每次抽取n个单位作为样本。
如果采用考虑顺序的重复抽样方法,则样本的可能数目为( 3 )。
③N n9.从总体N个不同单位每次抽取n个单位作为样本,如果采用不考虑顺序的不重复抽样方法,则样本的可能数目为( 4 )。
④()(N+n-1)!/(N-1)!n!1O.对两个工厂工人平均工资进行不重复的随机抽样调查,抽查的工人人数一样,两工厂工人工资方差相同,但第二个厂工人数比第一个厂工人数整整多一倍。
抽样平均误差( 2 )。
①第一个工厂大;②第二个工厂大:③两工厂一样大;④无法做出结论。
(不重复抽样的:抽样平均平均误差=方差*(1-n/N)1/2/n1/2)11.?抽样平均误差是指抽样平均数(或抽样成数)的()。
①平均数:②平均差③标准差④标准差系数12.在同样情况F,不重复抽样的抽样平均误差与重复抽样的抽样平均误差相比,是( 3 )。
第四章分层随机抽样
第四章分层随机抽样第一节分层随机抽样概述分层抽样也叫做类型抽样,它是实际工作中最常用的抽样技术之一。
分层抽样是在抽样之前,先将总体按一定标志划分为若干个层(组),后在各层内分别独立地进行抽样。
由此所抽得的样本称之为分层样本。
各层所抽的样本也是互相独立的。
如果每层中的抽样都是简单随机的,则这种抽样就叫做分层随机抽样。
由此所得到的样本称做分层随机样本。
从以上概念可以看出,分层抽样的实质是在各层间作全面调查,而在各层内作抽样调查。
因此,分层抽样的误差只与各层内的差异有关,而同各层间的差异无关。
所以,为了能有效地降低抽样误差,提高抽样效果,在分层时应遵循“尽可能使层内差异小,而使层间差异大”的原则,同时要使分层的结果既无重复又无遗漏。
进行分层抽样时应注意:①层内抽样设计的选择;②分层变量的选择;③各层样本量的分配;④层数;⑤层的分界。
以前只重视③,近年来,④和⑤引起了越来越多的关注。
同简单随机抽样相比,分层抽样具有以下特点:①分层抽样能够充分地利用关于总体的各种已知信息进行分层,因此抽样的效果一般比简单随机抽样要好。
但当对总体缺乏较多的了解时,则无法分层或不能保证分层的效果。
②在分层抽样中,总体的方差一般可以分解为层间方差和层内方差两部分。
由于分层抽样的误差只与层内差异有关,而与层间差异无关,因此,分层抽样可以提高估计量的精度。
③由于分层抽样是在每层内独立地进行抽样,因此,使得分层样本能够比简单随机样本更加均匀地分布于总体之内,所以其代表性也更好些。
④分层抽样的随机性具体体现在层内各单元的抽取过程之中,也即在各层内部的每一个单元都有相同的机会被抽中,而在层与层之间则是相互独立的。
⑤分层抽样适合于调查标志在各单元的数量分布差异较大的总体。
因为对这样的总体进行合理的分层后可将其差异较多地转化为层间差异,从而使层内差异大大减弱。
⑥分层抽样中除了可以推断总体参数外,还可以推断各不同层的数量特征,并进一步作对比分析,从而满足不同方面的需要,也能帮助人们对总体作更全面、更深入的了解。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、抽样调查的特点 1、费用低 抽样调查的单位只是总体中的一小部分, 可以节省经费、工作量和人力。 2、时效性强 调查样本单位少,操作方便,所需时间少。 3、准确度高 样本按随机原则抽取,排除主观因素干扰。 4、调查内容的深度和广度提高 可在小范围内进行详细调查,获得信息内 容的深度和广度大大提高。
根据总体分布特征和总体范围大小及抽样 实施的难度考虑抽样组织形式。
五、确定样本容量
确定样本的多少要综合考虑多种因素。 六、抽样实施 抽样实施包括建立抽样框、界定抽样单元、 确定调查对象等。
七、收集样本资料
样本确定之后,组织相应的调查人员深入样 本单位进行实际调查,获取第一手详细资料。
[小结]
抽样调查基本概念:总体和样本、总体指标和 抽样指标、抽样框与抽样单位、抽样误差和非 抽样误差。 抽样调查特点:费用低,时效性强,准确度高, 调查内容的深度和广度提高。 抽样的分类:随机抽样(简单随机抽样、系统 抽样、分层随机抽样、分群随机抽样)、非随 机抽样(判断抽样法,方便抽样,配额抽样, 滚雪球抽样) 。 抽样设计步骤:提出抽样调查课题、确定抽样 总体、确定置信度和最大允许误差、确定抽样 组织形式、确定样本容量、抽样实施、收集样 本资料。
[练习]
1、总体、样本、总体计算、抽样计算、抽样
框的含义分别是什么? 2、抽样调查有何特点?主要适用哪些情况? 3、随机抽样有哪些方法? 4、非随机抽样有哪些方法?
第三节 样本量的确定
一、被调查对象标志的变异程度 总体方差越大,要求样本容量越大。 二、极限抽样误差数值的大小 极限抽样误差越小,要求样本容量越大。 三、调查结果的把握程度 把握程度越高,要求样本容量越大。 四、抽样方法 同样条件下,重复抽样可多抽一些。 五、抽样的组织形式 系统抽样和分层抽样比简单随机抽样样本少。
(三)分层随机抽样 又称分类抽样或类型抽样,是先将总体按 一定标志分层(类),然后在各层(类)中随 机抽取样本。
(四)分群随机抽样
是首先 将总体划分成若干群,然后用随机 抽样法从中抽取部分群,并且对新抽中的群内 所有单元进行调查。
二、非随机抽样 (一)主要特点 1、过程的主观性 2、误差的不可测性 3、操作简单易行 (二)主要类型 1、判断抽样法 又称目的抽样,是调查根据经验判断来选 取样本的方法。 2、方便抽样 又称任意抽样或偶遇抽样,是根据调查者 的方便程度任意抽取样本的方法。
3、配额抽样 又称定额抽样,是指按总体单位的某种特征, 将总体分为若干类,按一定比例在各类中分配 样本单位数,然后由调查人员按分配的样本数 量在群体内任意或主观抽取样本。
4、滚雪球抽样 是指调查者先通过少数可以由自己确立样本 单位进行调查,在此基础上,根据他们提供的 信息,进一步对其他相关人员进行调查,直至 满足样本量为止。
第四节 抽样设计的步骤
一、提出抽样调查的课题
根据市场调查内容,明确哪些资料需要通 过抽样调查获取,是否有必要采用抽样调查。
二、抽样总体的确定 抽样最基本的问题就是确定总体,也就是 要测量的个体的总和。
三、确定置信度和最大允许误差 置信度的确定,是指由抽样调查结果推断 出总体情况的可信程度。确定最大允许误差, 是给所要拟定的抽样计划规定一个最大的误差 标准。 四、确定抽样的组织形式
第一节 抽样调查的基本概念与特点
一、抽样调查的基本概念
(一)总体和样本
总体通常指所要调查研究对象的全体。样 本是从总体抽取出来的部分单位的集合体。 (二)总体指标和抽样指标 总体指标是根据总体各单位标志值计算的 综合指标。抽样指标是指样本各单位标志值计 算的指标。
(三)抽样框与抽样单位 抽样框是一个包括市场总体单位的框架, 用来代表总体。抽样单位是指标本抽取过程中 的单位形式。 (四)抽样误差和非抽样误差 抽样误差是指用样本估计总体产生的误差。 非抽样误差是指在抽样调查中由于人为差错所 造成的的误差。
第二节 抽样的分类
一、随机抽样 (一)简单随机抽样
又称单纯随机抽样,是指从总体单位中不加 任何分组,完全按随机原则抽取调查单位,保证 总体中每一个个体都有同等被抽取的概率。 (二)系统抽样
又称等距抽样或机械抽样,是指先将总体各 个单位按一定标志排列起来,然后按照固定和一 定间隔抽取样本单位的随机方法。
市场调查与预测
第四章 抽样调查
[学习目的和要求]
通过本章学习,了解抽样调查的基本概 念与特点,掌握[教学内容]
抽样调查是市场调查中运用最广的一种 调查形式。通过抽样可以获得能够反映总体 信息的样本由此可以根据样本来估计总体的 特征。本章着重介绍抽样调查的基本概念与 特点,抽样的分类,样本容量如何确定,以 及样本设计的基本步骤。