第4章抽样调查
第4章__抽样调查
4.1.3抽样误差的确定
❖1)抽样误差的概念
❖2)影响抽样平均误差的因素
1、全及总体标志变异程度 2、样本容量 3、抽样组织方式 4、抽样方法
❖3)降低调查误差的途径
1、提高样本的代表性
2、注重样本量的控制
3、提高抽样设计的效率 4、重视抽样方案的审评
5、努力降低调查员的误差 6、努力调查被调查者的误差
❖ (4)如果这一地区街对面从第一号开始都没有住户,在第一号对面的街区转 一圈,并遵循右手法则。(即按顺时针方向在街区转一圈。)试着沿路线每 隔两户访问一户。
❖ (5)在起始门牌号对面邻近的街区绕过一圈后,如果你没有完成所需的访问, 就按顺时针方向到下一个街区访问。
❖ (6)如果第三个街区的住户数不够完成你的任务,就再做几个街区直到要求 的户数完成为止;这些区要按顺时针方向绕原有的街区来找。
❖5)简单随机抽样方式的优缺点
随机抽样方式的优点
方法简单直观,当总体名单完整时,可直接从中随机抽取样本。由于 抽取概率相同,计算抽样误差及对总体指标加以推断比较方便。
随机抽样方式的缺点
尽管简单随机抽样在理论上是最符合随机原则的,但是在实际应用中 有一定的局限性。第一,采用简单随机抽样,一般需对总体各单位加以 编码,而实际市场调查活动中所需调查总体往往是十分庞大的,单位非 常多,逐一编码几乎是不可能的;第二,对于某些事物无法使用简单随 机抽样,如对连续不断产生的大量产品进行质量检验,就不能对全部产 品进行编号抽样;第三,当总体的标志变异程度较大时,简单随机抽样 的代表性就不如经过分组后再抽样的代表性高;第四,由于抽出样本单 位较为分散,所以调查人力、物力、费用消耗较大。
2)抽样调查的特征
❖(1)抽取样本的客观性 ❖(2)抽样调查可以比较准确地推断总体
第四章 抽样调查
抽样分布原理
(一)基本符号 1.总体 A = {a1 , a2 ,, aN }, A = N . 1.总体 2.从总体中抽取n个对象构成样本,共有k个样 2.从总体中抽取n个对象构成样本,共有k 本,设样本的符号为:
A1 , A2 ,, Ak , k = C , Ai = n, i = 1, 2,, k
本章复习思考题
1,什么叫抽样?从总体中抽样样本需满足哪些 条件? 2,简单随机抽样?机械抽样?抽样调查法的性 质?随机抽样的原则? 3,抽样误差?影响抽样误差大小的因素?抽样 误差与调查误差,系统误差的区别? 4,抽样分布?平均误差?抽样分布原理? 5,教材第三章课后习题P84的第二题,P85的第 ,教材第三章课后习题P84的第二题,P85的第 四题,P86的第六题. 四题,P86的第六题.
(三)问卷设计的原则 (三)问卷设计的原则 题意清楚,明确,易懂;口语化;避免一题两问;避免 诱导;公正客观;逻辑一致性;完整性(问题和备选 答案);不要用否定形式提问;不要直接询问敏感性 问题. (四)问卷的结构 1,四结构说:标题(简明扼要,概括专项调查的主 题);指导语(包括调查的目的和意义;问题及备选 答案的必要解释,调查须知及其他事项说明等;如涉 及需为被调查者保密的内容,需申明予以保密);主 体内容(内容不宜过多,过繁,应根据需要而确定); 结束语(提出几个开放性的问题或让被试提出对本研 究的建设性的意见;表示对被试合作的感谢). 2,六结构说:在四结构说的基础上,加上被调查者的 基本信息;作业证明的记载.
无限总体时, 有限总体时,
σ σx = n
σ N n σx = × N 1 n
对于有限总体,样本容量与总体容量的 比n/N称为抽样比例. n/N称为抽样比例. 一般认为,n/N<0.05时,就可以省略修 一般认为,n/N<0.05时,就可以省略修 正系数.
第四章 抽样技术
• (五)多阶段抽样
– 含义:multistage sampling-----即先抽大的调 查单元,在大单元中抽小单元,再在小单元 中抽更小的单元。如:我国的城市职工家计 调查,采用三阶段抽样,先城市-基层单位调查户。
第四章 抽样技术
– 应用:在复杂、大规模的市场调查中。
• (六)抽样技术的选用原则
• (四)常用术语
– 1.总体(population)与样本(sample) – 2.总体指标和样本指标
• 总体指标-------反映总体数量特征的指标,有总 体平均数µ,总体比例P, 总体方差 σ 2
第四章 抽样技术
– 样本指标------又称样本估计量或统计量,用 以估计和推断相应总体指标的综合指标,有 样本平均数 x ,样本比例p ,样本方差S2。
第四章 抽样技术
• 成数------分总体成数与样本成数 • 含义------总体中具有某种特征的单位占全部单 位的比例,称总体成数(总体比例) • 如:产品的合格率,市场占有率等。 • 样本成数的抽样分布
– 当从总体中抽出一个容量为n的样本时,样本中具有 某种特征的单位数x服从二项分布,即有x~B(n, π),且 有E(x)=n π V(x)=n π(1- π). – 因而样本比例p=x/n也服从二项分布,且有: – E(p)=E(x/n)= π – V(p)=V(x/n)=1/n π(1- π)
第四章 抽样技术
第四章 抽样技术
第四章 抽样技术
本章要点
• 1.抽样调查的含义、特点与程序; • 2.随机抽样技术的类型及其各自的特点、 方法; • 3.非随机抽样技术的类型及其各自的特 点、方法; • 4.抽样误差的含义及其计算方法 。
第四章 抽样技术
第四节抽样调查
共同定义:总体是构成它的所有元素的集合,而元 素则是构成总体的最基本单位。 样本(Sample)样本就是从总体中按一定方式抽取出 的一部分元素的集合。 抽样(Sampling) 指从组成某个总体的所有元素的集 合中,按一定的方式选择或抽取一部分元素的过程, 或者说抽样是从总体中按一定方式选择或抽取样本 的过程。
第二节 概率抽样的原理与程序
统计值(Statistic)也称为样本值,它是关于样本中某
一变量的综合描述。统计值是从样本中计算出来的, 它是相应的参数值的估计量。 置信度(Confidence level)与置信区间 (Confidence Interval)。置信度也称为置信水平,它是指总体参 数值,落在样本统计值某一区间内的概率,或者说 是总体参数值落在样本统计值某一区间中的把握性 程度。它反映的是抽样的可靠性程度。例子:P64。 置信区间指的是样本统计值与总体参数值之间的误 差范围,置信区间反映的是抽样的精确性程度。
第二节 概率抽样的原理与程序
确定抽样框:确立总体后,收集总体中全部
抽样单位的名单。有两种确立方法:一是全 选法,一个不能漏。如大学生社会实习调查。 选定总体为全日制大学在校本科生与研究生, 就要从各院系花名册中统一编号。 另一种是分层次的样本框:如调查一个城市 小学生的学习状况。全市500小学,选10所, 再从10所中每个学校选3个班;最后每个班选 10名学生。
第一节 抽样的意义与作用
(3)所抽选的调查样本数量,是根据调查误差的要求,
经过科学的计算确定的,在调查样本的数量上有可 靠的保证。 (4)抽样调查的误差,是在调查前就可以根据调查样 本数量和总体中各单位之间的差异程度进行计算, 并控制在允许范围以内,调查结果的准确程度较高。 基于以上特点,抽样调查被公认为是非全面调查方 法中用来推算和代表总体的最完善、最有科学根据 的调查方法。
第四章 抽样
• 3.设计抽样方案 • 4.制定抽样框
– 制定抽样框就是依据已经明确界定的总体范围,收集总体中全部抽样单位 的名单,并统一编号。
• 5.实际抽取样本 • 6.样本评估
– 样本评估就是对样本的质量和代表性进行检验,其目的是防止因样本的偏 差过大而导致的失误。
– 实际抽取样本就是在上述几个步骤的基础上,严格按照所选定的抽样方法, 从抽样框中抽取一个个的抽样单位,构成样本。
运用:
• 从侨光分校的7000位学生中,抽取100位学 生进行调查查,以研究学生对学校教学条 件的满意度。之前所做的普查表现出的对 学校教学条件的平均满意度为85%,现通 过抽查统计后的满意度为80%。 • 请说出本次抽查中的总体、样本、抽样元 素、抽样单位、抽样框、参数值、统计值、 抽样误差。
二、抽样的作用
• 分类抽样有着突出的优点: 第一,分类抽样能够克服简单随机抽样的缺 点,适用于总体内个体数目较多,结构较复杂, 内部差异较大的情况。 第二,精确度较高。 第三,便于对不同层面的问题进行探索。 第四,便于分工,使工作效率提高。 分类抽样的缺点是,如何分类通常由人们主 观判定,因此要求调查者具备较高的素质与能力, 并且必须事先对总体各单位的情况有较多的了解, 而它们在实际工作中有时难以完全实现,这就会 影响分类的科学性和精确性。
三、抽样的类型
• 概率抽样 • 非概率抽样
– 根据抽取对象的具体方式,人们把抽样分为许多不同 的类型。总的来说,各种抽样都可以归为概率抽样与 非概率抽样两大类。这是两种有着本质区别的抽样类 型。概率抽样是依据概率论的基本原理,按照随机原 则进行的抽样,因而它能够避免抽样过程中的人为误 差,保证样本的代表性;而非概率抽样则主要是依据 研究者的主观意愿、判断或是否方便等因素来抽取对 象,它不考虑抽样中的等概率原则,因而往往产生较 大的误差,难以保证样本的代表性。 概率抽样与非概率抽样又各自包括了许多具体类 型。分别适用于不同调查对象。联系实际认识概率抽 样的不同类型及其适用性是掌握抽样方法的关键。
第四章 抽样
(1)概率抽样:简单随机抽样、系统抽样、 分层抽样、整群抽样、多段抽样、PPS抽样、 户内抽样 (2)非概率抽样:偶遇抽样、判断抽样、 定额抽样、雪球抽样
二、概率抽样的原理与程序
(一)概率抽样的基本原理 1、总体的同质性与异质性 同质性:如果某个总体中的每一个成员在所有方 面都相同,那么,我们就说这个总体具有完全的 同质性。 否则,就存在不同程度的异质性。 同质性总体不需要抽样。 社会各种总体的异质性决定了严格的概率抽样的 必要性。
(二)系统抽样
3、系统抽样优缺点: <1>优点: ①易于实施,工作量少。 ②样本在总体中分布更为均匀,抽样误差 小于或至多等于简单随机抽样。
(二)系统抽样
<2>系统抽样缺点: ①系统抽样是以总体的随机排列为前提, 如果总体的排列出现有规律分布时,会使 系统抽样产生极大误差。 ②当总体内个体类别之间的数目悬殊过大 时,样本的代表性可能较差。 <3>适用范围:系统抽样最适用于同质性较 高的总体。
人们通常采用下列几组数字
有90%的样本统计值落在u〒1.65SE(样本 平均数的标准差)之间; 有95%的样本统计值落在u〒1.96SE之间; 有98%的样本统计值落在u〒2.33SE之间; 有99%的样本统计值落在u〒2.58SE之间。 其中,百分数表示置信水平,u〒1.65SE等 表示置信区间。
随机数表抽样举例
3、简单随机抽样方法
①当总体元素较少时:常用的办法类似于 抽签,即把总体中每一个单位都编号,将 这些号码写在一张张小纸条上,然后放入 一容器如纸盒、口袋中,搅拌均匀后,从 中任意抽取,直到抽够预定的样本数目。 这样,由抽中的号码所代表的元素组成就 是一个简单随机样本。
第4章 抽样调查作业答案(1)
第4章抽样调查作业答案一.单项选择题1.抽样调奁的主要目的在于( 3 )。
①计算和控制误差:②了解总体单位情况③用样本来推断总体:④对调查单位作深入的研究2.抽样调查所必须遵循的基本原则是( 4 )。
①随意原则:②可比性原则:③准确性原则:④随机原则。
3.极限误差与抽样平均误差数值之间的关系为( 4 )①前者一定小于后者②前者一定大于后者③前者一定等于后者④前者既可以大于后者,也可以小于后者4.无偏性是指( 1 )。
①抽样指标等于总体指标:②样本平均数的平均数等于总体平均数:③样本平均数等于总体平均数;④样本成数等于总体成数。
5.一致性是指当样本的单位数充分大时,抽样指标( 4 )。
①小于总体指标;②等于总体指标:③大予总体指标:④充分靠近总体指标6.有效性是指作为优良估计量的方差与其他估计量的方差相比有( 1 )。
①前者小于后者;②前者大于后者:③两者相等;④两者不等。
7.能够事先加以计算和控制的误差是( 1 )。
①抽样误差:②登记误差:③代表性误差;④系统性误差。
8.从总体N个不同单位每次抽取n个单位作为样本。
如果采用考虑顺序的重复抽样方法,则样本的可能数目为( 3 )。
③N n9.从总体N个不同单位每次抽取n个单位作为样本,如果采用不考虑顺序的不重复抽样方法,则样本的可能数目为( 4 )。
④()(N+n-1)!/(N-1)!n!1O.对两个工厂工人平均工资进行不重复的随机抽样调查,抽查的工人人数一样,两工厂工人工资方差相同,但第二个厂工人数比第一个厂工人数整整多一倍。
抽样平均误差( 2 )。
①第一个工厂大;②第二个工厂大:③两工厂一样大;④无法做出结论。
(不重复抽样的:抽样平均平均误差=方差*(1-n/N)1/2/n1/2)11.?抽样平均误差是指抽样平均数(或抽样成数)的()。
①平均数:②平均差③标准差④标准差系数12.在同样情况F,不重复抽样的抽样平均误差与重复抽样的抽样平均误差相比,是( 3 )。
第四章(整群抽样)
编辑版pppt
11
一、群规模相等简介
总体中的N个初级单元即群的大小(群内次级单元数) 都相等的情形。也就是,若总体有N个群时,每个群中 所包含的单元数为M相等时,则称群规模相等,在实际 问题中,只要群的规模接近时,也称为群规模相等。这 时,对群的抽取一般采用简单随机抽样(无放回)。
Vran ( y )
1 f S2 nM
编辑版pppt
21
因此,群大小相等的整群抽样的设计效应为:
deff V( y) Vran ( y )
1(M1)c
上面结果意味着:按同样的样本量(以次级单元计)
整群抽样的方差约为简单随机抽样的方差的 1(M1)c
倍。换句话说,为了获得同样的精度,整群抽样的样本
解:由前已算出样本群间方差
而群内方差为
sw2
1 n(M 1)
n i1
M
(yij yi )2
j1
sb2 1418.168
1 n
n i1
1M M 1 j1 (yij
yi )2
1 n
n i1
si2(见表最后一) 列
1 (27.192 17.982 43.522) 1431.68 12
编辑版pppt
n i1
M
( y ij y ) 2
j1
s
2 b
M n 1
n
(yi
i1
y )2
s
2 w
1 n(M 1)
n i1
M
( y ij y i ) 2
j1
14
三、总体均值的估计及性质
总体平均值 Y 的估计为:
第四章 抽样调查
(五)多阶段随机抽样
• 1.多阶段随机抽样的概念 • 多阶段随机抽样,是把将整个抽样过程分成两个或两个以上的阶段进行随机抽样的方
式。通常在总体层次比较多或层次内个体数目比较多时,采用多阶段随机抽样,以求 更加经济实用。 • 2.多阶段随机抽样的步骤 • 首先,将调查总体各单位按一定标准分为若干子集,作为第一级单位,;然后将第一 级单位再分成若干小子集,作为第二级单位;依此类推,可按研究问题的需要和现象 本身的特点,分成第三级单位、第四级单位等。 • 其次,依照随机原则在第一级单位中抽取第一级样本;然后在第一级被抽中的单位中 抽取第二级样本; • 依此类推,还可以抽取第三级样本、第四级样本。由此形成了两阶段随机抽样、三阶 段随机抽样或四阶段随机抽样等。
• 5、电商户崛起产来了大量网上交易数据,包含支付数据,查询行为,物流运输、购买喜好,点击顺序,评 价行为等,其是信息流和资金流数据。
• 6、传统的互联网入口转向搜索引擎之后,用户的搜索行为和提问行为聚集了海量数据。单位存储价格的下 降也为存储这些数据提供了经济上的可能。
第三节 随机抽样
一、随机抽样的概念及特点 二、随机抽样的方式
4.分层随机抽样的优点及适用范围
首先,当总体内部类型明显时,分层随机抽样按总体中各类 型的分布特征,在不同类型确定样本的分布,使样本结构与总体 结构接近,增强了样本对总体的代表性。
其次,在市场现象存在明显不同层次的条件下,分层随机抽 样比简单随机抽样和等距随机抽样的误差都要小,或者说在同样 的精度要求下,分层随机抽样的样本容量较小,从而减少了搜集 资料的工作量。
五、抽样调查的基本概念
• (一)总体、个体、样本、样本单位和样本框 • (二)总体指标和样本指标 • (三)重复抽样与不重复抽样
第四章 抽样技术基础知识
抽样技术的完整概念包括对样本的调查和对总体参 数的估计两个方面。首先介绍抽样调查,然后介绍总体 参数估计方法。
第一节
抽样调查
一、抽样调查的概念 抽样调查是统计学的重要分支,它已经成为当今世 界上最重要的统计方法。它广泛应用于社会、经济、科 技和自然等各个领域,成为现代统计学中发展最快、最 活跃的一个分支。 (一)抽样调查 它是一种非全面调查,是根据随机原则从总体中抽 取部分单位进行调查。这部分单位称为样本。而这部分 单位数目的多少不是随心所欲确定的,是根据一定原则 和要求用科学的方法计算来确定。所谓随机原则,就是 可能性原则,是指在抽取样本单位时,完全排除人们的 主观愿望,使总体中的每个单位机会确定,抽中与否全 凭偶然。
(四)参数和统计量 1.参数 2 即总体平均数,用 表示,总体标准差用σ 表示,总体成数 X (比重)用P 表示,这些数据在抽样技术称为参数。由于总体是 唯一确定的,总体参数也是唯一确定的。 2.统计量 样本平均数用 x表示,样本标准差用s 表示,样本成数用p 表示,这些数据在抽样技术称为统计量。 成数指总体或样本中具有某种属性的单位数占全部单位数的 比重。如,一片森林中病株数的比重、一批产品中合格品比重、 一片农作物中缺苗断垄数比重、某市居民拥有计算机户比重、某 电视节目收视率等等。 本节小结: (一)样本是从总体中随机抽取的一部分单位。 (二)参数是总体数量特征,是用样本统计量估计出来的。 (三)统计量是由样本变量直接计算得到的。
2.区域抽样框,按自然地域划分并排列出总体所有单位。例 如,一片土地划分为若干地块并编号、一片森林划分为若干林区 并编号等。 3.时间表抽样框,按时间顺序排列总体单位。例如,流水线 生产的产品质量检验,把一天划分为若干时段并按顺序排列。 抽样框的编制是抽样调查的前提条件,要求不重不漏来保证 样本对总体的代表性。 (二)总体和样本 总体指所要研究现象的整体,用字母N 表示。如,从1万平 方米小麦中抽取500平方米进行产量调查,则N =10000平方米。 样本,指从总体中抽取的样本单位数,用字母n 表示。如, 上例中n =500平方米 (三)大样本和小样本 大样本和小样本是根据样本容量多少来划分的。n≥30时为 大样本,n <30时为小样本。
第4章 抽样调查技术要点
抽样调查
• 时间短、效率高,投入资源较少
• 调查结果的正确性较高,但是获取 的信息全面性不如普查
细性要求高时可采用这种方法,比如
人口普查,农业普查、企业员工整体 素质普查等。
• 可以通过统计推断技术来估计调查
总体的各项指标,是企业经常使用 的调查研究方法。
抽样调查的定义
抽样调查又称样本调查,是指按照随机原则,
几种概率抽样方法的选择与比较
对抽样误差大小的要求:
抽样误 差大小
• 有关标志值排队的系统抽样方式误差最小; • 分层抽样、按无标志值排队的系统抽样方式其次; • 简单随即抽样和整群抽样方式误差较大。 调查对象本身特点的要求:
调查对 象特点
• 有无总体的全面、详细的资料,如果没有就无法 按有关标志值排队进行系统抽样; • 与对调查对象了解的程度 也有关系。 人、财、物和事件等各种调查条件的要求: • 样本的分散程度大、调查往返的时间长和费用大的情况 下可以考虑整群抽样。
系统抽样的方法,将士兵的编号按班排序(每班10
人),进行抽样,从1号开始抽取,接下来是11号、
21号„„,调查发现士兵对待战争的积极性很高。但
是经过对样本进行研究发现,被抽到的士兵都是每班
的班长,样本的代表性就有问题了!
分层抽样
分层抽样,是指先将调查总体的所有个体按某一重要标志进行
分类(分组),然后在各类(组)中采用简单随即抽样或系统
配额抽样
配额抽样也叫定额抽样,是指将总体中的各单位按 一定的标准划分为若干个类别,将样本数额分配到
个类别中,在规定的数额内由调查人员任意抽选样
本。 配额抽样可分为独立控制配额抽样和相互控制配 额抽样两类。
的样本个体数。 非等比分层抽样主要在于减低各层之间的标准差,使母 非等比分层抽样适用于各层之间相差悬殊或标准差相差较 体平均数的估计更加精确。 大的情况。
四章节抽样调查
如果原有的排列次序可能导致抽样失败的话,就应打 乱原有的排列次序或改用其他抽样方法。
3、分层抽样
定义:先将总体依照一种或几种特征分为几个子总 体(类、群),每个子总体称为一层,然后从每一 层中随机抽取一个子样本,将它们合在一起即为总 体的样本,称为分层样本。
对于总体元素较多的情形,采用随机数表抽样 随机数表的特点:随机数表中的数码和排列都是
随机形成的,没有任何规律性(也称乱数表)。 随机数表如下图所示(截取部分)
步骤:
① 先取得一份调查总体所有元素的名单(即抽样 框);
② 将总体中所有元素一一按顺序编号; ③ 根据总体规模是几位数来确定从随机数表中选几
优点 A、与简单随机抽样相比,系统抽样易于实施,工作
较少 B、样本在总体中分布更平均,抽样误差小于或至多
等于简单随机抽样,结果更精确。 缺点
A、较适用于同质性较高的群体:若总体内不同类别 之间所含个体数目相差过于悬殊时,采用此种方法样 本的代表性可能较差。
缺点 B、当总体的排列出现有规律的分布时,就会使系统
与分层抽样的异同点
都是根据某种标准将总体分为若干个子群体。
子群体的划分原则不同。 –分层抽样:层间异质性强,层内同质性强。 –整群抽样:反之。
抽样方式不同。
–分层抽样:所有子群体均要抽取一个样本,作为 总体的一部分,即总体样本在各层中均有分布。
–整群抽样:将所有子群体作为样本总体,抽取若 干个子群体。
缺点 A、由于每阶段抽样都会产生误差,所以经多阶段
抽样调查第4章分层抽样
分层抽样的步骤
分层:将总(体 N)分成互不K个 相子 交总 的体
K
K
(N) (Ni) N N i
i1
i 1
抽样:从每层抽取一个样本构成总的样本
K
y i 1 ,y i2 , ,y iin ,i 1 ,2 , ,K n ni
i 1
采用分层抽样的理由
可同时对子总体进行参数估计 便于组织实施,可根据各层特点采用不同抽样方式
第四章 分层抽样
§4.1 估值法(一) §4.2 估值法(二)—— 组合比估计和回归估计 §4.3 样本量的分配 §4.4 与简单随机抽样之比较 §4.5 如何适当分层 §4.6 后分层估计和定额抽样
抽样调查第4章分层抽样
4.1 估值法(一)
分层抽样的提法 估值法(一)
抽样调查第4章分层抽样
分层抽样的提法 (Stratified sampling)
组合比估计 (Ratio combined)
组合比估计的含义
有辅助变量X用于估值分析的,先分别对各层进 行简单估计,再用比估值法获得目标指标量的估计
K
yst Wi yi i1
K
xst Wi xi i1
yRC
yst xst
X
rC X
组合比估计只体需的 X或 知 X,道 无总 需知道 Xi或Xi
抽样调查第4章分层抽样
组合比估计
估值定理
定理4.2.1 对分层抽样的组合比估计,有
| E(yRCY)| V(xst)
V(yRC)
| X|
其V中 (yR)C , V(xs)t分别是 yR, Cx 估 s的 t 计 均量 .
抽样调查第4章分层抽样
组合比估计
当分层抽样 合 的 ,理 且 x样 st本 0(分 不配 依n赖 )时
社会调查研究方法——第4章抽样PPT课件
2021/3/25
授课:XXX
10
3、抽样的作用
▪ (1)现实生活中有些研究总体是不可能进行 全面调查的,只可能调查其中的一部分。
▪ (2)节约人力、物力。 ▪ (3)对其他调查方法所得到的资料的可信性
的检验,尤其是对普查资料的修正与补充, 必须进行抽样调查。
2021/3/25
授课:XXX
11
4、抽样的优越性
4
2、抽样的概念
▪ (1)总体(population) ▪ (2)样本(sample) ▪ (3)抽样(sampling) ▪ (4)抽样单位(sampling unit) ▪ (5)抽样框(sampling frame) ▪ (6)参数值(parameter) ▪ (7)统计值(statistic) ▪ (8)抽样误差 ▪ (9)置信水平与置信区间
第四章 抽样
▪ 第一节 抽样的意义与作用 ▪ 第二节 非概率抽样方法 ▪ 第三节 概率抽样的原理与程 ▪ 第四节 概率抽样方法 ▪ 第五节 户内抽样与PPS抽样 ▪ 第六节 样本规模与抽样误差
2021/3/25
授课:XXX
1
教学要求:
▪ 了解抽样的概念、意义 ▪ 掌握概率抽样和非概率抽样的的几种方法 ▪ 教学重点:概率抽样 ▪ 教学难点:概率抽样中的分层抽样
▪ (1)调查费用较低。 ▪ (2)速度快 ▪ (3)应用范围广。 ▪ (4)可获得内容丰富的资料。 ▪ (5)准确度高。
2021/3/25
授课:XXX
12
▪5、抽样的类型
抽样技术
非概率抽样
概率抽样
方便抽样 判断抽样 配额抽样 滚雪球抽样
简单随机抽样 系统抽样 分层抽样 整群抽样 多级抽样 其他抽样技术
第四章 抽样调查
p
p1 p
n
0.2 0.8 0.02 400
即:根据样本资料推断全部学生中戴眼镜的学 生所占的比重时,推断的平均误差为2%。
例: :
一批食品罐头共60000桶,随机抽查300桶,发 现有6桶不合格,求合格品率的抽样平均误差?
解: 已知 N 60000 n 300 n1 6
解:
x xf 12600 126件 f 100
s x x 2 f 4144 6.47件
f 1
99
x
s 2 1 n n N
6.472 1 100 0.614件
100 1000
x
通过例题可说明以下几点:
①样本平均数的平均数等于总体平均数。 ②抽样平均数的标准差仅为总体标准差的 1
n
③可通过调整样本单位数来控制抽样平均误差。
例:假定抽样单位数增加 2 倍、0.5倍时, 抽样平均误差怎样变化?
解:抽样单位数增加 2 倍,即为原来的 3 倍
则:
x
3n
1 0.577 3
二、抽样调查的特点
1、 是专门组织的一次性的非全面调查 2、 抽选样本单位遵循随机原则 3、 用样本指标数值去推断总体指标数值 (与重点调查的区别) 4、 抽样误差可计算并控制在一定范围内 (与典型调查的区别)
三、抽样调查的几个基本概念 (一) 全及总体和抽样总体
全及总体 指研究对象的全体。其单位数 (总体) 用N 表示。
即:当根据样本学生的平均体重估计全部学生的平均 体重时,抽样平均误差为1公斤。
例: 某厂生产一种新型灯泡共2000只,随机抽出 400只作耐用时间试验,测试结果平均使用寿 命为4800小时,样本标准差为300小时,求抽 样推断的平均误差?
第4章-抽样设计
9
第一节 抽样设计的基本概念
市场调研
二、抽样调查的相关概念
1、全及总体——人们想要认识的对象的全体,它是构成 它的所有个体的集合,也称为总体。(常用 N 表示)
2、抽样总体——由总体中抽取的部分个体构成,具有对
总体的代表性,也称为样本。(常用 n 表示) 3、抽样单元——组成样本的互不重叠的基本单位,也称
49
40
9
2
调查研究总体:美国全体选民
调查访问样本:2000名选民
13
第一节 抽样设计的基本概念
市场调研
抽样调查的特点
(1)调查方式的科学性
(2)调查费用的经济性
(3)获取资料的及时性
(4)调查结果的准确性和全面性
(5)应用范围的广泛性
任何样本都无法完全代表总体,永远存在抽样误差。
14
第二节 抽样调查方法
23
第二节 抽样调查方法
市场调研
N=90,n=10, 则:K=90/10 =9;设k=6
1 11 21 31 41 51 61 71
2 12 22 32 42 52 62 72
3 13 23 33 43 53 63 73
4 14 24 34 44 54 64 74
5 15 25 35 45 55 65 75
7
第一节 抽样设计的基本概念
市场调研
3、重点调查
在调查总体中,针对一部分处于十分重要地位 的单位进行的非全面市场调查,以尽快估计调查总 体的基本情况。 重点调查的特点
(1)便于尽快了解调查对象的基本情况;
(2)在人、财、物和时间上比较节省;
8
第一节 抽样设计的基本概念
市场调研
4、抽样调查
第四章 抽样技术
STAT
§4.1 抽样调查的一般理论 §4.2 随机抽样技术 §4.3 非随机抽样技术
§4.1 抽样调查的一般理论
一、基本概念 二、基本准则 三、基本方法 四、抽样误差的确定 五、样本容量的确定
STAT
一、基本概念
STAT
1.全及总体 1.全及总体 简称总体或母体, 简称总体或母体,是指所要调查认识的研究对 象的全体,它由具有某种共同性质或特征的单 象的全体, 位组成。用字母N表示。 位组成。用字母N表示。 2.样本总体 2.样本总体 简称样本, 简称样本,指在全及总体中抽取部分单位所构 成的小总体。用字母n表示。 成的小总体。用字母n表示。
STAT
完全代表总体而导致的误差。 完全代表总体而导致的误差。
原 因
记 差 登 误 误差 统 误 系 性 差 表 误 代 性 差 机 差 随 误
三种误差的区别: 三种误差的区别:
STAT
• 登记误差:由于人的主观失误在观察、登 登记误差:由于人的主观失误在观察、 主观失误在观察
抽样调查的一般步骤
STAT
设 计 抽 样 方 案
抽 取 样 本 单 位
收 集 样 本 数 据
计 算 样 本 统 计 量
推 断 总 体 参 数
二、基本准则
STAT
1.随机原则 1.随机原则 ——抽取样本单位时,应确保每个总体单位都 抽取样本单位时, 抽取样本单位时 有被抽取的可能. 有被抽取的可能 2.抽样误差最小 2.抽样误差最小 ——在其他条件相同的情况下,选抽样误差 在其他条件相同的情况下, 在其他条件相同的情况下 设计抽样方案时, 设计抽样方案时,通常是 最小的方案. 最小的方案 在误差达到一定要求的条 3.费用最少 3.费用最少 件下,选择费用最少的方案 件下, —在其他条件相同的情况下,选费用最少的 在其他条件相同的情况下, 在其他条件相同的情况下 方案. 方案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 抽样框的形式一般有两种: • 一是一览表,表中列出所有总体单位。
• 二是地图,在地图上将调查单位分布在 各个地区,然后根据地图进行抽样。
2014-7-30
25
• 四、抽样推断的理论基础(P96)
• 抽样推断的理论基础是概率论的大数定 律和中心极限定理
2014-7-30
2014-7-30
31
真题分析 • 判断题:所有样本平均数的平均数总是 大于总体平均数。 • ( х )
2014-7-30
32
第二节 抽样误差
抽 样 推 断 中 的 误 差 登记性误差
不可消除,但可以进 行计算加以控制
偶然性代表性误差
抽样误差
代表性误差 系统性代表性误差
偏差
2014-7-30
通过合理的组织和调 整抽样方式可消除
• 大数定律的直观意义是:在对大量现象 进行观察时,个别的、偶然的差异性将 相互抵消。从而显示出现象总体的、必 然的规律性。
• 从抽样推断的角度看,随着样本容量的 逐渐增大,抽样平均数将逐渐逼近总体 平均数。
2014-7-30 28
• 2、中心极限定理
• 是指样本平均数分布的性质和总体分布的性质之间 关系的系列定理。 • 它认证了: • 第一、如果总体很大,而且服从正态分布,样本平 均数(成数)的分布也同样服从正态分布。 • 第二、如果总体很大,但不服从正态分布,只要样 本容量足够大,样本平均数(成数)的分布趋近于 正态分布。 • 三、样本平均数(成数)的平均数,等于总体平均 数(成数) • 因此,在抽样推断中,不论总体服从什么分布,只 要样本很大时,抽样分布都服从正态分布,进而可 以推算总体平均数或成数落在某一范围内的概率。
•应用
抽样调查的意义;抽样平均误差的计算;总体参 数估计的方法
2014-7-30
4
第四章 抽样调查
第一节 抽样调查的基本问题 • 一、抽样调查的意义★ • 二、抽样调查的特点▲ • 三、抽样调查的应用▲
• 四、抽样调查的几个基本概念▲
• 五、抽样推断的理论基础▲
2014-7-30 5
• 一、抽样推断的概念(P89) • 抽样推断是在抽样调查的基础上,用部 分单位形成的样本数量特征来推断总体 数量特征的一种统计归纳方法
2014-7-30
22
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示. 考虑顺序的不重复抽样 考虑顺序的重复抽样 不考虑顺序的不重复抽样 不考虑顺序的重复抽样
2014-7-30
M
N! ( N n)!
M Nn
M N! n!( N n)!
2014-7-30 10
真题分析 • 在抽取每个样本单位时,必须遵循( ) • A、可比性原则 B、准确性原则 C、随机性原则 D、同质性原则 • CBiblioteka 2014-7-3011
真题分析
• 进行抽样调查时必须遵循随机的规则, 其目的是( ) • A、每一个单位都有相同的被抽中的机 会 B、人为地控制如何抽取样本单位 总不可靠 • C、了解样本单位的情况 • D、选出典型的单位 • A
2014-7-30 21
• 2)不重复抽样(不回置抽样)——从总体N个单位 中抽取一个容量为n的样本,每次从总体中抽取一个 单位,连续进行n次抽样构成一个样本,
• 但每次抽出一个单位就不再放回参加下一次抽选。 共可抽取
N! n!( N n)!
• 个样本。每个单位中选的机会在各次是不相同的。 • 不重复抽样误差<重复抽样误差
2014-7-30
8
真题分析 • • • •
简答题:抽样调查有哪些主要特点? 答:抽样调查主要特点: 第一,按随机原则抽选调查单位; 第二,用样本推断总体;
• 第三,在调查之前可以计算和控制抽样 误差。
2014-7-30
9
真题分析 • 抽样调查的主要特点有( ) • A、用样本推断总体 B、按随机原则抽选调查单位 • C、调查前可以计算和控制抽样误差 D、调查的目的在于了解总体基本情况 • E、抽样调查误差可以克服 • ABC
26
• 1、大数定律
• 大数定律是阐明大量随机现象平均结果的稳定 性的一系列定理的总称。
• 其一般意义是:在随机试验过程中,每次试验 的结果不同,但大量重复试验后,所出现结果 的平均值总是接近某一确定 的值 。 • 或者说,当样本单位数逐渐增大时,样本均值 与总体均值的离差趋于0.
2014-7-30 27
第四章
抽样调查
2014-7-30
1
统计学
STATISTICS
统计名言
不象其他科学,统计从来不打算使 自己完美无缺,统计意味着你永远 不需要确定无疑。
—— Gudmund R.Iversen
5-2
第四章 抽样调查
主要内容
2014-7-30
3
学习目标
•理解
抽样调查的特点、应用、基本概念、理论基础; 抽样误差的概念;抽样极限误差;抽样估计的可靠 程度;点估计的优良标准;必要样本容量的确定; 抽样的组织形式
n
f
• 样本方差 • 样本成数
sx
2
( x x) 2
n 1
或
( x x) f f 1
2
• 样本指标的计算方法是确定的,但它的取值随着 不同的样本,有不同样本变量,而发生变化。
2014-7-30 19
n x p 1 p, n
s2 p p(1 p)
真题分析 • 描述总体或样本的参数或统计量主要包 括的数量特征值有【 】 • A.平均数 B.成数 C.样本容量 D.标准差 E.样本可能数目 • ABD
2014-7-30 14
• 3、参数与统计量 • 参数:描述总体特征的指标称为参数。
• 统计量:描述样本特征的指标称为统计 量。
2014-7-30
15
• (一)参数(全及指标、总体指标) • ——根据总体各单位的标志值或标志属性 计算的,反映总体数量特征的综合指标。 (大写表示) • 1、数量标志的总体指标 • 设总体变量X为:X1,X2,…,Xn, XF X X • 总体平均数 或 X F
N 0 N N1 N1 P ,Q 1 P N N N
2014-7-30 17
• 品质标志的表现只在是非两种,我们可以把“是” 的标志表现表示为1,而“非”的标志表现表示为 0,那么成数分布就是一个(0,1)分布。 • 则品质标志的平均数与标准差可得出
P X
p
N0 N1 N N1 ,Q 1 P N N N XF 0 N 0 1 N1 N1 P N 0 N1 N F
2014-7-30 34
真题分析 • 在抽样调查中,由于偶然的因素的影响, 使样本指标与总体指标之间出现绝对离 差,它是( ) • A、抽样误差 B、抽样平均误差 C、标准差 D、平均差 • A
2014-7-30
35
• 系统性偏差:由于没有遵循随机原则, 而是选择了有偏向性的样本,所形成的 样本的统计量偏离总体参数。
2014-7-30
20
• (三)抽样方法及样本可能数目 • 1)重复抽样(回置抽样)——从总体N个单 位中随机抽取一个容量为n的样本,每次从总 体中抽取一个单位,把结果登记下来,又重 新放回,参加下一次抽选。共可抽取Nn个样 本。 • 样本由n次相互独立的抽选构成的,每次抽选 是在完全相同的条件下进行,每个单位中选 的机会在各次都完全相等。
2014-7-30
6
全及总体指标:参数 (未知量) 统计推断 样本总体指标:统计量 (已知量)
2014-7-30
7
• 二、抽样推断的特点(P91)
• (一)建立在随机取样的基础上。 • (二)由样本推断总体。 • 部分不是全部但能代表全部 • (三)误差可以事先计算并加以控制。
每个单位都有 相同的被抽中 的机会,哪个单 位被抽中,由随 机因素确定,完 全排除抽样者 的个人主观意 志
2014-7-30
38
真题分析 • 判断并改正: • 在抽样调查之前无法获知抽样误差。 • 【 √ 】
2014-7-30
39
真题分析 • 在调查之前可以事先加以计算和控制的 误差是( ) • A、登记误差 B、抽样误差 C、系统误差 D、调查误差 • B
2014-7-30
40
• 二、抽样平均误差(P102)
33
一、抽样误差的概念(P99)
• 抽样误差是指由于随机抽样的偶然因素使样 本各单位的结构不足以代表总体各单位的结 构,而引起样本指标和总体指标之间的绝对 离差。 • 例:全班同学的平均每月零花钱为500元, 而老师随机抽取了10名同学,这些同学的每 月零花钱平均为300元,这样的抽样的实际 误差就是:|300-500|=200元。 • 样本的形成是随机的,离差本身也是随机的
2014-7-30 12
• 三、抽样推断的应用领域(P92) • 1、总体范围较广,不需要了解每一个别单位 的情况。 • 2、对于具有破坏性的产品质量检测或进行抽 样推断。 • 3、对全面调查的结果进行检验和修正。
2014-7-30
13
• 四、基本概念(P92)
• 1、总体:从统计调查的范围来看,全及总体 即被研究现象或事物的总体,一般称总体。 • 总体可分为有限总体和无限总体 • 总体单位数习惯用“N”来表示。 • 2、样本:即从全及总体中随机抽取出来的那 些单位所组成的整体。是总体的一个缩影, 也叫子样。 • 样本单位数习惯用“n”来表示,也叫样本容 量。
N
• 总体方差
2014-7-30
2