第4章抽样调查技术
第4章__抽样调查
4.1.3抽样误差的确定
❖1)抽样误差的概念
❖2)影响抽样平均误差的因素
1、全及总体标志变异程度 2、样本容量 3、抽样组织方式 4、抽样方法
❖3)降低调查误差的途径
1、提高样本的代表性
2、注重样本量的控制
3、提高抽样设计的效率 4、重视抽样方案的审评
5、努力降低调查员的误差 6、努力调查被调查者的误差
❖ (4)如果这一地区街对面从第一号开始都没有住户,在第一号对面的街区转 一圈,并遵循右手法则。(即按顺时针方向在街区转一圈。)试着沿路线每 隔两户访问一户。
❖ (5)在起始门牌号对面邻近的街区绕过一圈后,如果你没有完成所需的访问, 就按顺时针方向到下一个街区访问。
❖ (6)如果第三个街区的住户数不够完成你的任务,就再做几个街区直到要求 的户数完成为止;这些区要按顺时针方向绕原有的街区来找。
❖5)简单随机抽样方式的优缺点
随机抽样方式的优点
方法简单直观,当总体名单完整时,可直接从中随机抽取样本。由于 抽取概率相同,计算抽样误差及对总体指标加以推断比较方便。
随机抽样方式的缺点
尽管简单随机抽样在理论上是最符合随机原则的,但是在实际应用中 有一定的局限性。第一,采用简单随机抽样,一般需对总体各单位加以 编码,而实际市场调查活动中所需调查总体往往是十分庞大的,单位非 常多,逐一编码几乎是不可能的;第二,对于某些事物无法使用简单随 机抽样,如对连续不断产生的大量产品进行质量检验,就不能对全部产 品进行编号抽样;第三,当总体的标志变异程度较大时,简单随机抽样 的代表性就不如经过分组后再抽样的代表性高;第四,由于抽出样本单 位较为分散,所以调查人力、物力、费用消耗较大。
2)抽样调查的特征
❖(1)抽取样本的客观性 ❖(2)抽样调查可以比较准确地推断总体
第四章:抽样调查技术
分层 或
分类
在每一层 或类中 分配样本数
在每一层 或类中 进行简单 随机抽样
22
• 两种两种样本数分配方法:
1、等比例分层随机抽样
• 例:某居住小区有100户人家,其中高收入 户20户、中等收入户50家、低收入户30家。 计划抽10户,
• 由高的应抽2户、中的应抽5户、低的应抽3 户。
• 思考:上述案例中采用此种方法合理吗? 为什么?
第二章:抽样调查技术P90
• 主要学习内容 • 补充:全面市场调查
补充:典型和重点市场调查方式 • 随机抽样市场调查方式 • 非随机抽样技术 • 抽样误差
1
第一节 全面市场调查
一、概念、特征、适用情况
• 1、概念: • 为了搜集比较全面、精确的调查资料,对调查
对象(总体)的全部样本所进行的逐一的、无 遗漏的专门调查。
择。
4
三、全面调查的具体做法
• 1、向每一个调查样本发放调查表,由对方 按规定填报。
• 小提示:适合于谁对谁的调查呢?
• 2、调查人员按照调查项目的要求,对调查 对象进行访问或观察。
• 小提示:适用于谁对谁的调查呢?
5
• 3、借用机关、团体、企业等单位的统计资料, 再进行汇总
• 4、搭便车。利用国家或地方、部门所组织的普 查机会,搜集自己的资料。
6
第二节 典型和重点市场调查方式
一、典型调查方式
• 1、含义 • 对调查对象作全面分析、比较的基础上,有意识
地选择少数具有代表性的样本作为典型,对其进 行比较系统、深入的专门调查。“解剖麻雀”
7
•2、特点 •优点: •1)可节省工作量和费用 •2)可和研究结合起来,揭示事物的内在规律。
第四章 抽样技术练习题
第四章抽样技术一、名词解释1、抽样调查2、总体和样本3、样本容量4、重复抽样5、不重复抽样6、抽样极限误差7、点估计8、区间估计二、填空1、抽样调查是从研究的中抽取部分单位作为进行观察研究,并根据这部分单位的调查结果来推断,以达到认识总体的一种统计调查方法。
2、抽样调查分为和两类。
抽样调查遵循。
3、是用主观的(非随机的)方法从总体中抽选单位进行调查,它是一种快速、简便且省钱的抽选样本的方法。
但非概率抽样具有很大的风险,因为主观选定的样本很难保证其对总体的代表性。
所以一般情况下不用来对总体进行推断。
主要包括随意抽样,,。
4、概率抽样有两条基本准则:第一,单位是随机抽取的;第二,调查总体中的每个单位都有一个非零的入样概率。
概率抽样方法主要有、、分层随机抽样、、、。
常用的为前四种。
5、是指包括调查对象所有单位的全体,它是由具有某种共同性质的许多单位组成的。
从中按随机原则抽取出来的部分单位所组成的集合体就称为样本。
6、从总体中抽取样本单位有与两种方法。
7、抽样框又称为抽样框架、抽样结构,是指对可以选择作为样本的总体单位列出名册成排序编号,以确定总体的和。
设计抽样框式进行抽样调查的前提,常见的抽样框有、等。
8、抽样误差是指指标数值与指标数值之差,即抽样估计值与被估计的未知的真实总体参数值之差。
9、在抽取多个样本时,就其中每个样本来说,都有其相应的抽样误差,而这些抽样误差的平均数,就是,用以反映抽样误差的一般水平。
10、一般来说,在实际应用时,常常采用的方法从总体各单位中抽取样本单位,进行调查;在计算上,为了计算简便,通常可以采用条件下抽样平均误差的计算公式进行计算。
11、概率分布的中心极限定理证明:(1)大量的客观事物总体现象是总体或近似于总体。
(2)在大样本的条件下,的分布是或近似地是正态分布,抽样成数的分布是或近似地是正态分布。
(3)抽样平均数的平均数总体平均数,抽样成数的平均数总体成数。
12、概率度t越大,估计的可靠性越,样本统计量与总体参数之间正负离差的变动范围也就越。
第四章 抽样调查
抽样分布原理
(一)基本符号 1.总体 A = {a1 , a2 ,, aN }, A = N . 1.总体 2.从总体中抽取n个对象构成样本,共有k个样 2.从总体中抽取n个对象构成样本,共有k 本,设样本的符号为:
A1 , A2 ,, Ak , k = C , Ai = n, i = 1, 2,, k
本章复习思考题
1,什么叫抽样?从总体中抽样样本需满足哪些 条件? 2,简单随机抽样?机械抽样?抽样调查法的性 质?随机抽样的原则? 3,抽样误差?影响抽样误差大小的因素?抽样 误差与调查误差,系统误差的区别? 4,抽样分布?平均误差?抽样分布原理? 5,教材第三章课后习题P84的第二题,P85的第 ,教材第三章课后习题P84的第二题,P85的第 四题,P86的第六题. 四题,P86的第六题.
(三)问卷设计的原则 (三)问卷设计的原则 题意清楚,明确,易懂;口语化;避免一题两问;避免 诱导;公正客观;逻辑一致性;完整性(问题和备选 答案);不要用否定形式提问;不要直接询问敏感性 问题. (四)问卷的结构 1,四结构说:标题(简明扼要,概括专项调查的主 题);指导语(包括调查的目的和意义;问题及备选 答案的必要解释,调查须知及其他事项说明等;如涉 及需为被调查者保密的内容,需申明予以保密);主 体内容(内容不宜过多,过繁,应根据需要而确定); 结束语(提出几个开放性的问题或让被试提出对本研 究的建设性的意见;表示对被试合作的感谢). 2,六结构说:在四结构说的基础上,加上被调查者的 基本信息;作业证明的记载.
无限总体时, 有限总体时,
σ σx = n
σ N n σx = × N 1 n
对于有限总体,样本容量与总体容量的 比n/N称为抽样比例. n/N称为抽样比例. 一般认为,n/N<0.05时,就可以省略修 一般认为,n/N<0.05时,就可以省略修 正系数.
[高等教育]现代社会调查 第四章 抽样
3.分层抽样
——又称类型抽样,它是先将总体中的所有单位按某种特征或标 志(如性别、年龄、职业或地域等)划分成若干类型或层次,然后 再在各个类型或层次中采用简单随机抽样或系统抽样的办法抽取 一个子样本,最后,将这些子样本合起来构成总体的样本。 操作方法:
将总体中的所有单位按某种特征或标志(如性别、年龄、职业或地
特点 简单随机抽样 一阶段抽样 系统抽样
分层抽样
整群抽样 多阶段抽样 多段抽样 PPS抽样
样本一次直接从 总体中抽出
样本分多阶段从 总体中抽出
17
1.简单随机抽样
——是概率抽样的最基本形式,它是按等概率原则直 接从含有N个元素的总体中随机抽取n个元素组成样本 (N>n)。
常用方法:直接抽样法、抽签法、随机数表法
25
当抽样间距(K=N/n)不是整数时:
循环等距抽样法 A+K A A+2K
A+3K
A+4K
A+(n-1)K
调整直线等距抽样 如:N=2580, n=300, 则K=8.6
……
调整:在1-86之间选择整数的随机起点,如27;将小数 点调回,得到非整数的随机起点2.7,由此得到号码:2.7, 11.3, 19.9, 28.5,……。将小数点后面的部分略去,就是迁 中单位的号码:2, 11, 19, 28, …… 26
抽5个区
抽4个区 抽3个区
抽12所学校
抽10所学校 抽10所学校
每所学校抽20名教师
每所学校抽30名教师 每所学校抽40名教师
方案8
方案9
根据抽取对象的具体方式的不同,把抽样分为概率抽 样和非概率抽样。
6
抽样的类型
第四章 抽样技术
• (五)多阶段抽样
– 含义:multistage sampling-----即先抽大的调 查单元,在大单元中抽小单元,再在小单元 中抽更小的单元。如:我国的城市职工家计 调查,采用三阶段抽样,先城市-基层单位调查户。
第四章 抽样技术
– 应用:在复杂、大规模的市场调查中。
• (六)抽样技术的选用原则
• (四)常用术语
– 1.总体(population)与样本(sample) – 2.总体指标和样本指标
• 总体指标-------反映总体数量特征的指标,有总 体平均数µ,总体比例P, 总体方差 σ 2
第四章 抽样技术
– 样本指标------又称样本估计量或统计量,用 以估计和推断相应总体指标的综合指标,有 样本平均数 x ,样本比例p ,样本方差S2。
第四章 抽样技术
• 成数------分总体成数与样本成数 • 含义------总体中具有某种特征的单位占全部单 位的比例,称总体成数(总体比例) • 如:产品的合格率,市场占有率等。 • 样本成数的抽样分布
– 当从总体中抽出一个容量为n的样本时,样本中具有 某种特征的单位数x服从二项分布,即有x~B(n, π),且 有E(x)=n π V(x)=n π(1- π). – 因而样本比例p=x/n也服从二项分布,且有: – E(p)=E(x/n)= π – V(p)=V(x/n)=1/n π(1- π)
第四章 抽样技术
第四章 抽样技术
第四章 抽样技术
本章要点
• 1.抽样调查的含义、特点与程序; • 2.随机抽样技术的类型及其各自的特点、 方法; • 3.非随机抽样技术的类型及其各自的特 点、方法; • 4.抽样误差的含义及其计算方法 。
第四章 抽样技术
第四节抽样调查
共同定义:总体是构成它的所有元素的集合,而元 素则是构成总体的最基本单位。 样本(Sample)样本就是从总体中按一定方式抽取出 的一部分元素的集合。 抽样(Sampling) 指从组成某个总体的所有元素的集 合中,按一定的方式选择或抽取一部分元素的过程, 或者说抽样是从总体中按一定方式选择或抽取样本 的过程。
第二节 概率抽样的原理与程序
统计值(Statistic)也称为样本值,它是关于样本中某
一变量的综合描述。统计值是从样本中计算出来的, 它是相应的参数值的估计量。 置信度(Confidence level)与置信区间 (Confidence Interval)。置信度也称为置信水平,它是指总体参 数值,落在样本统计值某一区间内的概率,或者说 是总体参数值落在样本统计值某一区间中的把握性 程度。它反映的是抽样的可靠性程度。例子:P64。 置信区间指的是样本统计值与总体参数值之间的误 差范围,置信区间反映的是抽样的精确性程度。
第二节 概率抽样的原理与程序
确定抽样框:确立总体后,收集总体中全部
抽样单位的名单。有两种确立方法:一是全 选法,一个不能漏。如大学生社会实习调查。 选定总体为全日制大学在校本科生与研究生, 就要从各院系花名册中统一编号。 另一种是分层次的样本框:如调查一个城市 小学生的学习状况。全市500小学,选10所, 再从10所中每个学校选3个班;最后每个班选 10名学生。
第一节 抽样的意义与作用
(3)所抽选的调查样本数量,是根据调查误差的要求,
经过科学的计算确定的,在调查样本的数量上有可 靠的保证。 (4)抽样调查的误差,是在调查前就可以根据调查样 本数量和总体中各单位之间的差异程度进行计算, 并控制在允许范围以内,调查结果的准确程度较高。 基于以上特点,抽样调查被公认为是非全面调查方 法中用来推算和代表总体的最完善、最有科学根据 的调查方法。
第四章 抽样
• 3.设计抽样方案 • 4.制定抽样框
– 制定抽样框就是依据已经明确界定的总体范围,收集总体中全部抽样单位 的名单,并统一编号。
• 5.实际抽取样本 • 6.样本评估
– 样本评估就是对样本的质量和代表性进行检验,其目的是防止因样本的偏 差过大而导致的失误。
– 实际抽取样本就是在上述几个步骤的基础上,严格按照所选定的抽样方法, 从抽样框中抽取一个个的抽样单位,构成样本。
运用:
• 从侨光分校的7000位学生中,抽取100位学 生进行调查查,以研究学生对学校教学条 件的满意度。之前所做的普查表现出的对 学校教学条件的平均满意度为85%,现通 过抽查统计后的满意度为80%。 • 请说出本次抽查中的总体、样本、抽样元 素、抽样单位、抽样框、参数值、统计值、 抽样误差。
二、抽样的作用
• 分类抽样有着突出的优点: 第一,分类抽样能够克服简单随机抽样的缺 点,适用于总体内个体数目较多,结构较复杂, 内部差异较大的情况。 第二,精确度较高。 第三,便于对不同层面的问题进行探索。 第四,便于分工,使工作效率提高。 分类抽样的缺点是,如何分类通常由人们主 观判定,因此要求调查者具备较高的素质与能力, 并且必须事先对总体各单位的情况有较多的了解, 而它们在实际工作中有时难以完全实现,这就会 影响分类的科学性和精确性。
三、抽样的类型
• 概率抽样 • 非概率抽样
– 根据抽取对象的具体方式,人们把抽样分为许多不同 的类型。总的来说,各种抽样都可以归为概率抽样与 非概率抽样两大类。这是两种有着本质区别的抽样类 型。概率抽样是依据概率论的基本原理,按照随机原 则进行的抽样,因而它能够避免抽样过程中的人为误 差,保证样本的代表性;而非概率抽样则主要是依据 研究者的主观意愿、判断或是否方便等因素来抽取对 象,它不考虑抽样中的等概率原则,因而往往产生较 大的误差,难以保证样本的代表性。 概率抽样与非概率抽样又各自包括了许多具体类 型。分别适用于不同调查对象。联系实际认识概率抽 样的不同类型及其适用性是掌握抽样方法的关键。
第四章 抽样
(1)概率抽样:简单随机抽样、系统抽样、 分层抽样、整群抽样、多段抽样、PPS抽样、 户内抽样 (2)非概率抽样:偶遇抽样、判断抽样、 定额抽样、雪球抽样
二、概率抽样的原理与程序
(一)概率抽样的基本原理 1、总体的同质性与异质性 同质性:如果某个总体中的每一个成员在所有方 面都相同,那么,我们就说这个总体具有完全的 同质性。 否则,就存在不同程度的异质性。 同质性总体不需要抽样。 社会各种总体的异质性决定了严格的概率抽样的 必要性。
(二)系统抽样
3、系统抽样优缺点: <1>优点: ①易于实施,工作量少。 ②样本在总体中分布更为均匀,抽样误差 小于或至多等于简单随机抽样。
(二)系统抽样
<2>系统抽样缺点: ①系统抽样是以总体的随机排列为前提, 如果总体的排列出现有规律分布时,会使 系统抽样产生极大误差。 ②当总体内个体类别之间的数目悬殊过大 时,样本的代表性可能较差。 <3>适用范围:系统抽样最适用于同质性较 高的总体。
人们通常采用下列几组数字
有90%的样本统计值落在u〒1.65SE(样本 平均数的标准差)之间; 有95%的样本统计值落在u〒1.96SE之间; 有98%的样本统计值落在u〒2.33SE之间; 有99%的样本统计值落在u〒2.58SE之间。 其中,百分数表示置信水平,u〒1.65SE等 表示置信区间。
随机数表抽样举例
3、简单随机抽样方法
①当总体元素较少时:常用的办法类似于 抽签,即把总体中每一个单位都编号,将 这些号码写在一张张小纸条上,然后放入 一容器如纸盒、口袋中,搅拌均匀后,从 中任意抽取,直到抽够预定的样本数目。 这样,由抽中的号码所代表的元素组成就 是一个简单随机样本。
第四章-抽样技术练习试题
第四章抽样技术一、名词解释1、抽样调查2、总体和样本3、样本容量4、重复抽样5、不重复抽样6、抽样极限误差7、点估计8、区间估计二、填空1、抽样调查是从研究的中抽取部分单位作为进行观察研究,并根据这部分单位的调查结果来推断,以达到认识总体的一种统计调查方法。
2、抽样调查分为和两类。
抽样调查遵循。
3、是用主观的(非随机的)方法从总体中抽选单位进行调查,它是一种快速、简便且省钱的抽选样本的方法。
但非概率抽样具有很大的风险,因为主观选定的样本很难保证其对总体的代表性。
所以一般情况下不用来对总体进行推断。
主要包括随意抽样,,。
4、概率抽样有两条基本准则:第一,单位是随机抽取的;第二,调查总体中的每个单位都有一个非零的入样概率。
概率抽样方法主要有、、分层随机抽样、、、。
常用的为前四种。
5、是指包括调查对象所有单位的全体,它是由具有某种共同性质的许多单位组成的。
从中按随机原则抽取出来的部分单位所组成的集合体就称为样本。
6、从总体中抽取样本单位有与两种方法。
7、抽样框又称为抽样框架、抽样结构,是指对可以选择作为样本的总体单位列出名册成排序编号,以确定总体的和。
设计抽样框式进行抽样调查的前提,常见的抽样框有、等。
8、抽样误差是指指标数值与指标数值之差,即抽样估计值与被估计的未知的真实总体参数值之差。
9、在抽取多个样本时,就其中每个样本来说,都有其相应的抽样误差,而这些抽样误差的平均数,就是,用以反映抽样误差的一般水平。
10、一般来说,在实际应用时,常常采用的方法从总体各单位中抽取样本单位,进行调查;在计算上,为了计算简便,通常可以采用条件下抽样平均误差的计算公式进行计算。
11、概率分布的中心极限定理证明:(1)大量的客观事物总体现象是总体或近似于总体。
(2)在大样本的条件下,的分布是或近似地是正态分布,抽样成数的分布是或近似地是正态分布。
(3)抽样平均数的平均数总体平均数,抽样成数的平均数总体成数。
12、概率度t越大,估计的可靠性越,样本统计量与总体参数之间正负离差的变动范围也就越。
06 第四章 抽样
现在,我们决定从那里开始。可以闭着眼睛随便戳一个数字。也
(二)方法
A 总体元素较少时,类似于抽签方法。
B 总体元素较多时,随机数表法 小总体时 抓阄,抽签, 较大总体时 随机数字表.使用方法. 简单随机样本是概率抽样的理想类型,他从 随机样本的抽取到对总体进行推断有一套健全的规 则.但是当总体所含个体的数目太多时采用这种方法 不仅费事,工作繁杂,而且费用太高.此外当总体内分 类明显时,这种抽样无法按类别特征自动分配样本数, 若想保证样本的代表性,必须增大样本量,从而使整 个工作的工作量增大.
因此,我们在使用系统抽样方法时,一定要注意抽样
框的编制方法。
注意:
总体名单中,个体的排列具有某种次序上的先后、等级上的高低的情况
例如:我们从2000户家庭的社区,抽取50户进行消费状况的调查,
而2000户家庭的名单是按照家庭收入的多少按照由高到低排列的。
抽样间距=2000/50=40
如果两个人选择样本,一个人选择初始号码为3,另一个人选择初 始号码为38,那么肯定前者家庭平均收入远远高于后者。
随机数表中的数码
8432990906 1053873020 9427410041 0139022507 9361404310 1359866042 6321912683 9420582507 2725651176
选用的数码
0906
不选用的原因
后面四位数大于3000
第四章 市场调查基本技术
两者都要把总体分成若干层或若干群; 分层随机抽样是要区分各类型的差异,而同
类型的内部的单位具有共同性,差异小,目 的是增加样本的代表性;而分群随机抽样要 求群之间的差异小,群内部的单位差异比较 大,目的是便于抽取样本和组织调查工作。
非随机抽样方法
非随机抽样主要包括:
方便抽样: 判断抽样: 定额抽样:
(2)收集到的抽样框应是最新的调查总体资料。 (3)选择接触性强的抽样框。 (4)找不到最新的抽样框时,要选择变化小、连续性强的 资料,如电话号码簿等。
3、确定抽样单位
例如调查某市出售电视机商店的分布情况, 构成的总体单位是销售电视机的商店。抽 样时如果按商业街道抽,抽样单位为商业 街道。 注意:抽样单位不等同于样本单位。
如从某一中学的全体学生中抽取50名学生为 调查样本,那么这所中学全体学生的名单 为抽样的抽样框。如果抽取该学校的部分 班级的全部学生作为调查样本,那么抽样 框为全校所有班级的名单。
2015/9/5
19
2、建立抽样框
在确定总体后,市场调查者下一步的任务就 是依据已经明确的总体范围,收集总体中全 部抽样单位的名单,并按名单进行统一编号 来建立起供抽样使用的抽样框。 当抽样分几个阶段、在几个不同的抽 注意: (1)抽样框尽可能包括全部研究对象,不要遗漏了总体的 样层次上进行时,则要分别建立起几个不同 一些元素,也不能包括不属于研究总体的另外一些元素。 的抽样框。
又称为偶遇抽样、方便抽样或自 然抽样,是指研究者根据实际情 又称为目的抽样,它是凭借调查人 况,以自己方便的形式抽取偶然 员的主观意志、经验和知识等,从 滚雪球抽样: 又称为定额抽样,是指将总体依据一定 遇到的人作为调查对象,或仅仅 总体中选择具有典型代表性的样本 的标准或某种特性分成不同群体,并分 选择那些离自己最近,最容易找 作为调查对象的一种抽样方法。 是从抽取几个合适的样本开始,选 配好各群体的样本数量,然后由调查人 到的人为调查对象。 取与他们相关联的总体单位得到更 员按分配的样本数量,判断选择样本的 多的样本,以此类推,从而不断扩 一种抽样方法。主要有四个步骤。 大样本范围的抽样方法。
第4章 抽样调查技术要点
抽样调查
• 时间短、效率高,投入资源较少
• 调查结果的正确性较高,但是获取 的信息全面性不如普查
细性要求高时可采用这种方法,比如
人口普查,农业普查、企业员工整体 素质普查等。
• 可以通过统计推断技术来估计调查
总体的各项指标,是企业经常使用 的调查研究方法。
抽样调查的定义
抽样调查又称样本调查,是指按照随机原则,
几种概率抽样方法的选择与比较
对抽样误差大小的要求:
抽样误 差大小
• 有关标志值排队的系统抽样方式误差最小; • 分层抽样、按无标志值排队的系统抽样方式其次; • 简单随即抽样和整群抽样方式误差较大。 调查对象本身特点的要求:
调查对 象特点
• 有无总体的全面、详细的资料,如果没有就无法 按有关标志值排队进行系统抽样; • 与对调查对象了解的程度 也有关系。 人、财、物和事件等各种调查条件的要求: • 样本的分散程度大、调查往返的时间长和费用大的情况 下可以考虑整群抽样。
系统抽样的方法,将士兵的编号按班排序(每班10
人),进行抽样,从1号开始抽取,接下来是11号、
21号„„,调查发现士兵对待战争的积极性很高。但
是经过对样本进行研究发现,被抽到的士兵都是每班
的班长,样本的代表性就有问题了!
分层抽样
分层抽样,是指先将调查总体的所有个体按某一重要标志进行
分类(分组),然后在各类(组)中采用简单随即抽样或系统
配额抽样
配额抽样也叫定额抽样,是指将总体中的各单位按 一定的标准划分为若干个类别,将样本数额分配到
个类别中,在规定的数额内由调查人员任意抽选样
本。 配额抽样可分为独立控制配额抽样和相互控制配 额抽样两类。
的样本个体数。 非等比分层抽样主要在于减低各层之间的标准差,使母 非等比分层抽样适用于各层之间相差悬殊或标准差相差较 体平均数的估计更加精确。 大的情况。
第4章抽样调查
学习与掌握概率抽样、非概率抽样的几种方法,抽样方案的设计, 样本量大小的确定,以及“业务链接”等程序性知识;能运用所学实 务知识规范市场抽样调查的相关技能操作。
学习目标
案例目标:
能正确运用所学的抽样调查理论与实务知识研究相关案例,培养和提 高学生在特定业务情境中分析问题与决策设计的能力;依照“职业道 德与营销伦理”的行业规范与标准,分析企业行为的善恶,强化学生 的职业道德。
❖1)抽样调查的含义 ❖2)抽样调查的特点 ❖3)抽样调查的适用范围 ❖4)与抽样调查有关的专业术语
1)抽样调查的含义
抽样调查是从研究对象的 总体中,按照随机性原则 抽取一部分单位作为样本 进行调查,并且用其样本 调查的结果来推断总体的 非全面市场调查方法。
2)抽样调查的特点
❖(1)调查方式的科学性 ❖(2)信息获取的高效性 ❖(3)调查费用的经济性 ❖(4)调查结果的可靠性
❖ (2)如果你在沿街区走了一圈,又回到了出发点而没有完成电话簿上家庭的 4个访问,那么可以试着访问起点的那一家。
❖ (3)如果你调查了整个街区,还是没有完成所要求的访问,则继续从街对面 最近的第一个住户开始。只要这个地址在你的纸上有一个“×”旁出现,就 把它当作你所在区域的街道中的另一个地址,并访问这一家。如果不是,就 访问这家左边的一家。永远遵守右手法则。
❖ 问题:要从中抽取400户进行购买力调查,采用等比例分层抽样,如 何抽取?
❖ 分析提示:因为购买力是与家庭的收入水平密切相关的,所以以收入 水平作为分层变量是合适的。按此变量将总体分为高收入户、中等收 入户和低收入户三层。具体的抽样程序如下:
❖ 第二步:张小姐请徐经理将自己介绍给徐经理熟悉的几家上海冷饮经 销商的有关管理人员。
第四章 抽样调查
p
p1 p
n
0.2 0.8 0.02 400
即:根据样本资料推断全部学生中戴眼镜的学 生所占的比重时,推断的平均误差为2%。
例: :
一批食品罐头共60000桶,随机抽查300桶,发 现有6桶不合格,求合格品率的抽样平均误差?
解: 已知 N 60000 n 300 n1 6
解:
x xf 12600 126件 f 100
s x x 2 f 4144 6.47件
f 1
99
x
s 2 1 n n N
6.472 1 100 0.614件
100 1000
x
通过例题可说明以下几点:
①样本平均数的平均数等于总体平均数。 ②抽样平均数的标准差仅为总体标准差的 1
n
③可通过调整样本单位数来控制抽样平均误差。
例:假定抽样单位数增加 2 倍、0.5倍时, 抽样平均误差怎样变化?
解:抽样单位数增加 2 倍,即为原来的 3 倍
则:
x
3n
1 0.577 3
二、抽样调查的特点
1、 是专门组织的一次性的非全面调查 2、 抽选样本单位遵循随机原则 3、 用样本指标数值去推断总体指标数值 (与重点调查的区别) 4、 抽样误差可计算并控制在一定范围内 (与典型调查的区别)
三、抽样调查的几个基本概念 (一) 全及总体和抽样总体
全及总体 指研究对象的全体。其单位数 (总体) 用N 表示。
即:当根据样本学生的平均体重估计全部学生的平均 体重时,抽样平均误差为1公斤。
例: 某厂生产一种新型灯泡共2000只,随机抽出 400只作耐用时间试验,测试结果平均使用寿 命为4800小时,样本标准差为300小时,求抽 样推断的平均误差?
第四章 抽样技术
STAT
§4.1 抽样调查的一般理论 §4.2 随机抽样技术 §4.3 非随机抽样技术
§4.1 抽样调查的一般理论
一、基本概念 二、基本准则 三、基本方法 四、抽样误差的确定 五、样本容量的确定
STAT
一、基本概念
STAT
1.全及总体 1.全及总体 简称总体或母体, 简称总体或母体,是指所要调查认识的研究对 象的全体,它由具有某种共同性质或特征的单 象的全体, 位组成。用字母N表示。 位组成。用字母N表示。 2.样本总体 2.样本总体 简称样本, 简称样本,指在全及总体中抽取部分单位所构 成的小总体。用字母n表示。 成的小总体。用字母n表示。
STAT
完全代表总体而导致的误差。 完全代表总体而导致的误差。
原 因
记 差 登 误 误差 统 误 系 性 差 表 误 代 性 差 机 差 随 误
三种误差的区别: 三种误差的区别:
STAT
• 登记误差:由于人的主观失误在观察、登 登记误差:由于人的主观失误在观察、 主观失误在观察
抽样调查的一般步骤
STAT
设 计 抽 样 方 案
抽 取 样 本 单 位
收 集 样 本 数 据
计 算 样 本 统 计 量
推 断 总 体 参 数
二、基本准则
STAT
1.随机原则 1.随机原则 ——抽取样本单位时,应确保每个总体单位都 抽取样本单位时, 抽取样本单位时 有被抽取的可能. 有被抽取的可能 2.抽样误差最小 2.抽样误差最小 ——在其他条件相同的情况下,选抽样误差 在其他条件相同的情况下, 在其他条件相同的情况下 设计抽样方案时, 设计抽样方案时,通常是 最小的方案. 最小的方案 在误差达到一定要求的条 3.费用最少 3.费用最少 件下,选择费用最少的方案 件下, —在其他条件相同的情况下,选费用最少的 在其他条件相同的情况下, 在其他条件相同的情况下 方案. 方案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
•(1)需要调查总体中每个个体的详细材料,尤其是按有关标 志排序时,较为困难; •(2)当抽选间隔与被调查本身的节奏性相重合时会影响调查 精度。
•系统抽样适用于总体时间周期性不强的情况。
PPT文档演模板
第4章抽样调查技术
•例:对军队中士兵对待战争的积极性进行调查,采 用系统抽样的方法,将士兵的编号按班排序(每班10 人),进行抽样,从1号开始抽取,接下来是11号、 21号……,调查发现士兵对待战争的积极性很高。但 是经过对样本进行研究发现,被抽到的士兵都是每班 的班长,样本的代表性就有问题了!
PPT文档演模板
第4章抽样调查技术
•分层抽样
•分层抽样,是指先将调查总体的所有个体按某一重要标志进 行分类(分组),然后在各类(组)中采用简单随即抽样或系 统抽样方式抽取样本个体的抽样方法。 •分层抽样主要是希望增加样本的代表性,避免单纯随机抽样 的样本过于集中于某种特性或完全无某种特性。
•进行分层抽样时,先将整个母体按照各种特性划分成i个副次母
•如:初级调查单位(如地区):具有相同性 • 次级调查单位(如家庭):具有差异性
PPT文档演模板
第4章抽样调查技术
•整群抽样与分层抽样刚好相反:
•整群抽样
•第一群 •高收入
•中等收入 •低收入
•第二群 •高收入
•中等收入 •低收入
•分层抽样
•高收入层
•高收入 •高收入 •高收入
PPT文档演模板
•中等收入 层
可以平衡标准差的作用。但准确了解各组标志值变异程度
的大小比较困难。
PPT文档演模板
第4章抽样调查技术
•分层抽样的优点及局限性
•优点:
•把科学分组方法和抽样原理结合,能划分出性质比较接近的 组,以减少标志值之间变异程度,然后按随机原则,可以保证
•分大层数抽法样则的优准点确较运多用。,比局前限两种性抽较样小更,准确是,调能查得中到比常较用准的确 的推断,尤其是总体数•抽目较样大方,法内。容结构复杂时。
第4章抽样调查技术
•(1)抽签法 •该方法适用于调查总体中个体数目较少的情况。
•例如:北京小轿车摇 号
PPT文档演模板
第4章抽样调查技术
•(2)随机数字表法
•该方法需要使用摇码器生成乱数表,而后在从 中抽取,也是适用于数量不大的总体。
•从第1行第4列开始抽取,小于70的数。如果样本不够那么再 从其他列抽取,直至抽够为止。
抽样误差较大,代表性较差。 •(2)采用整群抽样时,一般都要比其他抽样方法抽选更多的 个体,以降低抽样误差,提高结果的准确性。 •(3)抽样结果的可靠性还取决于群与群之间的差异大小,差 异越小,整群抽样结果就越准确。
PPT文档演模板
第4章抽样调查技术
•几种概率抽样方法的选择与比较
•抽样误 差大小
•对抽样误差大小的要求: • 有关标志值排队的系统抽样方式误差最小; • 分层抽样、按无标志值排队的系统抽样方式其次; • 简单随即抽样和整群抽样方式误差较大。
第4章抽样调查技术
• 应当注意,强调根据调查要求和调查对象
第4章抽样调查技术
•抽样方案的设计步骤
• •第一步:定义有关的总体 •第二步:获得总体的名单 •第三步:设计样本方案
PPT文档演模板
•明确总体:
•1)抽样的单位是什么?(家庭还 是个人) •2)时间限制,需要获取哪一时间 段的信息? •3)空间限制,局限于哪个区域的 信息?
•建立抽样框
•1)所有的样本均从抽样框中得到 •2)抽样框误差会影响分析结果的 可靠性
•中等收入 •中等收入 •中等收入
•第三群 •高收入 •中等收入 •低收入
•低收入层 •低收入 •低收入 •低收入
第4章抽样调查技术
•思考:
•1、调查某产品消费者可支配收入去向时,可采
用哪种方法? •分层抽样 •系统抽样
•2、调查一线城市消费者耐用品消费状况时,可
采用哪种方法?
•整群抽样
•3、调查北京地区高校大学生用于购买电脑消费
状况时,可采用哪种方法? •分层抽样 •整群抽样
•分层抽样 •系统抽样
PPT文档演模板
第4章抽样调查技术
•整群抽样的优点及局限性 •优点:
•组织抽样和实施调查比较方便,节省了费用和时间。
•在大•局规限模性市:场调查中,当群体内各个体间差异性较大, 而•(各1)群与之其间他抽差样异方性式较相比小,时在,抽适样个合体采数用目相整同群的抽条样件下。,
•调查对 象特点
•调查对象本身特点的要求: • 有无总体的全面、详细的资料,如果没有就无法 按有关标志值排队进行系统抽样; • 与对调查对象了解的程度 也有关系。
•调查 •条件
PPT文档演模板
•人、财、物和事件等各种调查条件的要求: • 样本的分散程度大、调查往返的时间长和费用大的情况 下可以考虑整群抽样。
PPT文档演模板
第4章抽样调查技术
•抽样调查是什么?
•
抽样调查要遵循随机原则吗?
•
需要从研究总体中抽取样本 吗?
•
能够可靠或准确的估计总体样本吗?
•
有理论基础吗?•——概率论
PPT文档演模板
第4章抽样调查技术
•抽样调查的分类
•概率抽样 •抽样方法
•非概率抽样
PPT文档演模板
•简单随机抽样 •系统抽样 •分层抽样 •整群抽样
随机数字表
09 47 43 73 86 16 22 94 77 39
97 74 24 67 62 84 82 53 27 31
16 76 62 27 66 63 01 78 63 59
12 56 85 99 26 33 21 34 12 29
55 59 56 35 64 57 60 32 86 44
PPT文档演模板
第4章抽样调查技术
•(3)计算机抽取
•使用统计软件中都有的抽取随机样本的功能, 从中抽取,该方法简便快捷,但是需要注意, 软件生成的随机数是伪随机数,随机效果并 不理想。
•例如:商场让个人用电脑抽奖的活 动
PPT文档演模板
第4章抽样调查技术
•简单随机抽样的优点及局限性
•优点:
•方法简单,易操作,理论上是最符合随机原则的。
第4章抽样调查技术
•2.非等比分层抽样:按其他因素(如各层平均数或成数
标准差的大小,抽样工作量或费用的大小等)调整各层
的样本个体数。
•非•等非等比比分分层层抽抽样样适主用要在于于各减层低之各间层相之间差的悬标殊准或差标,准使母差相差 体平均数的估计更加精较确大。的情况。
•ni =
•n•×
•Ni •∑Si NiS
• 遵循随机原则 • 客观抽样 • 每个单位都有相同机会
•优:从概率样本中获得的信息含量较 高。 •缺:抽取样本技术复杂,必须有合适 的样本框,成本较高,对抽样人员专业
PPT文档演模板
• 不遵循随机原则 • 主观判断抽样 • 方便、快捷的抽取样本
•优:操作简便、时效快、成本低,适合 做探索性研究和预调查。 •缺:无法估计和控制误差,无法用统计 方法来推断总体。
各层客户总 数量Ni
1250
样本标准 差Si
100
NiSi乘积 125000
抽取的样本 800*0.17=136
一般客户
2500
150
375000
800*0.5=400
临时客户
1250
200
250000
800*0.33=264
∑
N=5000
750000
800
•可以看出,标准差较大的抽取的样本个体也较多,这样
(层):
•N=∑Ni=N1+N2+N3+…+Nk
•再由各层中随机抽取样本单位若干个,如n1,n2,…,nk
PPT文档演模板
•n=∑ni=n1+n2+n3+…+nk
第4章抽样调查技术
• 根据样本在各层中分配方法不同,可以分为等比分层抽 样和非等比分层抽样两种方法。
•等•比1.分等层比分抽层样抽简样便:易按行各层,中分个配体合数理量,占总计体算数方量便的,比适例 用于 分配各层类的型样之本间数差量。异不大的分层抽样调查。
第4章抽样调查技术
PPT文档演模板
2020/11/26
第4章抽样调查技术
•普查与抽样调查
• 为了获取总体的信息及特征,可以选择普查和抽样
调查两种方法。总的来说,与普查相比抽样调查具有经济、
•普遍调查 及时、准确和高效的特点。
• 需要投入大量的人、财、物和时间
• 获取的信息全面,但准确性未必高
• 在对精度要求小,但是对整体状况详 细性要求高时可采用这种方法,比如 人口普查,农业普查、企业员工整体 素质普查等。
•局限性:
•(1)在调查前准确了解各组标志值变异程度大小比较困难。 •(2)划分层次时,应尽量使各层之间具有显著性差异,不致 混淆。分层数目也不宜过多,各层内各单位应尽量保持相似。
PPT文档演模板
第4章抽样调查技术
•整群抽样
•整群抽样也叫分群抽样,是指将总体分解为群,抽样直接抽 取群,对抽中群中的个体单位全部或随机抽取部分进行调查 (一级整群抽样、二级整群抽样、三级整群抽样),以此来推 断总体的一般特性。 •整群抽样时,各群的特性应尽量保持相近,如人口、经济等。 但每一群内部则应具有差异性。
•确定样本数量和抽样方法
•1)确定抽样数量 •2)根据样本特征选择抽样方法
第4章抽样调查技术
•概率抽样
PPT文档演模板
第4章抽样调查技术
•简单随机抽样
• 简单随机抽样又称单纯随机抽样、纯 随机抽样、无限制随机抽样,它对调查总 体不经过任何分组、排队,完全凭着偶然 的机会从中抽取个体加以调查。