营销调研第九章 抽样调查技术
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第九章抽样调查技术
1
黄豆和绿豆的比例
梁老师在课堂上提了一袋豆子,里面有新鲜的黄豆和绿豆。
梁老师将同学们分为十组,要求各组在五分钟以内求出袋子里的黄豆和绿豆之比。
大部分同学走上讲台用杯取豆子,有的直接取了满满一杯;有的取了少半杯。
五分钟之后,具有典型代表的是第一组和第六组
第一组计算比例为1:0.91,取出一小把豆子计算得出
第六组还没有结果,这组同学认真地数着杯子里的黄豆和绿豆,十分钟后得出比例为:1:0.9
2
启示:
杯子里的黄豆和绿豆之比能代表杯子里的黄豆和绿豆之比吗?
为什么第一组同学支取了被子里的一小把豆子?
第六组同学采用的方法存在什么问题?
3
《文摘》(Literary Digest)是一本创刊于1890年、极富影响力的大众杂志,曾多次通过调研准确预测了美国总统大选。
大家早已习惯与将该杂志的调研结果作为对未来事件的准确预测。
但是该杂志对1936年的总统大选的预测却令人大失所望,以至于严重损害了杂志的信誉,导致1938年被《时代》杂志收购
这一事件激发人们对调研抽样技术的深度思考
4
当时兰登(共和党)与罗斯福(民主党)竞争总统宝座
《文摘》抽取了三类人作为抽样框代表美国选民。
首先,它给200万《文摘》杂志订阅者发去明信片。
接着又将电话用户和汽车用户的样本加入到抽样框中以增大样本容量。
根据这些样本的调查结果,《文摘》杂志预测兰登将以压倒性的优势获胜。
结果却是罗斯福获胜。
《文摘》杂志使用前所未有的大样本却得出了错误的结论,为什么会出现这种情况?
——抽样方法有误
5
1936年正值大萧条的谷底。
那些订得起杂志、用得起电话、开得起汽车的人经济状况远好于普通民众,并且这些“上层”公民多数是共和党人
《文摘》杂志调查的绝大多数选民都是共和党人,所用的抽样方法不能保证民主党人获得同样被调整的机会
6
启示:任何调研都要有一个好的抽样方法
一旦用错了抽样方法,即使样本容量巨大也无法得出正确的结论
当年样本容量不大的调研却准确预测罗斯福的当选,如盖洛普公司
7
统计推断的过程
8
抽样调查的意义
一般所讲的抽样调查,即指狭义的抽样调查(随机抽样):按照随机原则从总体中抽取一部分单位进行观测,并用用这些观测值估计总体数量特征的统计方法。
指样本单位的抽取不受主观因素及其他系统性因素的影响,每一个单位都有均等的被抽中机会
9
从理论上讲,遵循随机原则的目的要是样本中所有单位的统计分布尽量等同于总体中所有单位的统计分布,这样,样本才有对总体的代表性
10
抽样调查的特点
第一,按随机原则抽选调查单位
第二,用样本推断总体
第三,在调查之前可以计算和控制抽样误差
11
抽样估计的特点
特点之一:按随机原则抽取样本
随机样本:与总体分布特征相同
与典型调查和重点调查的区别
STAT
12
特点之二:用样本推断总体
统计推断
总体
样本
STAT
提高统计调查效率——缩小范围,提高速度——主要依据
13
抽样调查的应用
1. 总体范围较广,不需要了解每一个别单位的情况
2. 对破坏性或消耗性产品的质量进行检验
3. 对全面调查的结果进行检验和修正
14
抽样调查的基本概念
1. 总体和样本
总体——统计研究对象的全体,是由具有某些共同性质或特征的个体或单位组成分为有限总体和无限总体
样本——抽样调查从总体中抽取的那部分单位所组成的集合体
样本中包含的单位数称为样本容量,通常用n表示
两者区别:总体是唯一确定的,样本则不是唯一的
15
3. 抽样方法
1. 重置抽样(有放回抽样)——选取一个单位后,记录其数据,然后把该单位放回总体,在进行下一次抽样,使得每次抽样时每一个单位都有相同被抽中的机会。
在多次抽样中,同一个单位又被重复抽中的可能
2. 不重置抽样(无放回抽样)——是已抽中的单位不再放回,下一次抽样只能在剩余的单位中抽取,总体中每个单位只能有一次被抽中的机会
实践中经常使用不重置抽样
重置抽样操作比较困难,误差高
16
STAT
《统计学》第四章抽样估计
重复抽样放回抽样:
重复抽样与不重复抽样
抽出个体
登记特征
放回总体
继续抽取
通常只在必须使样本单位能重复出现时使用
某彩票中奖号码(号码不重复出现):
1 2 3 4 5 6
失去中奖机会的号码
、
11
121 、122 、
1231 、1232 、1233 、
12341 、12342 、12343 、12344 、
123451、123452、123453、123454、
123455
总计:12345个至少占总数1%
17
STAT
《统计学》第四章抽样估计
重复抽样与不重复抽样
抽出个体
登记特征
继续抽取
最为常用的抽样方法,用于无限总体和许多有限总体的抽样。
不重复抽样无放回抽样:
18
STAT
《统计学》第四章抽样估计
重复抽样与不重复抽样
有限总体修正系数
当N足够大时
用于不重复抽样用于重复抽样
<
推导??
19
4. 抽样框
包含有全部总体单位及其主要标志特征的一个框架或列表
抽样框是抽选样本的基础资料,应把所研究的全部单位都包括在内而不发生重复和遗漏
取得与研究总体相一致的抽样框比较困难,有时只能用一个近似的抽样框代替
——考虑抽样总体与目的总体之间的差别
20
资料
好的抽样框应做到:完整而不重复。
常见的抽样框:大学学生花名册、城市黄页里的电话列表、工商企业名录、街道派出所里居民户籍册、意向购房人信息册……。
在没有现成的名单的情况下,可由调查人员自己编制。
应该注意的是,在利用现有的名单作为抽样框时,要先对该名录进行检查,避免有重复、遗漏的情况发生。
以提高样本对总体的代表性。
例如:要从10000名职工中抽出200名组成一个样本,则10000名职工的名册,就是抽样框。
21
抽样框:包含所有总体单位的名单框架。
仅对有限总体而言
抽样框
姓名身高体重(cm)(kg)
丁一182 70 于峰175 62 马宁160 50 王一波172 66 王忠烈169 62 王洪宇182 70 刘可心166 61 李元元152 48 李煌188 90 李一民173 63
编号
001 002 003 004 005 006 007 008 009 010
STAT
《统计学》第四章抽样估计
22
应当调查的对象(居民户)
已购或未购微波炉的住户
已购该公司微波炉的住户
有购买微波炉意向的住户
某外国公司在大连进行微波炉市场调查:
微波炉普及情况
居民的喜好特征
居民购买力水平
公司产品知名度
公司产品信誉度
抽样框
在商场的大门口
在微波炉柜台前
在市区街道旁边
在某个住宅小区
中山区…沙河口区星海街道…黑石礁街道尖山一委…尖山二委居民一组居民二组…
STAT
《统计学》第四章抽样估计
23
抽样框
连续出产的产品总体可以编制抽样框:均匀的出产时间、可以预见到的产品总量。
连续到加油站加油的汽车总体无法编制抽样框:时间不定、总量也无法确定。
STAT
《统计学》第四章抽样估计
24
抽样框的形式一般有两种:
1. 一览表,名单抽样框
从5万名职工抽取300名职工组成一个样本,则5万名职工名册就是抽样框
2. 地图,区域抽样框,按地理区域划分并排列出总体的所有单位
25
抽样框并不是总能够很好地反映总体
抽样框误差:抽样框不能反映整个总体的程度
例如:总体是新泽西所有的汽车经销商,调查人员以黄页电话号码簿,并非所有的经销商都在黄页上
误差形成原因:
(1)丢失目标总体单位“涵盖不足”
(2)包含非目标单位“过涵盖”
(3)丢失目标单位和非目标单位共存
(4)复合连接:抽样框单元与目标总体单元并不完全一一对应,而是存在一对多、多对一或多对多现象
(5)不正确的辅助信息误差“内容上的偏差”
(6)抽样框老化“抽样框过时”
26
概率抽样设计
(一)简单随机抽样
(二)类型抽样
(三)等距抽样
(四)整群抽样
27
1. 简单随机抽样
简单随机抽样也称纯随机抽样,是抽样中最基本的组织方式。
它是按照总体原有状况,不加任何限制,保证总体的每一个单位都有相等被抽中机会的抽样方法。
抽样推断的理论都是以这种方式为基础的
实际操作时可采用抽签、抓?具体的方式。
总体很大时,使用不便
28
案例:
对某村100户农户进行经济状况调查,用简单随机抽取样本的方式来确定10户进行具体登记调查。
29
简单随机抽样方法特点
最符合随机原则,不管样本容量大小,所生成样本都能够有效代表总体
一般必须对总体单位加以编号,如果调查总体庞大,逐一编号几乎不可能
抽出样本单位较为分散,实施起来困难
从本质上说,简单随机抽样必然要从一张完整的总体名录开始,现实世界中完整名录常常难以获取。
没有总体信息,结果精度较低
某些失误无法适用简单随机抽样。
例如,对连续不断生产的大量产品进行质量检验,就不可能对全部产品进行编号抽样
30
注意:
当总体内部差异较大时,简单随机抽样方法也不能保证抽中的样本单位在总体中有较均匀的分布,以致抽样误差偏大。
因此,这种抽样方式限于总体规模不大,内部差异也不很大的情况。
31
2. 等距抽样
等距抽样又称机械抽样、系统抽样,它是将总体各单位按某一标志顺序排列,然后按照一定的间隔抽取样本单位。
等据抽样的随机性表现在抽取的第一个样本单位上
等距抽样首先要将所有总体进行排序
等距抽样按总体单位排队依据的标志不同分为无关标志排队和有关标志排队。
32
所谓无关标志是指用来排队的标志与调查研究的内容无关。
所谓有关标志,是指用来排队的标志与调查研究的内容有关。
——不是按随机原则抽取第一个样本单位,而是尽量抽取在第一阶段处于正中位置的单位,在以此为基准,每隔一定量单位抽取一个
33
第一种:按与调查项目无关的标志排队。
实例3:
某班统计学成绩表
生进行具体
调查。
34
第二种:是按与调查项目有关标志排队。
实例4:某
班统计学
成绩表
生进行具体
调查。
35
等距抽样的误差依赖于排序项目与调查项目之间关系的密切程度——关系越密切,抽样误差越小
总的看来,这种方法比简单随机抽样简便,节省费用,所选样本的代表性也比较高
最大风险来自抽样框
36
3. 类型抽样
类型抽样也称分层抽样,它是将总体全部单位按照某个标志分成若干个类型组,然后从各类型组中采用简单随机抽样方式或其他方式抽取样本单位。
各类型组中样本数的分配,通常有以下二种方法:
类型比例分配
最优分配
37
1. 类型比例抽样
按各类型组在总体中所占的比例分配样本单位数,使各类型组中抽取的单位数占各类型组单位数的比例相等。
38
实例1:某市有民营企业
90,000家,该市税务局计划抽取900家了解其营业额等项目,现按一、二、三产业对其进行分组。
39
实例1表:
40
实例1答案:
41
等比例分配法考虑了各类型组规模不等的因素,大的类型组多抽,小的类型组少抽,有利于减少人为的抽样偏差,且计算操作很方便。
所以,实际工作中应用很普遍。
42
2、最优分配
根据各类型内部变异程度大小,变异程度大的类型组就多抽些单位,变异程度小的类型就少抽些单位
注意:这种方法实际上很少采用,因为除非有历史资料可以参考。
在调查之前,一般不可能知道各类型组内部的差异到底有多大。
43
分层抽样特点
适合偏态总体
比简单随机抽样和等距抽样等方法更为精确
可对总体、每层进行推断
44
4 整群抽样
整群抽样是先将总体分成若干群,然后从所有群中随机抽取若干群组成样本
被抽中群中的每一个单位都成为样本中的一个单位,没有选中的群中没有一个单位入选样本适用条件:当总体单位数较大,而各单位在时间或空间上的分布又很分散;抽样调查目的需要;各子总体差异不大
局限:由于同一群内所有单位的相似程度较高,形成样本后使样本内的变异程度较小,它对于总体代表性就比较差
45
实例:
某大输液厂家要对2007年5月末库存的每件20瓶500ml的5%葡萄糖注射液进行质量检验,据统计实际库存数为5000件共计10万瓶,实测数量确定为500瓶。
46
类型抽样和整群抽样的区别
进行类型抽样时,每一类之内的单位相似程度较高,但类与类之间的差异程度较大
进行整群抽样时,尽量保证群与群之间差异小,而群内各单位之间差异比较大
47
多阶段抽样
在复杂的、大规模的市场调查中,调查单位不是一次性直接抽取到的,而是采取多阶段抽取办法
先抽大的调查单元,在大单元中抽小单元,再在小单元中抽更小的单元
在组织形式上可以把二级抽样看成是分层抽样和整群抽样的综合
48
非概率抽样
按照非随机原则选取样本,并用这部分样本指标的调查结果,来判断总体指标的一种抽样类型。
应用范围:
1.当对调查的总体不够清楚,或者太复杂,不适于采取随机抽样时,那么,就需要用非随机抽样来抽出样本;
2.适用于经常性的调查和方便灵活的调查。
49
1. 任意抽样法
是指完全按调查者的意愿选取样本的一种方法;
适用范围
(1)可用于经常性的市场调查;
(2)可用于正式市场调查之前的试验调查;
(3)任意调查适用于同质总体。
50
优缺点
优点:方便、灵活,简便易行,及时取得所需资料,节约时间和费用成本低
缺点:因为个体差异性,抽样误差很大,结果不够可靠,应用价值较低
如进行现场访问,任意选择一群消费者或者营业人员进行谈话,了解他们对商品质量的看法或购买动向。
51
举例:在街头向过路行人做访问调查;上门对一栋大楼内的每个公司进行访问式调查;在柜台销售商品过程中向购买者做询问调查等(样本的选取完全随调查人员的方便而定)
理论依据:认为被调查的母体中的每一个个体都是相同的
注意:适用于非正式的探测性调查,或调查前的准备工作
52
2. 判断抽样法
又称立意抽样法,它是指由市场调查的专家依据自己的判断来选取样本的一种方法。
适用范围:总体的构成单位差异较大而样本数又很小的情况
53
优缺点
优点:按照调查人员的需要来选定样本,所以较好地满足了特殊的调查需要。
缺点:如果调查人员在选取样本时主观判断出现偏差,则判断抽样极易发生较大的抽样误差。
54
采用判断抽样法应注意的问题:
一要选好专家,
二要应极力避免挑选极端情况的样本,“多数型”、“平均型”
55
3.配额抽样法
按照一定的标准确定地区别和职业别等不同群体的样本配额,然后由调查人员主观地抽取配额内样本的方法。
配额抽样法和判断抽样法既有联系又有区别
二者的联系是:配额抽样实质是一种“分层”判断抽样。
二者的区别是:
一是抽取样本的方式不同:
a配额抽样是分别从各个控制特征的层次抽取若干个样本
b判断抽样是从总体中的某一层次中抽取若干个符合条件的典型样本
二是侧重点不同;
a配额注重“量”的分配
b判断抽样注重“质”的分配
三是复杂程度不同:
a配额抽样方法复杂精密
b判断抽样方法简便易行
56
适用范围:通常适用于小型的市场调查
步骤(1)选择“控制特征”作为细分总体的标准;
(2)将总体按“控制特征”组成若干子总体;
(3)决定各子总体样本的大小;
(4)选择样本单位。
57
4. 推荐抽样
“滚雪球”抽样
以若干个具有所需特征的人为最初的调查对象,然后依靠他们认识的合格调查对象,再由这些人提供第三批调查对象,以此类推,样本象滚雪球般由小变大的抽样方式
适用于调查范围内总体单位发生率或少见的抽样单位
优点:调查费用大大减少
风险来自于第一批名单的被调查者,因为他们之间相似性,样本不能很好代表总体
58
总结:非概率抽样的优缺点
优点:
费用低
时间少
合理运用,也能产生极具代表性的抽样结果
缺点:
不能估算出抽样误差
不知道抽样指标代表总体指标的程度
59
在线抽样方法
1. 在线随机拦截
依赖于对网站访问者的随机选择
2. 邀请在线抽样
3. 在线固定样本组抽样
回复率极高,确保最终抽样结果能够比较准确代表总体
60
二、确定样本容量
想知道美国员工在工作时间穿商务休闲装的百分比是多少?
在纽约华尔街路口,便利抽样方式询问
5000名是否可以代表美国有所员工?
10000名是否可以代表美国有所员工?
——不管样本多大,因抽样方法问题而对总体不具有代表性
只有随机样本才能真正代表总体;样本容量会影响样本结论的精确性
61
大容量偏见:错误认为样本容量决定了样本代表性
抽样误差:样本选择方法、样本容量造成的误差
非抽样误差:
问题陈述错误、访问倾向、分析错误导致的误差
62
确定样本容量应考虑的因素
1. 总体差异程度
2. 允许抽样误差
3. 调查结果可靠程度,即置信度或置信水平
4. 抽样方法
不重复抽样比重复抽样需要样本单位数少一些
5. 抽样组织形式
类型抽样和等距抽样比简单随机抽样需要的样本数目少些
63
两种特殊情况下的样本容量确定
所有讨论确定样本容量的方法都包含一个假定:总体非常大
有时总体也会非常小,如B2B市场
小总体——样本超过总体规模的5%
样本容量公式根据有限乘数进行调整
64
2. 运用非概率抽样方法确定样本容量
样本容量决定了精确度,而不是样本代表性
抽样方法决定了样本代表性
权衡从样本中获得信息的利益与收集这些信息的成本——对于非概率抽样而言,样本容量的确定是基于管理者对信息价值的判断,而不是期望的精确度及其相关成本
65。