市场调查研究中如何调查抽样
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
市场调查研究中如何调查抽样
前言
本文主要为介绍一般抽样理论,希望能让读者大略了解在调查研究中如何抽样。
同时本文内容也可作为市场研究公司定量研究培训的一个环节,掌握科学合理的抽样方法是减少调查的误差、提高样本的信度和效度的必要条件。
一、概率抽样
多数社会科学研究及市场研究关注的是研究总体的状况,而非样本的情况。
所以我们需要根据样本的研究结果通过统计推论来推测总体的情况。
抽样方法大体可以分成两种:概率抽样和非概率抽样。
概率抽样是随一定机率来抽样,而非概率抽样则不是,所以只有概率抽样法才能进行统计推论。
下面我主要介绍各种概率抽样方法和在进行统计推论时所产生的误差计算方法。
文章最后也略为介绍一些非概率抽样方法。
概率抽样的五个步骤:
1、界定总体。
清楚说明研究对象的范围,样本所得结果原则上只能推论到
这个总体。
2、制作抽样框。
搜集总体的所有名单,并保证其完整性和准确性。
3、根据研究的客观条件(人力、物力、财力和时间等)和能容忍的误差大小决定样本量。
4、抽取样本。
具体的抽样方法在下面会作详细介绍。
5、评估样本的代表性。
根据一些总体和样本都比较容易获得的资料进行比较,例如分析样本的年龄结构和总体年龄结构是否大致一样。
下面介绍一些具体的常用抽样方法:
简单随机抽样(SimpleRandomSampling)。
简单随机抽样是最为基本的概率抽样,它是其它抽样方法的基础。
它是一种特殊的等概率抽样方法,总体中每一个个体都有同等被选中的机会,而且样本的每个个体都是单独被抽取的。
简单随机抽样包括不回置方式(WithoutReplace)和回置方式(Replace)两种。
在社会调查研究的总体通常是非常大的(如以某个几十万人口城市的家庭为研究总体),所以没有必要采用回置方式。
在操作过程中,我们可以将调查总体的每个个案编号,通过查随机数表的方
法抽取一定比例的样本作为研究对象。
这种抽样方法是最简单最为基本的。
下面介绍简单随机抽样的误差计算方法。
我们已经知道,样本量越大就越有代表性,则抽样的误差会越小;而样本的同质性越高,则抽样误差也会越小。
那么,我们可以根据样本量和标准差的大小计算出抽样误差的大小。
值得一提的是,不同的调研内容有不同的计算误差公式,就市场研究而言,通常是“多主题调查”(如,既要调查某品牌的市场占有率,又要调查某产品的消费额等),那么我们可以选定一个我们认为最重要的研究变量作为计算抽样误差的依据。
例一:根据平均值计算抽样误差。
如果我们想调查某地某移动业务用户的月平均消费金额,我们可以用以下公式(95%的置信水平)
N=(1.96S/E)^2(其中N为样本量,S为标准差,E为抽样误差)如果将置信水平提高到99%,公式如下
N=(2.58S/E)^2
如上例,总体的标准差S是很难获得的,我们必须通过前人的相关研究结果进行计算。
这也恰好说明了为什么我们往往强调在进行调查研究前最好能充分了
解同类型的研究。
例二:根据百分比计算抽样误差,市场研究数据大多都是围绕百分比说明问题的(后面其它抽样方法的误差计算则主要介绍根据百分比的计算方法),如,市场占有率是百分之几、对某产品持满意态度的消费者占百分之几等。
我们可以用以下公式(95%的置信水平)
N={1.96[P(1-P)^1/2]/E}^2
如果将置信水平提高到99%,公式如下
N={2.58[P(1-P)^1/2]/E}^2
其中P是总体的百分比,这个我们也很难获得,实际计算中我们可取P=0.5,让样本量N最大。
系统随机抽样(Systematicrandomsampling)。
这种方法首先要将全部个案排列,按抽样比例分成间隔,并在第一个间隔内选取第一个个案,然后每经一个间隔就选取一个个案。
例如,我们在某地按照门牌号码从约10000户居民中抽取100户进行研究。
因此每100户就是一个间隔。
所以我们首先从第一个100户中随机抽取一户(假设位置在30),那么第二户的位置就应该在130,第三户位置
在230,如此类推。
可见这种方法的优点是比较省事,不需要每抽一个个案都查随机数表。
但在实际操作中我们要注意这种抽样可能出现的周期性问题。
如,我们每隔30户抽一户,如果大都抽取了处在街道拐角和地下首层的居民,他们对某些问题的看法可能有高度一致性,则不能有效代表总体态度。
所以采用这种抽样方法时,经过若干个间隔后,再用随机方式抽取个案,用新的秩序代替原来的秩序。
系统随机抽样的误差计算可以采用简单随机抽样公式。
分层随机抽样(Stratifiedrandomsampling)。
分层抽样就是先将总体按照一种或几种特征分为几个子总体,每个子总体称为一层,然后从每层中随机抽取样本。
它的优点是1、当一个总体内部分层明显时,能克服简单随机抽样的缺点。
例如某类产品的购买者男性比例为75%,女性比例为25%,如果我们需要抽取100个个案,则按照这个比例分配样本:男性75人,女性25人,从而改善了样本的代表性;2、由于我们将一个内部差异很大的总体分成内部差异较小的子总体,能提高研究精度。
在样本量大小相等的情况下,分层随机抽样的误差一般会小于简单随机抽样。
分层随机抽样公式(95%置信水平)
E=(1.96A/N)^1/2
A=[∑nipi(1-pi)]/N
其中ni为某层的样本量,pi为某层的目标量的百分比。
整群抽样(Clustersampling)。
整群抽样是将总体按照某中标准划分为若干个子群体,每个子群为一个抽样单位,对随机抽取的子群内所有的个体进行调查研究。
与分层抽样不同的是,整群抽样目的是令子群体间的同质性较强而子群内部的差异较大。
它的优点在于通过转换抽样单位扩大抽样的应用范围,并节省人力物力。
例如,我们要对某城市家庭进行研究,计划抽取300-400户。
按照简单随机抽样的方法,我们必须要获得整个城市按户的抽样框,这事实上是不太可能的。
但如果我们采用整群抽样的方法,在该城市抽取若干个居委会,再对居委会辖下的所有家庭进行调查,事情会变得比较简单。
因为获取一个城市所有居委会的名单要比获取家庭名单要容易得多。
整群抽样的缺点是往往样本分布不均匀,样本的代表性较差,同一大小的样本,整群抽样的误差要比简单随机抽样的误差大。
整群抽样的误差计算(95%置信水平)
E=(1.96A/N)^1/2
A=∑(pi-∑pi/N)/N
其中pi为某一子群的目标量的百分比。
多段抽样(Multi-stagesampling)。
多段抽样是社会调研和市场研究中经常使用的一种抽样方法。
我们可以首先抽取若干个集体,在从中抽取若干个个体作为样本。
例如,我们对某省的农民电信业务使用情况进行调查。
可以先从该省的众多地级市中抽取若干个,然后从地级市样本中抽取若干个县/区,在从县/区样本中抽取若干个行政村,最后从行政村样本中抽取一定比例的居民户作为最终样本。
这个方法可以节省人力物力,但由于每一段的抽样都会产生抽样误差,所以同样大小样本的代表性变低。
由于多段抽样的误差计算过程比较复杂,在实际操作中我们可以在简单随机抽样的公式中加入一个“设计效应”,根据经验抛大样本。
如下(95%置信水平) N={1.96[P(1-P)^1/2]/E}^2*K
K为“设计效应”,我们可以根据经验定为1.1或1.2等。
以上是主要的几种概率抽样的方法,在实际研究中,我们可以根据实际情况结合使用,以使用最经济的方法获得较准确的信息。
二、非概率抽样
非概率抽样由于每个个体进入样本的概率是未知的,所以理论上不能推论总的参数值。
但由于非概率抽样简单易行,成本较低,我们在进行一些探索性研究或者只求获得总体中某些倾向的情况下,往往采用非概率抽样。
偶遇抽样。
街头拦截访问就是一例。
主观抽样。
由研究人员主观认定哪些样本能代表总体,而“有目的地”选择样本。
市场研究中预约访问(包括座谈会)就是一种主观抽样。
滚雪球抽样。
先从几个合适的调查对象开始,通过他们的介绍获得更多的调查样本,这样一步步扩大样本范围。
下面我将几个在实际抽样过程的案例列举以供参考
如何采用电话系统进行随机抽样
采用电话访问是市场调查中一个比较常用的数据搜集方式。
相比起入户访问方法,电话访问有以下几个优点:1、时间成本、人力资源成本较低。
电话访问
免除了差旅路途之苦和实地入户操作中因门牌、地址、道路等问题造成的人力资源浪费,同时,一个访问员采用电话操作的“接触效率”数倍于入户访问;2、随机性强。
由于成本的原因,国内大多数市场研究公司在入户调查过程无法实现真正意义的“随机”(即预先搜集好完整的抽样框——被调查地区的所有住户的门牌号码),而我们却可以通过控制被调查区域的电话号码进行真正的“随机抽样”;3、便于监督控制,保证调查的质量。
一个15-20人的电话访问中心只需要2-3名QC督导监控,监控效果也优于实地入户。
当然,电话访问也有它的不足之处,例如问卷不宜过长,一些复杂的测试无法完成等。
由于本文的侧重关系,这里不作详细论述。
用于市场调查的电话随机抽样执行方法(当然,我们可以从电信部门购买该地区所有号码段的用户号码,但这绝对不利于成本控制):
1、向当地电话查询台获取该地区电话号码的所有“字头”,例如:广州市电话号码字头有“819、838、833、852……”。
2、EXCEL的随机数方式:=ROUND(RAND()*(1-XX)+XX,0).对该区电话号码后X 位进行随机数组合。
例如,广州电话号码段是以“819”为字头,广州市电话号
码总位数是8位,则我们需要随机组合后5位而形成一个完整号码:“819*****”。
通过MIC的EXCEL,我们可以完成此步骤。
具体运算公式为:“=ROUND(RAND()*(81900000-81999999)+81999999,0)。
3、向访问员分批次提供随机电话号码。
4、访问员用随机号拨号对方应答后,必须首先向对方重新该电话的号码、确定该号码是否为家庭用户、询问并记录该号码所属的区等。
根据在国内市场调研行内的经验,认为电话访问的方式有相当困难,其原因主要有:国内多数消费者由于教育程度普遍不高,从而限制了对问题的更直观理解;而往往国内企业所委托的调查大多内容“大而全”,相当复杂。
(当然,以上两个方面具有时间上的局限性,另外,随着国内主要城市的封闭性小区增多,对入户的成功率造成一定的影响,并在抽样产生了人为的区域性偏差,而电话访问则能较好地解决此一问题)。
具体关于“入户和电话方法的比较”可参考本人其他相关文章。