现场实施操作手册之三现场实施的抽样_上_

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

在现实生活中 !由于各方面因素的作用 !调查结果总会存在误差 " 通常 ! 调查误差分为两种主要类型 $
%! 抽样误差
指通过测量总体的部分单位 ! 而非总体的全部单位 ! 来估计总体特征所产生的误差 ! 形成原因在于所选择的特定样本不能完美地代表总体 " 这是由于抽样的偶然性造成的 %是不可避免的误差 !其大小与样本的大小 %总体的大小 % 所研究的总体特征的变异性 % 抽样设计 % 估计方法等有关"
:<<< 个电话号码中抽取 :< 个访问号码 ! 间距为 :<< ! 确定
起点 ! 起点 ! 间距 0 后每 :<< 号码抽一访问号码 % 优ቤተ መጻሕፍቲ ባይዱ & 兼具操作的简便性和统计推断功能 ! 是目前最为广泛运用的一种抽样方法 % 如果起点是随机确定的 ! 总体中单元排列是随机的 ! 等距抽样的效果近似简单抽样’与简单抽样相比 !在一定条件下 ! 样本的分布较好 % 缺点 & 抽样间隔可能遇到总体中某种未知的周期性! 导致
" 市场研究 ! !""# ! $ !
理论与方法
本 ! 的真正平均值之间的变差 !
不愿正确回答误差由于被访者为了给出一个社会能接受的答案 # 避免出麻烦或取悦访问员等因素而有意答错造成 " 如很少使用电脑的人故意回答经常使用电脑 ! 以上介绍了常见的误差分类及来源 " 需要留意的是误差的来源是多方面的 " 在方案设计中应关注总误差的降低而非某种类型误差的大小 ! 例如 " 如果一味为了降低抽样误差加大样本量 "则忽视了样本增大后 "增加了访问员误差 " 从而令总体误差增大 ! 非抽样误差比抽样误差危害更大 " 抽样误差是可以计算的 " 有研究表明在总误差中往往非抽样误差占了主要部分 ! 有些时候 " 有的调研方案会不惜增大某类型的误差来减少总误差 ! 总的来说 "普查不存在抽样误差 "但可能存在较大的非抽样误差 % 而抽样调查会产生抽样误差和非抽样误差 " 以下章节着重介绍抽样实施过程中如何控制质量 " 减少误差!
# 由被访者引起的 " 包括 $
不能正确回答误差 ! 由于被访者不熟悉 # 劳累 # 厌烦 # 忘记问卷内容等因素引起 " 如被访者想不起一个月前看过的杂志内容 !
$ ! !""#
!
市场研究
% $
理论与方法
目 ! 对描述性或因果性研究最好不要采用方便抽样 " 判断抽样 !"#$%&’() *+&,-.(%/ 指由专家判断而有目的地抽取他认为 # 有代表性的样本 $% 例如 & 社会学家研究某国家的一般家庭情况时 ! 常以专家判断方法挑选 # 中型城镇 $ 进行 ’ 也有家庭研究专家选取某类家庭进行研究 ! 如选三口之家 ! 子女正在上学的 0 ’ 在探索性研究中 !如抽取深度访问的样本时 ! 可以使用这种方法 % 优点 & 适用于总体的构成单位极不相同而样本数很小 ! 同时设计调查者对总体的有关特征具有相当的了解 ! 明白研究的具体指向0的情况下 !适合特殊类型的研究!如产品口味测试等 0 ’ 操作成本低 ! 方便快捷 ! 在商业性调研中较多用% 缺点 & 该类抽样结果受研究人员的倾向性影响大 ! 一旦主观判断偏差 !则极易引起抽样偏差 ’不能直接对研究总体进行推断 % 配额抽样 !1#2)+ *+&,-.(%0 指先将总体元素按某些控制的指标或特性分类 ! 然后按方便抽样或判断抽样选取样本元素 % 相当于包括两个阶段的加限制的判断抽样 % 在第一阶段需要确定总体中的特性分布 ! 控制特征 0 ! 通常 ! 样本中具备这些控制特征的元素的比例与总体中有这些特征的元素的比例是相同的 !通过第一步的配额 !保证了在这些特征上样本的组成与总体的组成是一致的 % 在第二阶段 ! 按照配额来控制样本的抽取工作 ! 要求所选出的元素要适合所控制的特性 % 例如 & 定点街访中的配额抽样 % 优点 & 适用于设计调查者对总体的有关特征具有一定的了解而样本数较多阶情况下 !实际上 !配额抽样属于先 #分层 $! 事先确定每层的样本量 0 再 # 判断 $! 在每层中以判断抽样的方法选取抽样个体 0 ’ 费用不高 ! 易于实施 ! 能满足总体比例的要求 % 缺点 & 容易掩盖不可忽略的偏差 % 滚雪球抽样 !3(245+-- *+&,-.(%0 指先随机选择一些被访者并对其实施访问 ! 再请他们提供另外一些属于所研究目标总体的调查对象 ! 根据所形成的线索选择此后的调查对象 % 第一批被访者是采用概率抽样得来的 ! 之后的被访者
!! 非抽样误差
指在所有调查活动过程中所产生的除去抽样误差以外的所有误差 ! 主要是由于人为的差错造成的 " 其中的系统误差对调查结果可能造成更大的影响 " 通常非抽样误差的产生与下列因素有关 $
" 不回答误差
当样本中的一些被调查对象不回答时 ! 就产生了不回答误差 " 产生的原因主要是被访者拒绝回答 ! 如拒访等 " ! 或者不在现场 ! 如无人在家等 " " 不回答的结果使得最后的样本在大小与组成上与原始样本不同 ! 不回答误差可以定义为原始样本中变量的真正平均值与结果样本 !纯样
代用误差调研问题所需信息与调研人员所收集的信息之间的变差 " 如将希望收集如何选择品牌方面的信息误为对品牌的偏好信息 ! 测量误差调研问题所收集的信息与调研人员所采用的测量过程所生成的信息之间的变差 " 如测量消费者的偏好误用了测量概念的量表 ! 总体定义误差调研问题相关的真正总体与调研定义的总体的变差 " 如希望了解某牌子在其使用消费者心目中的地位 " 误定义为同类产品所有使用者都要调查 ! 抽样框误差由调研人员定义的总体与所使用的抽样框隐含的总体之间的变差 " 如使用电话号码簿作为抽样框代表所有消费者 "但实际上有些号码未登记或已搬迁 " 令部分消费者实际并不包括在原定抽样框中 ! 数据分析误差由问卷的原始数据转换成调查结果时产生的误差 " 如错用统计方法等 !
二 !常用的抽样方法
%! 非概率抽样 &’()*+,(-.-/0/12 3.4+0/)56
又称非随机抽样 " 指根据一定主观标准抽取样本 " 令总体中每个个体的被抽取不是依据其本身的机会 " 而是完全决定于调研者的意愿 ! 其特点为不具有从样本推断总体的功能 " 但能反映某类群体的特征 " 是一种快速 # 简易且节省的数据收集方法 ! 当研究者对总体具有较好的了解时可以采用此方法 " 或是总体过于庞大 # 复杂 " 采用概率方法有困难时 " 可以采用非概率抽样来避免概率抽样中容易抽到实际无法实施或 & 差 ’ 的样本 " 从而避免影响对总体的代表度 ! 常用的非概率抽样方法有以下四类 $ 方便抽样 "#$%&’%(’%)’ *+,-.(%/!
理论与方法
现场实施操作手册之三
现场实施的抽样
# 北京环亚市场研究社
王文利
!上"
! 二 " 误差的概念
一 !抽样与误差的概念
! 一 " 抽样的概念
在大部分调查活动中 ! 需要从调研总体中抽选出一部分要素作为样本 ! 对样本进行调查 ! 并根据结果推断总体 ! 此种对样本的抽选过程即为抽样 " 与抽样调查对应的是普查 ! 对总体的所有单位展开调查 " " 一般来说 ! 在理想状态下 ! 普查不受抽样误差影响且能够得到最为全面的信息 " 但是完成一项普查需要的时间长 !可能影响最终得到数据的可比性 #需要动用巨大的人力 ! 可能导致较高的非抽样误差 # 涉及费用高 " 相对而言 ! 通过严密的设计和实施控制 ! 抽样调查也可用相对低廉的费用获得比较准确的相近似的数据 " 随着统计学的发展 ! 我们可以通过运用科学方法抽取样本 ! 结合统计分析方法 ! 获知可以推断总体情况的信息 " 目前 !一般的市场调查!包括商业和非商业"大都采用抽样调查的方法进行 ! 也有的采用普查与抽样调查相结合的方法进行 " 例如在企业调查中 ! 通常针对研究范畴内的极大型企业进行普查 ! 而对于中小型企业则采用抽样调查的方法 "
" 回答误差
回答误差是由于被访者给出了不正确的回答 " 或者是由于他们的回答被错误录入或分析错了而引起的 " 可以定义为结果样本 " 纯样本 ! 中变量的真正的平均值与由调研结果中得到的观测平均值之间的变差 " 通常由调研人员 # 访问员和被访者三方面引起 !
! 由调研人员引起的 " 包括 $
" 由访问员引起的 " 包括 $
问答误差在提问或追问的情形下产生 " 如未原话照读或追问不当! 记录误差在听 # 理解 # 记录被访者答案时因曲解原意而产生 " 如被访者给出中间答案 " 而访问员误记录为肯定答案 ! 欺骗误差由于伪造部分或全部答案造成 !
指根据调查者的方便选取的样本 "以无目标 #随意的方式进行 ! 例如 $ 街头拦截访问 " 看到谁就访问谁 ! % 个别入户项目谁开门就访问谁 ! 优点 $ 适用于总体中每个个体都是 &同质 ’的 "最方便 #最省钱 % 可以在探索性研究中使用 " 另外还可用于小组座谈会 # 预测问卷等方面的样本选取工作 ! 缺点 $ 抽样偏差较大 " 不适用于要做总体推断的任何民意项
都属于非概率抽样 ! 此类被访者彼此之间较为相似 % 例如 & 如在目前中国的小轿车车主等 % 优点 & 可以根据某些样本特征对样本进行控制 ! 适用寻找一些在总体中十分稀少的人物 % 缺点 & 有选择偏差 ! 不能保证代表性 %
!! 概率抽样 %&’()*)+,+-. /*01,+234
又称随机抽样 !指在总体中排除人的主观因素 !给予每一个体一定的抽取机会的抽样 % 其特点为 !抽取样本具有一定的代表性 !可以从调查结果推断总体 ’ 操作比较复杂 ! 需要更多的时间 ! 而且往往需要更多的费用 % 常用的有以下六种类型 & 简单抽样 !3.&,-’ *+&,-.(%0 即简单随机抽样 ! 指保证大小为 ( 的每个可能的样本都有相同的被抽中的概率 % 例如 & 按照 # 抽签法 $(# 随机表 $ 法抽取访问对象 ! 从单位人名目录中抽取对象 % 优点 & 随机度高 !在特质较均一的总体中 !具有很高的总体代表度 ’是最简单的抽样技术 !有标准而且简单的统计公式% 缺点 & 未使用可能有用的抽样框辅助信息抽取样本 ! 可能导致统计效率低 ’有可能抽到一个 #差 $的样本 !使抽出的样本分布不好 ! 不能很好地代表总体 % 系统抽样 !36*)’&+).7 8+($2& *+&9:.(%0 将总体中的各单元先按一定顺序排列 !并编号 !然后按照一定的规则抽样 % 其中最常采用的是等距离抽样 ! 即根据总体单位数和样本单位数计算出抽样距离 ; 即相同的间隔 0 ! 然后按相同的距离或间隔抽选样本单位 % 例如 & 从