现场实施操作手册之三现场实施的抽样_上_
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
在 现 实 生 活 中 !由 于 各 方 面 因 素 的 作 用 !调 查 结 果 总 会存在误差 " 通常 ! 调查误差分为两种主要类型 $
%! 抽样误差
指通过测量总体的部分单位 ! 而非总体的全部单位 ! 来估计总体特征所产生的误差 ! 形成原因在于所选择的特 定样本不能完美地代表总体 " 这是由于抽样的偶然性造成 的 %是 不 可 避 免 的 误 差 !其 大 小 与 样 本 的 大 小 %总 体 的 大 小 % 所研究的总体特征的变异性 % 抽样设计 % 估计方法等有 关"
:<<< 个电话号码中抽取 :< 个访问号码 ! 间距为 :<< ! 确 定
起点 ! 起点 ! 间距 0 后每 :<< 号码抽一访问号码 % 优ቤተ መጻሕፍቲ ባይዱ & 兼具操作的简便性和统计推断功能 ! 是目前最为广泛 运用的一种抽样方法 % 如果起点是随机确定的 ! 总体中单元排列是随机的 ! 等 距 抽 样 的 效 果 近 似 简 单 抽 样’与 简 单 抽 样 相 比 !在 一 定 条件下 ! 样本的分布较好 % 缺点 & 抽样间隔可能遇到总体中某种未知的周期性! 导致
" 市场研究 ! !""# ! $ !
理论与方法
本 ! 的真正平均值之间的变差 !
不愿正确回答误差 由于被访者为了给出一个社会能接受的答案 # 避免出 麻烦或取悦访问员等因素而有意答错造成 " 如很少使用电 脑的人故意回答经常使用电脑 ! 以上介绍了常见的误差分类及来源 " 需要留意的是误 差的来源是多方面的 " 在方案设计中应关注总误差的降低 而非某种类型误差的大小 ! 例如 " 如果一味为了降低抽样 误 差 加 大 样 本 量 "则 忽 视 了 样 本 增 大 后 "增 加 了 访 问 员 误 差 " 从而令总体误差增大 ! 非抽样误差比抽样误差危害更大 " 抽样误差是可以计 算的 " 有研究表明在总误差中往往非抽样误差占了主要部 分 ! 有些时候 " 有的调研方案会不惜增大某类型的误差来 减少总误差 ! 总 的 来 说 "普 查 不 存 在 抽 样 误 差 "但 可 能 存 在 较 大 的 非抽样误差 % 而抽样调查会产生抽样误差和非抽样误差 " 以下章节着重介绍抽样实施过程中如何控制质量 " 减少误 差!
# 由被访者引起的 " 包括 $
不能正确回答误差 ! 由于被访者不熟悉 # 劳累 # 厌烦 # 忘记问卷内容等因素引起 " 如被访者想不起一个月前看过 的杂志内容 !
$ ! !""#
!
市场研究
% $
理论与方法
目 ! 对描述性或因果性研究最好不要采用方便抽样 " 判断抽样 !"#$%&’() *+&,-.(%/ 指由专家判断而有目的地抽取他认为 # 有代表性的样 本 $% 例如 & 社会学家研究某国家的一般家庭情况时 ! 常以 专家判断方法挑选 # 中型城镇 $ 进行 ’ 也有家庭研究专家选 取某类家庭进行研究 ! 如 选 三 口 之 家 ! 子 女 正 在 上 学 的 0 ’ 在 探 索 性 研 究 中 !如 抽 取 深 度 访 问 的 样 本 时 ! 可 以 使 用 这 种方法 % 优点 & 适用于总体的构成单位极不相同而样本数很小 ! 同时 设计调查者对总体的有关特征具有相当的了解 ! 明白研究 的 具 体 指 向0的 情 况 下 !适 合 特 殊 类 型 的 研 究!如 产 品 口 味测 试 等 0 ’ 操 作 成 本 低 ! 方 便 快 捷 ! 在 商 业 性 调 研 中 较 多 用% 缺点 & 该类抽样结果受研究人员的倾向性影响大 ! 一旦主观 判 断 偏 差 !则 极 易 引 起 抽 样 偏 差 ’不 能 直 接 对 研 究 总 体 进 行推断 % 配额抽样 !1#2)+ *+&,-.(%0 指先将总体元素按某些控制的指标或特性分类 ! 然后 按方便抽样或判断抽样选取样本元素 % 相当于包括两个阶段的加限制的判断抽样 % 在第一阶 段需要确定总体中的特性 分 布 ! 控 制 特 征 0 ! 通 常 ! 样 本 中 具备这些控制特征的元素的比例与总体中有这些特征的 元 素 的 比 例 是 相 同 的 !通 过 第 一 步 的 配 额 !保 证 了 在 这 些 特征上样本的组成与总体的组成是一致的 % 在第二阶段 ! 按照配额来控制样本的抽取工作 ! 要求所选出的元素要适 合所控制的特性 % 例如 & 定点街访中的配额抽样 % 优点 & 适用于设计调查者对总体的有关特征具有一定的了 解 而 样 本 数 较 多 阶 情 况 下 !实 际 上 !配 额 抽 样 属 于 先 #分 层 $! 事先确定每层的样本量 0 再 # 判断 $! 在每层中 以 判 断 抽样 的 方 法 选 取 抽 样 个 体 0 ’ 费 用 不 高 ! 易 于 实 施 ! 能 满 足 总体比例的要求 % 缺点 & 容易掩盖不可忽略的偏差 % 滚雪球抽样 !3(245+-- *+&,-.(%0 指先随机选择一些被访者并对其实施访问 ! 再请他们 提供另外一些属于所研究目标总体的调查对象 ! 根据所形 成的线索选择此后的调查对象 % 第一批被访者是采用概率抽样得来的 ! 之后的被访者
!! 非抽样误差
指在所有调查活动过程中所产生的除去抽样误差以 外的所有误差 ! 主要是由于人为的差错造成的 " 其中的系 统误差对调查结果可能造成更大的影响 " 通常非抽样误差的产生与下列因素有关 $
" 不回答误差
当样本中的一些被调查对象不回答时 ! 就产生了不回 答误差 " 产生的原因主要是被访者拒绝回答 ! 如拒访等 " ! 或者不在现场 ! 如无 人 在 家 等 " " 不 回 答 的 结 果 使 得 最 后 的样本在大小与组成上与原始样本不同 ! 不回答误差可以 定 义 为 原 始 样 本 中 变 量 的 真 正 平 均 值 与 结 果 样 本 !纯 样
代用误差 调研问题所需信息与调研人员所收集的信息之间的 变差 " 如将希望收集如何选择品牌方面的信息误为对品牌 的偏好信息 ! 测量误差 调研问题所收集的信息与调研人员所采用的测量过 程所生成的信息之间的变差 " 如测量消费者的偏好误用了 测量概念的量表 ! 总体定义误差 调研问题相关的真正总体与调研定义的总体的变差 " 如希望了解某牌子在其使用消费者心目中的地位 " 误定义 为同类产品所有使用者都要调查 ! 抽样框误差 由调研人员定义的总体与所使用的抽样框隐含的总 体之间的变差 " 如使用电话号码簿作为抽样框代表所有消 费 者 "但 实 际 上 有 些 号 码 未 登 记 或 已 搬 迁 " 令 部 分 消 费 者 实际并不包括在原定抽样框中 ! 数据分析误差 由问卷的原始数据转换成调查结果时产生的误差 " 如 错用统计方法等 !
二 !常用的抽样方法
%! 非概率抽样 &’()*+,(-.-/0/12 3.4+0/)56
又称非随机抽样 " 指根据一定主观标准抽取样本 " 令 总体中每个个体的被抽取不是依据其本身的机会 " 而是完 全决定于调研者的意愿 ! 其特点为不具有从样本推断总体的功能 " 但能反映某 类群体的特征 " 是一种快速 # 简易且节省的数据收集方法 ! 当研究者对总体具有较好的了解时可以采用此方法 " 或是 总体过于庞大 # 复杂 " 采用概率方法有困难时 " 可以采用非 概率抽样来避免概率抽样中容易抽到实际无法实施或 & 差 ’ 的样本 " 从而避免影响对总体的代表度 ! 常用的非概率抽样方法有以下四类 $ 方便抽样 "#$%&’%(’%)’ *+,-.(%/!
理论与方法
现场实施操作手册之三
现 场 实 施 的 抽 样
# 北京环亚市场研究社
王文利
!上"
! 二 " 误差的概念
一 !抽样与误差的概念
! 一 " 抽样的概念
在大部分调查活动中 ! 需要从调研总体中抽选出一部 分要素作为样本 ! 对样本进行调查 ! 并根据结果推断总体 ! 此种对样本的抽选过程即为抽样 " 与抽样调查对应的是普查 ! 对总体的所有单位展开调 查 " " 一般来说 ! 在理想状态下 ! 普查不受抽样误差影响且 能够得到最为全面的信息 " 但是完成一项普查需要的时间 长 !可 能 影 响 最 终 得 到 数 据 的 可 比 性 #需 要 动 用 巨 大 的 人 力 ! 可能导致较高的非抽样误差 # 涉及费用高 " 相对而言 ! 通过严密的设计和实施控制 ! 抽样调查也可用相对低廉的 费用获得比较准确的相近似的数据 " 随着统计学的发展 ! 我们可以通过运用科学方法抽取 样本 ! 结合统计分析方法 ! 获知可以推断总体情况的信息 " 目 前 !一 般 的 市 场 调 查!包 括 商 业 和 非 商 业"大 都 采 用抽样调查的方法进行 ! 也有的采用普查与抽样调查相结 合的方法进行 " 例如在企业调查中 ! 通常针对研究范畴内 的极大型企业进行普查 ! 而对于中小型企业则采用抽样调 查的方法 "
" 回答误差
回答误差是由于被访者给出了不正确的回答 " 或者是 由于他们的回答被错误录入或分析错了而引起的 " 可以定 义为结果样本 " 纯样本 ! 中 变 量 的 真 正 的 平 均 值 与 由 调 研 结果中得到的观测平均值之间的变差 " 通常由调研人员 # 访问员和被访者三方面引起 !
! 由调研人员引起的 " 包括 $
" 由访问员引起的 " 包括 $
问答误差 在提问或追问的情形下产生 " 如未原话照读或追问不 当! 记录误差 在听 # 理解 # 记录被访者答案时因曲解原意而产生 " 如 被访者给出中间答案 " 而访问员误记录为肯定答案 ! 欺骗误差 由于伪造部分或全部答案造成 !
指 根 据 调 查 者 的 方 便 选 取 的 样 本 "以 无 目 标 #随 意 的 方式进行 ! 例如 $ 街头 拦 截 访 问 " 看 到 谁 就 访 问 谁 ! % 个 别 入户项目谁开门就访问谁 ! 优点 $ 适 用 于 总 体 中 每 个 个 体 都 是 &同 质 ’的 "最 方 便 #最 省 钱 % 可以在探索性研究中使用 " 另外还可用于小组座谈会 # 预测问卷等方面的样本选取工作 ! 缺点 $ 抽样偏差较大 " 不适用于要做总体推断的任何民意项
都属于非概率抽样 ! 此类被访者彼此之间较为相似 % 例如 & 如在目前中国的小轿车车主等 % 优点 & 可以根据某些样本特征对样本进行控制 ! 适用寻找一 些在总体中十分稀少的人物 % 缺点 & 有选择偏差 ! 不能保证代表性 %
!! 概率抽样 %&’()*)+,+-. /*01,+234
又 称 随 机 抽 样 !指 在 总 体 中 排 除 人 的 主 观 因 素 !给 予 每一个体一定的抽取机会的抽样 % 其 特 点 为 !抽 取 样 本 具 有 一 定 的 代 表 性 !可 以 从 调 查 结果推断总体 ’ 操作比较复杂 ! 需要更多的时间 ! 而且往往 需要更多的费用 % 常用的有以下六种类型 & 简单抽样 !3.&,-’ *+&,-.(%0 即简单随机抽样 ! 指保证大小为 ( 的每个可能的样本 都有相同的被抽中的概率 % 例如 & 按照 # 抽签法 $(# 随机表 $ 法抽取访问对象 ! 从单位人名目录中抽取对象 % 优点 & 随 机 度 高 !在 特 质 较 均 一 的 总 体 中 !具 有 很 高 的 总 体 代 表 度 ’是 最 简 单 的 抽 样 技 术 !有 标 准 而 且 简 单 的 统 计 公 式% 缺点 & 未使用可能有用的抽样框辅助信息抽取样本 ! 可能导 致 统 计 效 率 低 ’有 可 能 抽 到 一 个 #差 $的 样 本 !使 抽 出 的 样 本分布不好 ! 不能很好地代表总体 % 系统抽样 !36*)’&+).7 8+($2& *+&9:.(%0 将 总 体 中 的 各 单 元 先 按 一 定 顺 序 排 列 !并 编 号 !然 后 按照一定的规则抽样 % 其中最常采用的是等距离抽样 ! 即 根据总体单位数和样本单位数计算出抽样距离 ; 即相同的 间隔 0 ! 然后按相同的距离或间隔抽选样本单位 % 例如 & 从