抽样的基本概念与样本设计.pptx
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
定额抽样
第一阶段,给调查员指定不同类型的定额
例按性别、年龄、职业、收入等指标确定每类中的 被调查者定额。
第二阶段,调查员按方便抽样或判断抽样选取 样本单位。 优点:不用抽样框,以费用较低费用获得与总 体特征分布相似的样本。 缺点:不能获得估计的精度。
滚雪球抽样
先选择一些调查对象,访问这些调查者之后, 再请他们提供另外一些属于所研究的目标总体 的调查对象,对这些调查对象调查后,再由他 们按相同的要求提供新的调查对象,将这种过 程不断继续下去,直到完成规定的样本容量为 止。 适用于对稀少群体的调查(如私人汽车拥有者) 优点:能有效地找到符合要求的被调查者。
滚雪球样本(snowball sample)-先抽取少量 的样本,然后通过滚雪球的方式扩大。
方便抽样(任意抽样)
例
在入户调查中,调查员选择家中有人的住户; 没有认定被调查者身份的拦截式访问; 利用客户的名单进行调查; 将问卷登在宣传媒体上,被调查者自填后寄回。
特点
方便选样 样本的信息不适用于总体参数的推断。
例:百事可乐的免费品尝促销
非概率样本的种类
方便样本(convenience sample)-选择容易 接触的个体作为调查研究对象;
判断样本(judgmental sample)-根据研究 者的判断,选择"有代表性"或"典型性"的样本 单位;
定额样本(quota sample)-将总体分层并确 定每层应抽取的样本量,让调查员根据定额抽 样;
例:某市的市民评议
某市政府为了让市民对各政府部门工作 给予评估,决定在地方报纸上刊登调查 表, 然后根据寄回的调查表对各部门进行 排名。 请问这种做法可能带来哪些问题?
三、概率样本设计
概率样本设计(probability sample design)采取随机的办法,排除研究人员 主观因素的干扰,使样本总体中的每一 个成员都有一个事先确定好抽中概率。
判断抽样
调研者(通常是该领域的专家)根据主观经验 和判断,从总体中选择“平均”的或认为有代 表性的同时又容易取得的个体作为样本。
当总体变差较大,而样本容量又不可能大时, 判断抽样有可能比概率抽样提供更为准确的估 计。
判断抽样的精度主要取决于抽样者的经验,与 样本量关系不大。 缺点是不能获得估计值的精度。
总体
总体(population)是按照内容、范围和时间三 重标准定义的全部个体的集合。
目标总体(target population)是按照内容、范围 和时间三重标准定义的全部个体的集合。 抽样总体(sampling population)从中实际抽取样 本的所有个体的集合。
讨论:广州地铁顾客满意度研究的目标总体与 抽样总体?
样本设计
SAMPLE DESIGN
内容提要
1) 抽样的基本步骤 2) 非概率样本设计 3) 概率样本设计 4) 样本量的的确定 5) 回答率问题
一、抽样的基本概念
抽样(sampling)是根据一定的规则和程 序,从研究总体中抽取其中的一部分样 本的过程。
样本设计过程
1、定义总体 2、确定抽样框 3、确定抽样方法与技术 4、确定样本量 5、实施抽样过程
一级整群抽样-在抽中群组中抽取所有个体; 二级整群抽样-在抽中群组中抽取部分个体。 多级抽样-将总体分为多级群组,逐级抽样。
样本设计的选择
影响样本设计的因素主要有:
研究所处的阶段和数据的用途; 总体内部的同质性; 时间、经费和人力; 数据收集的方法; 其它实际考虑。
二、非概率样本设计
非概率样本设计(nonprobability sample design)事先并不确定每个样本 单位被抽中的概率。这种样本设计往往 无法排除研究人员偏好对抽样的影响, 也无法估算样本估计值的抽样误差。
讨论:网上消费者调查的样本设计
非概率样本的应用
该方法通常用于下列情况:
样本量规模很小时; 探索性研究或研究的初始阶段; 目标总体成员很少或很难寻找; 无法采用概率样本时。
为了确定某一个体是否属于抽样总体, 常有必要使用过滤问题。 除了某项研究的特殊要求以外,营销研 究通常要求研究对象:
过去3个月内没有接受任何产品或广告调查; 本人及家庭成员不在有关的公司工作。
例:(当代市场调研)表12-2,p240。
样本
样本(a sample)是从总体中抽取的、加 以研究和度量的部分个体的集合。 样本单位(a sampling unit)为抽样总体 中的基本成员单位。 统计指标(statistics)是总体参数的样本 估计值。 例:当代商城顾客满意度研究
比例分层抽样 非比例分层抽样
讨论
如果某校有1000名本科生,200名普通 硕士生和300名MBA学生,若要比较不 同学生之间的平均可支配收入,应采用 哪种抽样方法?其总的平均收入应如何 计算?
整群抽样
整群抽样(cluster sampling)是将总体 分为不同的群组,然后随机抽取一定数 量的群组作为样本。整群抽样可分为:
简单随机抽样 系统抽样 分层抽样 整群抽样
简单随机抽样
简单随机抽样(simple random sampling) 是最基本的概率抽样方法。 该抽样方法保证每一抽样单位都有相同 的非零抽中概率,并给出总体参数的自 加权估计值。
若总体为N,样本量为n,则每一抽样单 位的抽中概率:
p = n/N
系统抽样
系统抽样(systematic sampling)是随 机抽取第一个样本单位,然后每隔k个单 位抽取一个。
系统抽样时每个样本单位抽中的概率相 同,为1/k,通过系统抽样也可获得总 体参数的自加权估计值。 讨论:什么时候应避免采用系统抽样?
分层抽样
分层抽样(stratified sampling)时将总体 按某些重要特征分为数个层,各层之间既 不能有重复也不能有遗漏,然后用简单随 机抽样或系统抽样的办法从每层中抽取一 定数量的样本。
抽样框架
抽样框架(sampling frame)是抽样总体的可 操作性定义。在编制抽样框架时常见的问题如 下:
遗漏-遗漏部分样本单位; 聚堆-缺乏个体样本单位信息; 重复-同一样本单位重复出现; 混杂-抽样框架中包括部分非样本总体成员。
例:调查广州市所有的西饼店,用黄页的工商 业名单作抽样框
பைடு நூலகம் 过滤问题