抽样设计步骤
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2. 假如估计满意的顾客比率可能为70%,回 答率大约为70%,要求有95%的把握保证满 意率的误差不超过5个百分点, 请计算需要抽 取的样本量。
小结
抽样的基本步骤
总体?抽样框架?抽样方法?样本量?抽样
非概率样本设计
偶遇样本;主观样本;定额样本;滚雪球样本
概率样本设计
简单随机;系统;分层;整群
样本量的的确定
定额抽样
第一阶段,给调查员指定不同类型的定额
例按性别、年龄、职业、收入等指标确定每类中的 被调查者定额。
第二阶段,调查员按方便抽样或判断抽样选取 样本单位。 优点:不用抽样框,以费用较低费用获得与总 体特征分布相似的样本。 缺点:不能获得估计的精度。
滚雪球抽样
先选择一些调查对象,访问这些调查者之后, 再请他们提供另外一些属于所研究的目标总体 的调查对象,对这些调查对象调查后,再由他 们按相同的要求提供新的调查对象,将这种过 程不断继续下去,直到完成规定的样本容量为 止。 适用于对稀少群体的调查(如私人汽车拥有者) 优点:能有效地找到符合要求的被调查者。
经验法;统计法
回答率问题
趋势分析
Sampling (review)
Two major concerns
1. Cost
• Sample size • Method of data collection (phone, mail, personal • interview)
2. Information accuracy
参考文献
1. 麦克丹尼尔、盖兹著,范秀成等译:《当代市场 调》, 原书第4版, 第12-13章,2000,机械工业出版 社。
2. Malhotra, N. K. 1996. Marketing Research: An Applied Orientation, Chapters 11-12, pp.358-414. Upper Saddle River, NJ: Prentice Hall International, Inc.
抽样框架
抽样框架(sampling frame)是抽样总体的可 操作性定义。在编制抽样框架时常见的问题如 下:
遗漏-遗漏部分样本单位; 聚堆-缺乏个体样本单位信息; 重复-同一样本单位重复出现; 混杂-抽样框架中包括部分非样本总体成员。
例:调查广州市所有的西饼店,用黄页的工商 业名单作抽样框
过滤问题
样本设计
SAMPLE DESIGN
内容提要
1) 抽样的基本步骤 2) 非概率样本设计 3) 概率样本设计 4) 样本量的的确定 5) 回答率问题
一、抽样的基本概念
抽样(sampling)是根据一定的规则和程 序,从研究总体中抽取其中的一部分样 本的过程。
样本设计过程
1、定义总体 2、确定抽样框 3、确定抽样方法与技术 4、确定样本量 5、实施抽样过程
滚雪球样本(snowball sample)-先抽取少量 的样本,然后通过滚雪球的方式扩大。
方便抽样(任意抽样)
例
在入户调查中,调查员选择家中有人的住户; 没有认定被调查者身份的拦截式访问; 利用客户的名单进行调查; 将问卷登在宣传媒体上,被调查者自填后寄回。
特点
方便选样 样本的信息不适用于总体参数的推断。
决策的重要性; 研究的性质; 单位成本; 发生率和完成率; 其它。
可支配预算法
根据进行某项研究可支配的预算,在扣 除其他支出后,按单位样本的成本决定 样本量。
例:进行某项研究的总预算是50,000元, 研究设计、人员培训、问卷测试和数据 分析等其它费用共需10,000元,完成每 份调查问卷(含数据录入)的平均费用 是50元,请问可以抽取多大的样本?
系统抽样(systematic sampling)是随 机抽取第一个样本单位,然后每隔k个单 位抽取一个。
系统抽样时每个样本单位抽中的概率相 同,为1/k,通过系统抽样也可获得总 体参数的自加权估计值。 讨论:什么时候应避免采用系统抽样?
分层抽样
分层抽样(stratified sampling)时将总体 按某些重要特征分为数个层,各层之间既 不能有重复也不能有遗漏,然后用简单随 机抽样或系统抽样的办法从每层中抽取一 定数量的样本。
例:某市的市民评议
某市政府为了让市民对各政府部门工作 给予评估,决定在地方报纸上刊登调查 表, 然后根据寄回的调查表对各部门进行 排名。 请问这种做法可能带来哪些问题?
三、概率样本设计
概率样本设计(probability sample design)采取随机的办法,排除研究人员 主观因素的干扰,使样本总体中的每一 个成员都有一个事先确定好抽中概率。
比例分层抽样 非比例分层抽样
讨论
如果某校有1000名本科生,200名普通 硕士生和300名MBA学生,若要比较不 同学生之间的平均可支配收入,应采用 哪种抽样方法?其总的平均收入应如何 计算?
整群抽样
整群抽样(cluster sampling)是将总体 分为不同的群组,然后随机抽取一定数 量的群组作为样本。整群抽样可分为:
nc = nN/(N+n-1)
估计比例时样本量的确定
对于简单随机抽样:
1. 确定允许误差D, d = ±.05 2. 确定置信水平CL, CL = 95% 3. 确定与置信水平相应的z值, z = 1.96 4. 估计总体的发生率P, P = 0.64? 5. 计算所需样本量n, n = P(1-P) z2/d2 = 355 6. 当样本量超过总体的5%时, nc = nN/(N+n-1)
为了确定某一个体是否属于抽样总体, 常有必要使用过滤问题。 除了某项研究的特殊要求以外,营销研 究通常要求研究对象:
过去3个月内没有接受任何产品或广告调查; 本人及家庭成员不在有关的公司工作。
例:(当代市场调研)表12-2,p240。
样本
样本(a sample)是从总体中抽取的、加 以研究和度量的部分个体的集合。 样本单位(a sampling unit)为抽样总体 中的基本成员单位。 统计指标(statistics)是总体参数的样本 估计值。 例:当代商城顾客满意度研究
总体
总体(population)是按照内容、范围和时间三 重标准定义的全部个体的集合。
目标总体(target population)是按照内容、范围 和时间三重标准定义的全部个体的集合。 抽样总体(sampling population)从中实际抽取样 本的所有个体的集合。
讨论:广州地铁顾客满意度研究的目标总体与 抽样总体?
例:百事可乐的免费品尝促销
非概率样本的种类
方便样本(convenience sample)-选择容易 接触的个体作为调查研究对象;
判断样本(judgmental sample)-根据研究 者的判断,选择"有代表性"或"典型性"的样本 单位;
定额样本(quota sample)-将总体分层并确 定每层应抽取的样本量,让调查员根据定额抽 样;
确定样本量的统计学方法
对于概率样本可用统计公式计算所需样 本。这时样本量与下列因素有关:
样本设计类型; 要求的精度; 总体内部的同质性; 分组的详细程度。
估计均值时样本量的确定
对于简单随机抽样: 1. 确定允许误差D, d = ±$5.00 2. 确定置信水平CL, CL = 95% 3. 确定与置信水平相应的z值, z = 1.96 4. 确定总体的标准差s, s = 55 5. 计算所需样本量n, n = s2z2/d2 = 465 6. 当样本量超过总体的5%时,
• Sample representativeness • Respondent error • Administrative error
Basic questions
What kind of sample? How large should it be?
Sampling Problem
China Light considered offering customer consulting service in which the company would help to make homes more energy efficient. To decide how much customers would like this service, they mailed questionnaires to all of their 500,000 home customers together with February bill. About 25,000 households responded. The returned responses indicated a very high level of interest in the service. So China Light hired many service workers for heavy demand. However, actual demand turned out to be low. What happened?
一级整群抽样-在抽中群组中抽取所有个体; 二级整群抽样-在抽中群组中抽取部分个体。 多级抽样-将总体分为多级群组,逐级抽样。
样本设计的选择
影响样本设计的因素主要有:
研究所处的阶段和数据的用途; 总体内部的同质性; 时间、经费和人力; 数据收集的方法; 其它实际考虑。
四、确定样本量的经验方法
最简单的方法是根据研究的类型和经验, 以及以下因素确定样本量:
二、非概率样本设计
非概率样本设计(nonprobability sample design)事先并不确定每个样本 单位被抽中的概率。这种样本设计往往 无法排除研究人员偏好对抽样的影响, 也无法估算样本估计值的抽样误差。
讨论:网上消费者调查的样本设计
非概率样本的应用
该方法通常用于下列情况:
样本量规模很小时; 探索性研究或研究的初始阶段; 目标总体成员很少或很难寻找; 无法采用概率样本时。
简单随机抽样 系统抽样 分层抽样 整群抽样
简单随机抽样
简单随机抽样(simple random sampling) 是最基本的概率抽样方法。 该抽样方法保证每一抽样单位都有相同 的非零抽中概率,并给出总体参数的自 加权估计值。
若总体为N,样本量为n,则每一抽样单 位的抽中概率:
p = n/N
系统抽样
五、不回答问题
由于拒答、度量误差、数据处理误差等 因素,常常产生非抽样误差。在研究中 除了抽样误差以外,还应注意尽量减少 非抽样误差。
课堂讨论
1. 如果联想电脑公司委托你开展一项笔记本电 脑顾客满意度调查,请确定:
a. 目标总体和抽样总体? b. 抽样单位和抽样框架? d. 抽样方法及注意事项?
3. Kish, L. 1965. Survey Sampling. New York: John Wiley & Sons. 4. 袁方、王汉生,1997:《社会研究方法教程》第 七章,北京大学出版社。
生活中的辛苦阻挠不了我对生活的热 爱。20.11.1720.11.17Tuesday, November 17, 2020 人生得意须尽欢,莫使金樽空对月。02:02:5202:02: 5202:0211/17/2020 2:02:52 AM 做一枚螺丝钉,那里需要那里上。20. 11.1702 :02:52 02:02N ov-201 7-Nov-2 0 日复一日的努力只为成就美好的明天 。02:02:5202: 02:5202:02Tuesday, November 17, 2020 安全放在第一位,防微杜渐。20.11.1720.11.1702:02:5202: 02:52November 17, 2020 加强自身建设,增强个人的休养。2020年11月17日 上午2时 2分20.11.1720.11.17 精益求精,追求卓越,因为相信而伟 大。2020年11月17日 星期二 上午2时 2分52秒02:02:5220.11.17 让自己更加强大,更加专业,这才能 让自己 更好。2020年11月上 午2时2分20.11.1702:02Nove mber 17, 2020 这些年的努力就为了得到相应的回报 。2020年11月17日星 期二2时 2分52秒02:02:5217 November 2020 科学,你是国力的灵魂;同时又是社 会发展 的标志 。上午2时2分52秒上 午2时2分02:02:5220.11.17 每天都是美好的一天,新的一天开启 。20.11.1720.11.1702: 0202:02:5202: 02:52Nov-20 相信命运,让自己成长,慢慢的长大 。2020年11月17日星 期二2时 2分52秒Tues day, November 17, 2020 爱情,亲情,友情,让人无法割舍。20.11.172020年 11月17日星期 二2时2分52秒 20.11.17
判源自文库抽样
调研者(通常是该领域的专家)根据主观经验 和判断,从总体中选择“平均”的或认为有代 表性的同时又容易取得的个体作为样本。
当总体变差较大,而样本容量又不可能大时, 判断抽样有可能比概率抽样提供更为准确的估 计。
判断抽样的精度主要取决于抽样者的经验,与 样本量关系不大。 缺点是不能获得估计值的精度。
小结
抽样的基本步骤
总体?抽样框架?抽样方法?样本量?抽样
非概率样本设计
偶遇样本;主观样本;定额样本;滚雪球样本
概率样本设计
简单随机;系统;分层;整群
样本量的的确定
定额抽样
第一阶段,给调查员指定不同类型的定额
例按性别、年龄、职业、收入等指标确定每类中的 被调查者定额。
第二阶段,调查员按方便抽样或判断抽样选取 样本单位。 优点:不用抽样框,以费用较低费用获得与总 体特征分布相似的样本。 缺点:不能获得估计的精度。
滚雪球抽样
先选择一些调查对象,访问这些调查者之后, 再请他们提供另外一些属于所研究的目标总体 的调查对象,对这些调查对象调查后,再由他 们按相同的要求提供新的调查对象,将这种过 程不断继续下去,直到完成规定的样本容量为 止。 适用于对稀少群体的调查(如私人汽车拥有者) 优点:能有效地找到符合要求的被调查者。
经验法;统计法
回答率问题
趋势分析
Sampling (review)
Two major concerns
1. Cost
• Sample size • Method of data collection (phone, mail, personal • interview)
2. Information accuracy
参考文献
1. 麦克丹尼尔、盖兹著,范秀成等译:《当代市场 调》, 原书第4版, 第12-13章,2000,机械工业出版 社。
2. Malhotra, N. K. 1996. Marketing Research: An Applied Orientation, Chapters 11-12, pp.358-414. Upper Saddle River, NJ: Prentice Hall International, Inc.
抽样框架
抽样框架(sampling frame)是抽样总体的可 操作性定义。在编制抽样框架时常见的问题如 下:
遗漏-遗漏部分样本单位; 聚堆-缺乏个体样本单位信息; 重复-同一样本单位重复出现; 混杂-抽样框架中包括部分非样本总体成员。
例:调查广州市所有的西饼店,用黄页的工商 业名单作抽样框
过滤问题
样本设计
SAMPLE DESIGN
内容提要
1) 抽样的基本步骤 2) 非概率样本设计 3) 概率样本设计 4) 样本量的的确定 5) 回答率问题
一、抽样的基本概念
抽样(sampling)是根据一定的规则和程 序,从研究总体中抽取其中的一部分样 本的过程。
样本设计过程
1、定义总体 2、确定抽样框 3、确定抽样方法与技术 4、确定样本量 5、实施抽样过程
滚雪球样本(snowball sample)-先抽取少量 的样本,然后通过滚雪球的方式扩大。
方便抽样(任意抽样)
例
在入户调查中,调查员选择家中有人的住户; 没有认定被调查者身份的拦截式访问; 利用客户的名单进行调查; 将问卷登在宣传媒体上,被调查者自填后寄回。
特点
方便选样 样本的信息不适用于总体参数的推断。
决策的重要性; 研究的性质; 单位成本; 发生率和完成率; 其它。
可支配预算法
根据进行某项研究可支配的预算,在扣 除其他支出后,按单位样本的成本决定 样本量。
例:进行某项研究的总预算是50,000元, 研究设计、人员培训、问卷测试和数据 分析等其它费用共需10,000元,完成每 份调查问卷(含数据录入)的平均费用 是50元,请问可以抽取多大的样本?
系统抽样(systematic sampling)是随 机抽取第一个样本单位,然后每隔k个单 位抽取一个。
系统抽样时每个样本单位抽中的概率相 同,为1/k,通过系统抽样也可获得总 体参数的自加权估计值。 讨论:什么时候应避免采用系统抽样?
分层抽样
分层抽样(stratified sampling)时将总体 按某些重要特征分为数个层,各层之间既 不能有重复也不能有遗漏,然后用简单随 机抽样或系统抽样的办法从每层中抽取一 定数量的样本。
例:某市的市民评议
某市政府为了让市民对各政府部门工作 给予评估,决定在地方报纸上刊登调查 表, 然后根据寄回的调查表对各部门进行 排名。 请问这种做法可能带来哪些问题?
三、概率样本设计
概率样本设计(probability sample design)采取随机的办法,排除研究人员 主观因素的干扰,使样本总体中的每一 个成员都有一个事先确定好抽中概率。
比例分层抽样 非比例分层抽样
讨论
如果某校有1000名本科生,200名普通 硕士生和300名MBA学生,若要比较不 同学生之间的平均可支配收入,应采用 哪种抽样方法?其总的平均收入应如何 计算?
整群抽样
整群抽样(cluster sampling)是将总体 分为不同的群组,然后随机抽取一定数 量的群组作为样本。整群抽样可分为:
nc = nN/(N+n-1)
估计比例时样本量的确定
对于简单随机抽样:
1. 确定允许误差D, d = ±.05 2. 确定置信水平CL, CL = 95% 3. 确定与置信水平相应的z值, z = 1.96 4. 估计总体的发生率P, P = 0.64? 5. 计算所需样本量n, n = P(1-P) z2/d2 = 355 6. 当样本量超过总体的5%时, nc = nN/(N+n-1)
为了确定某一个体是否属于抽样总体, 常有必要使用过滤问题。 除了某项研究的特殊要求以外,营销研 究通常要求研究对象:
过去3个月内没有接受任何产品或广告调查; 本人及家庭成员不在有关的公司工作。
例:(当代市场调研)表12-2,p240。
样本
样本(a sample)是从总体中抽取的、加 以研究和度量的部分个体的集合。 样本单位(a sampling unit)为抽样总体 中的基本成员单位。 统计指标(statistics)是总体参数的样本 估计值。 例:当代商城顾客满意度研究
总体
总体(population)是按照内容、范围和时间三 重标准定义的全部个体的集合。
目标总体(target population)是按照内容、范围 和时间三重标准定义的全部个体的集合。 抽样总体(sampling population)从中实际抽取样 本的所有个体的集合。
讨论:广州地铁顾客满意度研究的目标总体与 抽样总体?
例:百事可乐的免费品尝促销
非概率样本的种类
方便样本(convenience sample)-选择容易 接触的个体作为调查研究对象;
判断样本(judgmental sample)-根据研究 者的判断,选择"有代表性"或"典型性"的样本 单位;
定额样本(quota sample)-将总体分层并确 定每层应抽取的样本量,让调查员根据定额抽 样;
确定样本量的统计学方法
对于概率样本可用统计公式计算所需样 本。这时样本量与下列因素有关:
样本设计类型; 要求的精度; 总体内部的同质性; 分组的详细程度。
估计均值时样本量的确定
对于简单随机抽样: 1. 确定允许误差D, d = ±$5.00 2. 确定置信水平CL, CL = 95% 3. 确定与置信水平相应的z值, z = 1.96 4. 确定总体的标准差s, s = 55 5. 计算所需样本量n, n = s2z2/d2 = 465 6. 当样本量超过总体的5%时,
• Sample representativeness • Respondent error • Administrative error
Basic questions
What kind of sample? How large should it be?
Sampling Problem
China Light considered offering customer consulting service in which the company would help to make homes more energy efficient. To decide how much customers would like this service, they mailed questionnaires to all of their 500,000 home customers together with February bill. About 25,000 households responded. The returned responses indicated a very high level of interest in the service. So China Light hired many service workers for heavy demand. However, actual demand turned out to be low. What happened?
一级整群抽样-在抽中群组中抽取所有个体; 二级整群抽样-在抽中群组中抽取部分个体。 多级抽样-将总体分为多级群组,逐级抽样。
样本设计的选择
影响样本设计的因素主要有:
研究所处的阶段和数据的用途; 总体内部的同质性; 时间、经费和人力; 数据收集的方法; 其它实际考虑。
四、确定样本量的经验方法
最简单的方法是根据研究的类型和经验, 以及以下因素确定样本量:
二、非概率样本设计
非概率样本设计(nonprobability sample design)事先并不确定每个样本 单位被抽中的概率。这种样本设计往往 无法排除研究人员偏好对抽样的影响, 也无法估算样本估计值的抽样误差。
讨论:网上消费者调查的样本设计
非概率样本的应用
该方法通常用于下列情况:
样本量规模很小时; 探索性研究或研究的初始阶段; 目标总体成员很少或很难寻找; 无法采用概率样本时。
简单随机抽样 系统抽样 分层抽样 整群抽样
简单随机抽样
简单随机抽样(simple random sampling) 是最基本的概率抽样方法。 该抽样方法保证每一抽样单位都有相同 的非零抽中概率,并给出总体参数的自 加权估计值。
若总体为N,样本量为n,则每一抽样单 位的抽中概率:
p = n/N
系统抽样
五、不回答问题
由于拒答、度量误差、数据处理误差等 因素,常常产生非抽样误差。在研究中 除了抽样误差以外,还应注意尽量减少 非抽样误差。
课堂讨论
1. 如果联想电脑公司委托你开展一项笔记本电 脑顾客满意度调查,请确定:
a. 目标总体和抽样总体? b. 抽样单位和抽样框架? d. 抽样方法及注意事项?
3. Kish, L. 1965. Survey Sampling. New York: John Wiley & Sons. 4. 袁方、王汉生,1997:《社会研究方法教程》第 七章,北京大学出版社。
生活中的辛苦阻挠不了我对生活的热 爱。20.11.1720.11.17Tuesday, November 17, 2020 人生得意须尽欢,莫使金樽空对月。02:02:5202:02: 5202:0211/17/2020 2:02:52 AM 做一枚螺丝钉,那里需要那里上。20. 11.1702 :02:52 02:02N ov-201 7-Nov-2 0 日复一日的努力只为成就美好的明天 。02:02:5202: 02:5202:02Tuesday, November 17, 2020 安全放在第一位,防微杜渐。20.11.1720.11.1702:02:5202: 02:52November 17, 2020 加强自身建设,增强个人的休养。2020年11月17日 上午2时 2分20.11.1720.11.17 精益求精,追求卓越,因为相信而伟 大。2020年11月17日 星期二 上午2时 2分52秒02:02:5220.11.17 让自己更加强大,更加专业,这才能 让自己 更好。2020年11月上 午2时2分20.11.1702:02Nove mber 17, 2020 这些年的努力就为了得到相应的回报 。2020年11月17日星 期二2时 2分52秒02:02:5217 November 2020 科学,你是国力的灵魂;同时又是社 会发展 的标志 。上午2时2分52秒上 午2时2分02:02:5220.11.17 每天都是美好的一天,新的一天开启 。20.11.1720.11.1702: 0202:02:5202: 02:52Nov-20 相信命运,让自己成长,慢慢的长大 。2020年11月17日星 期二2时 2分52秒Tues day, November 17, 2020 爱情,亲情,友情,让人无法割舍。20.11.172020年 11月17日星期 二2时2分52秒 20.11.17
判源自文库抽样
调研者(通常是该领域的专家)根据主观经验 和判断,从总体中选择“平均”的或认为有代 表性的同时又容易取得的个体作为样本。
当总体变差较大,而样本容量又不可能大时, 判断抽样有可能比概率抽样提供更为准确的估 计。
判断抽样的精度主要取决于抽样者的经验,与 样本量关系不大。 缺点是不能获得估计值的精度。