市场调查与分析抽样技术
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
包含概率与πPS抽样
霍维茨-汤普森估计量及其性质
n=2的严格πPS抽样
例:
n>2的严格πPS抽样
n>2的严格πPS抽样
n>2的两种非严格πPS抽样
分群随机抽样
分群随机抽样是把调查总体区分为若干群体,然 后以单纯随机抽样法从中抽取某些群体并对这些 群体进行普查的方法。
市场调查与分析抽样技 术
2020/8/3
抽样调查与普查比较
研究总体 调查总体 样本
普查
抽样调查:
费用少 时间快 非抽样误差少 存在理论上 的抽样误差
抽样方案的设计
所谓抽样方案的设计,就是指在保证抽样能满足 调查精度要求下,力求调查结果最经济、最有效。抽 样方案设计程序如下:
①明确调查的目的,确定所要估计的目标量。
对总体均值或总量的估计—分层随机抽样的方差估计
对总体比例的估计—估计
对总体比例的估计—无偏性
对总体比例的估计—方差
对总体比例的估计—方差估计
分层抽样与简单随机抽样比较
若
如果不考虑近似的因素
各层样本量的分配
比例分配—分配
比例分配—自加权样本
比例分配—方差及估计
比例分配—估计总体比例时的情形
非抽样误差包括引起了调查误差的其他所有因 素。非抽样误差的发生完全是由于调查程序设 计和执行上的错误和不足。非抽样误差被认为 产生于错误的定义、制表计划中的不完善、从 所有样本成员获得问答的失败、等等。
误差与精度
一次抽样误差: 平均实际误差: 均方误:
方差: 偏倚:
(随机变量) (不能反映误差大小)
什么是分层抽样和分层随机抽样
简单估计量及其性质
对总体均值或总量的估计—估计
对总体均值或总量的估计—无偏性
对总体均值或总量的估计—方差
对总体均值或总量的估计—方差估计
对总体均值或总量的估计—分层随机抽样的估计
对总体均值或总量的估计—分层随机抽样估计的无偏性
对总体均值或总量的估计—分层随机抽样的方差
Polize-Simmons校正方法
假设所有的访问是在除星期六、日之外的五个晚上进 行,只要我们在调查问卷中附带一个问题:“除星期六、 日之外,您在今晚之前四个晚上有几天在家?”通过这个 问题的回答,实际上了解被调查者晚上在家的频率( ) 的大致估计:
概率抽样方法
简单随机抽样 分层抽样 分群随机抽样 机械抽样 样本容量的确定
个数差异大,要求我们区别对待。 提高精度,要求知道所有辅助变量。
主要分类
放回来自百度文库等概率抽样
多项抽样与PPS抽样
多项抽样的实施
多项抽样的实施
汉森-赫维茨估计量及其性质
汉森-赫维茨估计量及其性质
不放回不等概率抽样
包含概率与πPS抽样 霍维茨-汤普森估计量及其性质 n=2的严格πPS抽样 n>2的严格πPS抽样 n>2的两种非严格πPS抽样
逆抽样方法
特征单元比例很小时可采用逆抽样
样本含量为n的概率是:
求出所需样本的平均含量? 是P的无偏估计
分层抽样
分层抽样是对所要认识的总体,利用已知总体 有关调查指标的信息,先依据某种标准把总体划分 若干层,然后在每一层中随机抽出一部分样本单位 构成样本的一种抽样方法。
分层抽样的特点和适用场合: ❖可以得到层的数据 ❖便于组织,方便实施管理 ❖样本更具代表性 ❖提高精度
最优分配—分配
最优分配—Neyman分配
最优分配—总体比例时的情形
子总体的估计
问题的提出
抽样单元可以按某种属性划分,例如:人可以按性别、职 业、年龄划分;企业按行业、规模等,感兴趣的类别称为 子总体。
子总体均值的估计
子总体总量的估计
4.4样本总量的确定
4.4.1影响样本总量的因素 目标量精度要求 样本分配 总费用要求 分层精度要求
费用 + 精度
n的增函数
n的减函数
估计总体均值或总和时的确定方法
设方差上限为V,则:
给定绝对误差d时,将: 代入有:
给定相对误差r时,将: 代入有:
总体方差和总体变异系数均需要估计
估计总体比例时样本量的确定
当待估计参数是P时,估计量是p。 第一种情形给定p绝对误差限d,则:
第三种情形,给定方差上限V 第四种情形,给定变异系数上限C
样本总量的确定
估计总体均值的情形
估计总体总量的情形
估计总体比例的情形
给定费用时样本总量的确定方法
若干进一步问题
多指标情形样本量的分配 最优分配法
查吉特法
耶茨法
事后分层
不等概率抽样
必要性和优点: 总体中个体对总体贡献的“不平等”要求样本
抽取时,也应该“不平等”。 在多阶抽样中,初级单元所含的次级单元
事先确定一个大于1的整数m,从总体中随机 地逐次抽取样本,直到出现第m个“废品”(或具 某特性的单元)为止。此时我们实际抽取得样本 容量n是一个随机变量。
估计量方差的估计及区间估计
总体比例的估计
对总体的描述
对总体的描述
估计量及性质
置信区间
样本量的确定
样本量确定的原则与主要考虑因素
简单随机抽样
从总体的N个单位中,以同等概率地 随机抽取n个单位,组成样本进行观测 ,以推断总体参数的抽样方法,称为简 单随机抽样。
简单估计及其无偏性
估计量的无偏性证明: 方差估计量:
方差的无偏估计量
令
确定样本容量
假设费用函数为: 设d是调查绝对精度,即
设r调查相对精度
逆抽样 (希缺项目抽样调查)
误差限与置信度
绝对误差限: 相对误差限:
无回答现象
例举二个纠正无回答现象的方法: ①对某些问题回答的数据以该问题回答数据的 平均值代替; ②从对某问题己回答的数据中,随机地抽取, 以此填补无回答的数据。
避免“无回答”现象方法
①提高问卷的回收率。 ②调整数据分析方法。 ③多次访问 ④Polize-Simmons校正
②明确调查对象及样本单位。 ③确定或构置抽样框。
④对主要调查指标的精度提出要求。 ⑤选择抽样方法。 ⑥确定样本含量,给出指标的估计式和抽样误差的估算式。 ⑦制定实施方案的具体办法和步骤。
调查误差来源
抽样误差是出于设计时有意识地只研究总体中 的一部分,从而在结果中出现的误差。抽样误 差本身并不是错误的结果,尽管在抽样设计时 ,判断上的错误可能导致更大的不必要的误差 。