第五章 抽样设计技术
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3、选择抽样框和抽取样本 4、评估样本正误——检验样本的代表性 5、收集样本资料 6、计算样本指标,推断总体指标。 常用的样本指标和总体指标有平均数、成 数、方差和标准差等。 (二)应用范围P117
三、随机抽样 随机抽样是指按照一定程序,遵循随机原则, 从总体中抽出一部分个体组成样本,通过对样 本的研究达到从数量上认识总体的目的。 随机原则:指在样本抽取过程排除主观上有 意识的挑选中,保证总体中的所有个体都有同 等被抽中的机会。
(五)多阶段随机抽样(多级抽样) 步骤: 首先将调查总体各单位按一定标志分成若干集 体,作为抽样的第一级单位;在第一级被抽中 的单位中再抽出第二级单位,依此类推,直到 抽到样本分布的最基层。
四、非随机抽样调查 非随机抽样是指不按随机原则而由调查人员根 据调查目的和要求,主观地从总体中抽选样本 的抽样方式。 (一)任意非随机抽样(任意抽样、偶然抽样、 方便抽样) 是调查员按最方便的途径来选择样本的一种抽 样方式。“街头拦截”和“方位选择法”是两 种最常见的任意抽样方式。 (二)判断非随机抽样(目的抽样、主观抽样)
(一)简单随机抽样(单纯随机抽样)——最 基本的随机抽样方式 是按照随机原则,从总体中不加任何分组、划 类、排序等先行工作,直接地抽取样本。其特 点是每个样本被抽取的概率相等。 在市场调查中,简单随机抽样主要采取以下三 种方式: 1、抽签法。——适合于规模较小且个体之间 差异性较小的总体应用 2、掷骰子法。 3、随机乱数表法。
1、抽样误差的估算: (1)平均数指标的抽样误差 2 重复抽样时: x
n
X ——平均数的抽样误差
——总体标准差
n ——抽样单位数
总体标准差一般用样本方差代替。
不重复抽样时:
N n x ( ) n N 1
2
当很大时,上式可以写成:
x
(3)分层最低成本抽样法 N i S i / Ci 基本公式:
ni
S i ——第i层的标准差
(N S
i
i
/ Ci )
n
Ci ——第i层每一单位的调查费用
3、分层随机抽样的应用 适用于:总体单位数量较大,总体各单位之间 差异大且分布不均衡的总体抽样。 在以下几种情况下适合于采用分层随机抽样: (1)在对各类型的对象进行估计时; (2)为使调查组织实施有效方便; (3)为使样本更具代表性; (4)为提高估计量的精度。
(三)分层随机抽样(分类随机抽样、类型随机 抽样) 就是先将总体按一定的标志分层(类),然 后在各层(类)中采取单纯随机抽样或等距抽 样抽取样本的一种抽样方式。 1、分层抽样的注意事项: (1)要选择好分层的依据或标准。 (2)分层应使层内差异缩小,使层间差异增 大。 (3)分层不宜太多,以免失去层的特性,不 便于从每层中抽取样本。
《市场调查与预测》
第一章 抽样设计技术
市场调查按其调查范围可划分为以下类型: 全面市场调查(普查) 市场 调查 非全面市场调查 典型市场调查 重点市场调查
抽样市场调查
一、抽样调查的基本概念及类型 (一)基本概念 1、总体(全及总体):就是人们所想认识的 对象的全体。如某批产品、某类病人、某个生 产过程等。用N表示。 2、样本:(抽样总体、样本总体)是从全及 总体中抽选出来的所要调查的全部对象。用n 表示。 样本单位超过30个的称为大样本,在30个以下 的称为小样本。--**********************
五、抽样数目的确定 以简单随机抽样为基点,以最大允许误差为目 标,通过总体方差、置信度要求和最大允许误 差(精度)之间的关系来推导必要的调查单位 数目。 (一)标准差与方差 1、平均数指标的标准差(均方差) 2 ( x x ) ——标准差
n
总体方差:标准差的平方
2、抽样极限误差( x或 p 允许误差) (1)含义及计算公式 抽样极限误差:又称为允许误差,是指用样 本推断总体时,允许有多大范围的误差。 设 x、 p 分别表示抽样平均数与抽样成数的误 差范围,则 x | x X |
p | p P |
基于理论上的要求,抽样极限误差通常需要以 抽样平均误差 x或 p 为标准单位来衡量,把 极限误差 x 或 p 除以 x或 p ,得出相对数 , 表示误差范围为抽样平均误差的若干倍, 称 t 为概率度。 t
t t x
x
或 x t x 或 p t p
p
p
(三)必要抽样数目的确定P141-142
2
n (1 ) n N
(2)抽样成数的平均误差 重复抽样时: p(1 p) p n n ( p ——成数的抽样误差) 不重复抽样时:
p(1 p) N n) p(1 p) n p ( (1 ) n N 1 n N n
二、抽样调查的程序及应用范围 (一)抽样程序 1、确定调查总体(界定调查总体) 就是要清楚地说明研究对象的范围(时间、 地点、人物),如2011年6月,A市B区C街道 18-35岁青年对互联网的看法。 2、选择资料收集方式 资料收集方式对抽样过程有重要影响。例如采 用入户面访、电话调查、街上拦截还是网上调 查、邮寄调查对抽样结果都会有不同的影响。
准确的抽样框包括两个涵义:完整性和不重复 性。 常用的抽样框有:企业名单、电话簿、人员名 册等。
(三)抽样调查的类型
随机抽样
抽样 调查 非随机抽样
简单随机抽样 分层随机抽样 分(整)群随机抽样 等距随机抽样 多阶段随机抽样
任意非随机抽样 判断非随机抽样 配额非随机抽样
(三)配额非随机抽样(定额抽样)——应用 最广泛的方式之一 1、独立(单一变量) 控制配额非随机抽样 2、相互控制配额非随机抽样
(四)滚雪球抽样法——对所需认识的总体难以 把握时进行 步骤:1、选取少量样本。 2、对第一阶段的样本进行调查,然后请被 调查者推荐其他的调查对象,作为进一步调查的 样本; 3、对第二阶段的样本进行调查,然后再请被调 查者推荐第三阶段的调查对象。依此类推,直到 调查者认为满意的调查数量为止。 (五)自愿非随机抽样
2
(x x) n
2
2、成数指标的标准差
p(1 p)
(二)抽样误差( )
抽样误差被定义为抽样估计值与被估计的未知 的真实总体参数之差。 例如抽样平均数与总体平均数之差,抽样成数 与总体成数之差。
调查误差 抽样误差 代表性误差 系统性误差 实际误差
偶然误差
3、抽样单位:样本抽取过程中的单位形式。 例如,以家庭、班级、寝室为抽样单位。 4、抽样框:即抽样范畴,是指供抽样所用的 总体清单。 抽样框的数目应与抽样单位的层次相对应。 例如,要调查某大学学生上网情况,这时抽样 框就是该校全体大学生的花名册。 如果要调 查的是某专业一年级学生的上网情况,则某专 业一年级学生花名册就是抽样框。 。
(四)分群随机抽样(整群随机抽样、集团抽 样)—适用于大规模的市场调查 是将市场调查的总体按一定标准分为若干群, 然后再在其中随机抽取部分群体单位进行调查 的方式。 整群随机抽样最重要的特征是组建样本地多阶 段性。
分层随机抽样和分群随机抽样的比较: 分层随机抽样和分群随机抽样有类似的地方, 两者都是先将总体划分为若干个互相排斥的群, 然后采用某种随机抽样技术抽取所需样本。二 者的差别在于内容要求不同:分层随机抽样要 求所分各层之间具有差异性,分层内部的个体 具有相同性;分群随机抽样恰恰相反,要求各 群体之间具有相同性,每一群内部的个体具有 差异性。
适用对象:规模不大且总体中各个体之间特征 差异程度较小等情况的调查对象。 在抽样实践中很少单独运用,常常和其他方式 结合使用。
(二)等距随机抽样(机械抽样、系统随机抽 样) 具体步骤: 1、将总体中的个体按某种标志排列并且连续 编号; 对总体的排序根据排序的依据不同可分为 两种:随机排序和选择排序。 2、根据总体数和确定的样本数,计算抽样间 距R,若得到的数字是小数则四舍五入化成整 数。 抽样间距=总体数量(N)/样本数量(n)
2、分层抽样样本数量的决定方式 (1)分层比例抽样法——适合于各层之间的 标准差大致相近的总体 Ni 基本公式:
ni
N
n
—— n i 第i层抽出样本单位数目; —— N i 第i层的总单位数; —— N 总体单位数; —— n 样本数
(2)分层最佳抽样法Βιβλιοθήκη Baidu—适合于各层之间标 准差相差较大的总体 基本公式: n N i S i n i N i Si
3、在第一段距离内,随机抽取一个号码,作 为第一个样本单位; 4、将第一个样本单位的号码加上抽样距离, 得到第二个样本单位,以此类推,直到满足样 本容量。 注意:若遇到周期性的现象,应调整抽样间距, 使处于周期中各个位置的单位都有相同的机会 入选,或者用其他的抽样方法。 应用范围:P123
平均误差
我们通常所说的抽样误差,是专门指抽 样平均误差。 抽样平均误差:抽样平均数(或抽样成 数)的标准差,它是把样本指标同总体 指标的误差加以平均,反映抽样平均数 (或抽样成数)与总体平均数(或成数) 的平均误差程度。
抽样平均误差反映了样本的代表性,平均误差 越大,样本可能代表总体的真实性愈小,反之, 抽样误差越小,样本代表总体的真实性愈大。 影响抽样误差大小的因素主要有: (1)总体各单位之间的差异程度; (2)样本数目; (3)抽样方式。