市场调研:第3章市场调查方式和抽样市场调查
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
东城 西城
朝阳
海淀 宣武 崇文 合计
20
20 10 10 100
60
60 20 20 200
20
20 20 20 100
100
100 50 50 400
注:各城区男女应各位一半
市区人口数 1689.42 4599.08
每层占全部 的% 3.3 9.0
应抽取的城 市数 2 5
三
四 五 合计
49
156 435 655
3822.44
12772.74 28066.03 50958.71
7.5
25.1 55.1 100.0
4
12 27 50
分层指标的选取
研究者一般是选择与调查中欲测量的变量高度相 关的指标,即把对所要研究的变量有重大影响的 因素作为分层变量 分层的标准:同一层内的个体有较好的同质性、 不同层间的元素具有明显的异质性
例:为了了解参加某种知识竞赛的1000名学生的成绩, 应采用什么样的抽样方法恰当?(样本量为50个) 解:适宜选用系统抽样,抽样过程如下: (1)随机将这1000名学生编号为1,2,3,……, 1000(比如可以利用准考证号)。 (2)将总体按编号顺序平均分成50部分,每部分包含 20个个体。 (3)在第一部分的个体编号1,2,……,20中,利用 简单随机抽样抽取一个号码,比如是18。 (4)以18为起始号,每间隔20抽取一个号码,这样就 得到一个容量为50的样本:18,38,58,……,978, 998。
收入水平
高
性别 50以上 年龄 25-50 男 6 13 女 19 37 男 4 9
中
女 13 26 男 2 3
低
女 6 12
合计 50 100
25以下
合计 合计
6
25 100
19
75
5
18 70
13
52
2
7 30
5
23
50
200
城区、年龄和性别的交叉控制配额
城区 年龄 18-28 20 20 29-35 20 20 36-42 10 10 合计 50 50
抽样的基本术语
抽样框
抽样框指的是包含所有抽样单元的详细名单、地图或其 他形式的资料。在抽样框中,每个抽样单元都有自己的 对应位置或顺序,通常通过编号来实现。 例如:要在全国抽取一部分城镇家庭进行调查,可先抽 取若干个省、然后在抽取到的省抽取若干个城镇、最后 在从这些抽取到的城镇中抽取家庭样本。全部省的名单、 抽中省的所有城镇的名单、抽中城镇中所有家庭的名单 都是抽样框
城区 性别 年龄
东城 50
西城 50 男 200
朝阳 100
海淀 100
宣武 50 女 200
崇文 50
合计 400
400人 36-42岁 100 400人
18-28岁 100
29-35岁 200
职业
公务员
80
企业管理
60
公司行政
140
科教卫事 业单位
80
大学生
400人 40
交叉控制配额抽样
交叉控制配额抽样是要求样本按比例同时满足几个配额 条件,并能够保证任意配额指标与总体的分布相一致。 以年龄、性别与收入水平作为交叉控制因素进行配额抽 样的样本配额分布
任意抽样法,或方便抽样:研究者把一定时间内 一定环境里最容易接触到的人作为样本的方法, 如街头拦访 判断抽样法,或判断抽样:根据自己的知识经验 或技能等有目的的选择样本 配额抽样法: 根据调查目的找出与研究目的关系 密切的特性作为配额指标,抽样时保证样本中具 有某种特性的比例与总体中具有这种特性的比例 一致
抽样的基本术语
总体与样本
总体是所研究调查对象的全体,样本是从总体中抽取的 部分个体,构成了调查的直接对象
参数与统计量
参数也叫总体指标或调查的目标量,是用来描述总体特 征的一些指标,是研究所要了解的最终目标。它是未知 的,需要通过样本数据来进行估计;统计量则是关于样 本中某一变量的描述,抽样调查的重要内容就是通过样 本统计量来推算总体的参数,从而达到由部分推知总体 的目的。常用的参数和统计量有平均数、百分比、标准 差、相关系数等
i 1 k
等额 样本 n
N2
n2
N
比例
Ni n1 n N
Nk
· · ·
nk
· · ·
最源自文库 n1
N
i
N i i2
2 i
n
分层比例抽样
先将总体按照相似性原则分为若干层,然后根据各层在 总体中所占的比重从层中抽取相应的样本组成研究样本。 分层抽样可以避免样本差异过大导致的抽样分布不准确。
总体群数R=16
样本群数r=4
样本容量
A
D E
B
C
J
M L
N P O I
L
P
n nd n p nl nh
F
G
H
K
H
D
整群抽样的划分标准
整群抽样与分层抽样类似,它们的第一步都是根 据某种标准将总体划分为一些子群,但两者分群 的原则完全不同。分层抽样在总样本中每层都有 自己的代表,因而它要求层的划分具有较高的代 表性,即各层间的差异性尽可能大,而层内的差 异性尽可能小;整群抽样则相反,要求群间的差 异尽可能小,而群内的差异尽可
3、分层随机抽样
分层抽样也称分类抽样,方法是将总体按照某些重要的 2· 指标分成若干个互不重叠、穷尽的子总体,使总体中的 每一个单位都属于且只属于一个子总体。这样的子总体 称为层或类,然后在每个子总体内分别抽样一个子样本, 各子样本综合成一个总样本
N1
总体
n1
n1 n2 nk n ni
配额抽样法
配额抽样法的基本步骤
选择控制特性作为分层标准 分层 确定各层样本额 配额指派
配额抽样法是在分层基础上进行的。配额抽样根 据其抽样方法可以分为
独立控制配额抽样 交叉控制配额抽样
独立控制配额抽样
比如:一项研究要调查400名北京市区18-42岁的白领阶层对时尚的看法,配额的重 要指标是城区、性别、年龄、职业。根据已知的资料得知总体中这四个指标的大致比 例,则400人的样板也应该与总体中各项指标的比例相一致。如下表
4、整群 抽 样 概 述
整群抽样是先将市场调查的总体划分为若干个群体,然 后以简单随机抽样的方法选取部分群体作为调查样本, 对群体内各个单位进行调查的一种随机抽样方法。整群 抽样适用于调查总体单位分布较分散并且无法确定分层 标准的大总体。当调查总体相当大时,可以进行逐级分 群,一直进行到单个群体的数目足够小时为止,然后从 所有的群中随机抽取一定的群作为调查对象实施调查。 整群抽样对总体推断的准确性较差。因而往往与其它方 法相结合使用。
ni Ni n N
总体N=10000
小学或以下10% 初中20% 大专以上30% 高中或中专40%
大专以上 3000人 N1
高中或中专 4000人 N2
初中 2000人 N3
小学或以下 1000人 N4
30 n1
40 n2
20 n3
10 n4
样本n=100人
pps抽样(Sampling with probability proportional to size)大小与规
抽样的基本术语
抽样误差和非抽样误差
由于总体中个体的差异性,在用样本统计量去推断总体的参 数时,总会存在误差,这种误差称为抽样误差。抽样误差是 衡量样本代表性强弱的标准。非抽样误差是指在抽样过程中 因为各种人为原因违反随机原则而产生的误差
样本容量
抽样误差
抽样方式
总体内 部差异
抽样的基本术语
5、多阶段抽样
多阶段抽样是指样本通过一次以上的抽样而得到样本的方法 总体N=10000 共有50个村
270人 200人 180人 170人 210人 190人 110人 180人 190人 210 人 20 人
200 人 20 人
170 人 20 人
190 人 20 人
110 人 20 人
样本n=100
案例
调查背景:为了解普通居民对某种新产品的接受程度, 需要在一个城市中抽选1000户居民开展市场调查,在每 户居民中,选择1名家庭成员作为受访者。 总体抽样设计:由于一个城市中居民的户数可能多达数百万,除
了一些大型的市场研究机构和国家统计部门之外,大多数企业都不 具有这样庞大的居民户名单。这种情况决定了抽样设计只能采取多 阶段抽选的方式。根据调查要求,抽样分为两个阶段进行,第一阶 段是从全市的居委会名单中抽选出50个样本居委会,第二阶段是从 每个被选中的居委会中,抽选出20户居民。
第三章
抽样设计
抽样设计将要解决的是调查谁的问题,即如何挑 选调查对象的问题。要解决包括选择哪一部分作 为调查对象,这部分应包含的个体有多少,用什 么样的方法进行选择,以及所选出来这一部分调 查对象与总体间的关系是什么等问题 抽样设计的假设:1部分是含于整体之中
2部分与整体具有相同的特征、规律、相互关系及变化 过程 3部分能够为研究者提供一个有关整体状态、态度、意 见和行为更加清晰的脉络
模成比例的不等概率抽样
指在总体中参照各单位的规模进行抽样,规模大 的被抽取的机会大,总体中每个个体被抽中的概 率与该个体的规模成正比的抽样。
1999年北京广播学院调查设计中国人民银行城镇储户调 查抽样方案中,第一阶段采用分层抽样的方法在655个城 市中随机抽取50个城市。首先,把全国655个城市按照 “城乡居民年末储蓄余额”、“年末市区人口数”、 “职工平均工资水平”、“社会消费品零售总额”、 “人口密度”这5个和储蓄行为紧密有关的指标把全部城 市分为5层,如表:
对居委会的抽选 从统计或者民政部门,我们可以获得一个城市的居委会 名单。将居委会编上序号后,用计算机产生随机数的方 法,可以简单地抽选出所需要的50个居委会。如果在居 委会名单中还包括了居委会户数等资料,则在抽选时可 以采用不等概率抽选的方法。 在居委会中的抽样 在选定了居委会之后,对居民户的抽选将使用居委会地 图来进行操作。此时,需要派出一些抽样员,到各居委 会绘制居民户的分布图,抽样员需要了解居委会的实际 位置、实际覆盖范围,并计算每一幢楼中实际的居住户 数。然后,抽样员根据样本量的要求,采用等距或者其 他方法,抽选出其中的若干户,作为最终访问的样本。
确定受访者 访问员根据抽样员选定的样本户,进行入户访问。 以谁为实际的被调查者,是抽样设计中最后一个 问题。如果调查内容涉及的是受访户的家庭情况, 则对受访者的选择可以根据成员在家庭生活中的 地位确定,例如,可以选择使用计算机最多的人、 收入最高的人、实际负责购买决策的人等等。
2.3 非随机抽样调查
简单随机抽样的方法
1、抽签法 2、随机数字表法
2、等距抽样
等距抽样是简单随机抽样的变种,又称为系统抽 样或机械抽样。它是先将总体各单位按照某一标 志排列,然后根据一定的抽样间距从总体中抽取 样本;或者将总体划分为若干类型,然后在各类 型中根据一定的抽样距离抽取样本的一种抽样方 法。 等距抽样是以总体的随机排列为前提的,如果总 体的排列出现规律性的分布时,而抽样间距又与 这种规律性重合时,等距抽样会出现极大的误差
置信度和置信区间 置信度是指总体参数落在由样本统计量所构造的 某一区间的概率 置信区间是指某一置信度下,样本统计量与总体 参数之间的误差范围
抽样的基本程序
明确研究的目的,确定研究所要估计的主要总体 参数 确定研究总体和调查总体 确定和构造抽样框:在确定调查总体和抽样单位 后,应将总体按照抽样单位划分为各部分,构成 抽样框 选择适当的抽样方法以及确定样本量的大小 制定抽样方案的具体实施细节
概率抽样和非概率抽样
概率抽样是以一定的统计原则和一定的程序进行 选择,每个单元被选择的概率是已知的,可以由 抽样结果来推断总体;而非概率抽样并不遵循统 计规律,而是根据主观意识在研究对象中进行的 选择
1、概率抽样- 简单随机抽样(SRS)
简单随机抽样又称单纯随机抽样,是所有随机抽 样方法中最简单的一种方法。它按照随机的原则 从调查总体中不加任何分类、排序、分组等先行 工作,直接从总体中不放回地逐个抽取单位,每 次抽取都要保证所有未被抽取进入样本的单位都 有相同的被抽中的概率。各单位被抽到的机会完 全均等,相互独立,排除了抽样过程中各种主观 因素的干扰。
层
一 二 三
特征
特大城市 大城市 人口密度的大中城市
所包含城市数
2 13 49
四
五 合计
经济活跃的中等城市
经济欠发达的中小城市
156
435 655
按照pps操作可以根据城市的大小给以每个城市不同的被 抽中机会。根据这个思路接着考察每层中各城市的市区人 口数并决定每层应抽取的城市数
层 一 二
所包含城市 2 13