样本的确定非概率抽样.pptx
合集下载
样本的确定 -非概率抽样.ppt
• 7.3.2约定式方法
• --认为某一个约定或某一个数量就是正确的样本量, 如1000-2000名调研者。但可能忽略了与所要进行的 研究相关的情况,而且往往进行研究所花费比使用正 确的样本容量要高的多。
• 7.3.3成本基础法
• 将成本作为确定样本容量的基础。
• 7.3.4 统计分析法
• ----一般地在大样本概率抽样中,不超过2000的样本 就可以代表无限大的总体
✓ --等比例类型抽样 ✓ --不等比例性抽样;大学教育质量的评价:一般地大
四的学生的评价最为稳定或相似,而一年级新生的 评价则可能最不一致。因此四年级的学生少抽,新 生则多抽。
7.1.5 整群抽样
• ----分群原则: • 扩大群间差异,减少群内差异 • ----缺点:相对于简单抽样,整群抽样抽样误差较,抽
7.2.1便利抽样
• 顾名思义,便利抽样是因为便利。 • 例如,一家食品公司的研发部门可能经常让员工对其开发
的新产品进行初步测试。固然这个方法看上去有很大的偏 差,然而他们不要求雇员评估现有的产品或与竞争对手的 产品进行比较。他们要求雇员提供总的感觉如成色、脆度、 油腻度等。 • 在类似情况下,便利抽样是获取必要信息的有效而实用的 方法。在进行试探性调研时,既缺乏经验而又急需真实数 据的近似值时,这种方法很实用。
谢谢观赏
You made my day!
我们,还在路上……
样估计精度低。因为整群抽样抽样单位相对集中,在 总体中分布不太均匀,对总体的代表性差一些。
7.2 非概率抽样
• 含义:指总体中的成员被选为样本的概率是未知的。 • 一般而言,任何不满足概率抽样要求的抽样都被归
为非概率抽样,非概率抽样的缺点是不能计算抽样 误差,这意味着评估非概率抽样的总体质量有很大 的困难。
抽样样本量的确定_图文
除了估计值的精度以外,调查实际操作的限制条件 也许是影响样本容量的最大因素。
客户提供的经费能支持多大容量的样本 整个调查持续的时间有多长 调查需要多少访员 能招聘到的访员有多少
1.给定精度水平下样本容量的确定
样本容量的大小与调查估计值所要求的精度紧密相关
数据是通过抽样而不是普查收集的,就会产生抽样误差。 精度是由抽样方差来测量的。 随着样本容量的增加,调查估计值的精度也会不断提高。
表3: 显示了不同规模的总体在P=0.5时,使用简单随机 抽样,且以误差界限为0.05、置信度为95%的标准估计P 所需的样本容量
总体规模 50 100 500
1,000 5,000 10,000 100,000 1,000,000 10,000,000
所需的样本量 44 80 222 286 370 385 398 400 400
抽样方差的几种计量方法
标准误差 误差界限 变异系数
抽样调查中样本容量的确定,也经常会使 用一种或多种这样的计量方法来对精度进行说 明。
非抽样误差
非抽样误差会对调查估计值的精度产生显著的影响 非抽样误差的大小与样本容量的大小却没有很大的关系 确定样本容量,就不必将这些误差作为影响因素加以考虑 为确保调查结果的准确性,应该消除非抽样误差,至少应尽 可能使之最小化
对于小规模总体,通常必须调查较大比 例的样本,以取得所期望的精度。因此,实 际操作中,对小规模总体经常采用普查而不 是抽样调查。
6.样本设计和估计量
计算样本容量时,通常假定采用的抽样方式为简单随 机抽样(SRS)。所以,如果样本容量计算公式假定为简单随 机抽样。
分层抽样得到的估计值通常比相同规模的简单随机抽 样更精确,或者至少 一样精确。 整群抽样得到的估计值,其精度通常低于使用同一估 计量进行估计时的简单随机抽样的估计值的精度
《非概率抽样方法》课件
误差的来源
• 调查方式 • 被调查者
如何减少误差
• 增加样本容量 • 使用恰当的抽样方法
应用实例
市场调研
用于收集市场数据、确定 消费群体、調查競爭對手。
医学研究
用于收集临床数据、诊断 和评估治疗方案。
政治调查
用于调查选举和政策支持 率等。
总结
1
非概率抽样方法的优缺点
优点:调查成本较低,简便易行。缺
1
简单随机抽样
每个样本有相同的概率被选中,且每
系统抽样
2
个样本选中的概率都是已知的。
在总
3
分层抽样
将总体分为若干层,在每层中随机选
簇抽样
4
择一定比例的样本。
将总体划分为一些组,随机选取一部 分组,再选择每个被选中组中部分个
体。
非恰概率抽样
方便抽样
选择最为便利、易于取得的样本,调查简单但 可能存在偏误。
列表抽样
从名单列表中选择样本,但可能存在名单不全 等问题。
定额抽样
按照一定比例抽取样本,例如从总体中抽取 10%的样本。
范围抽样
选择总体中特定范围内的样本,例如某个地区 或某种产品。
随机抽样误差与非随机抽样误差
误差类型
• 抽样误差 • 非抽样误差
如何选择合适的抽样方法
2
点:调查数据的误差较大,难以保证 抽样的代表性。
选择抽样方法时需要根据调查目的、
总体量、调查期限等因素进行判断,
酌情选择。
附录
相关术语解释
详细解释非概率抽样方法的相关术语及定义,方 便理解相关概念。
参考文献
列举了非概率抽样方法的相关著作及研究论文, 方便学习及参考。
抽样调查不等概率抽样课件
59.04 .
这一估计旳均方偏差旳估计为
v( YˆPPS
)
1
n
(
n( n 1 ) i1
yi pi
YˆPPS
)2
4.93
2、Hansen-Hurwitz (汉森—赫维茨)估计量
若 y1 , y2 , , yn 是按 Zi为入样概率旳多项抽样而得旳样 本数据,它们相应旳 Zi值自然记为 z1 , z2 , , zn ,则对总
例如,要了解上海地域钢铁企业旳景气情况,总体有上钢一厂、三 厂、五厂……等等,再加上宝钢。因为宝钢规模极大,它是否景气对整 个上海地域钢铁工业起着至关主要旳作用。而在抽样中将它与其他规模 较小旳单位处于同等地位就会既不公正又使抽样推断成果有较大可能发 生大旳偏差。
§3.1 PPS 抽 样
Байду номын сангаас
PPS抽样:抽取概率正比于规模测度。
第三章 不等概抽样
简朴随机抽样旳特点:总体中每个个体被抽中入样旳概率都相同。对
于各单元所处地位几乎 “平等” 旳总体,这种抽样原则既公正又以便 。
不等概率抽样:但在许多社会经济活动中并非全部单元地位相同。
使得“大”单元入样概率大,“小”单元入样概率小,这里旳“大”、 “小”与我们所关心旳调查指标有着亲密旳关系。
n ( yi
z i 1
i
yHH )2
§3.2 不等概 PS 抽样
有放回不等概率抽样:从实施上还是从估计计算以及精度估计都显得
十分以便。但一种单元被抽中两次以上总会使样本旳代表性打折扣,从 而引起抽样误差旳增长。 实际调查工作者一般倾向于使用不放回形式。
问题:最简朴旳不放回不等概率抽样方式自然会想到逐一抽样这在第
N
概率抽样和非概率抽样概率抽样PPT精选文档
,写上1-10000号,从中随机(或按随机数
)抽取200张,被抽中的居民即为样本。
42
特点
简单、直观 对参数进行估计比较方便
局限性
当总体量很大时,不易构造抽样框 抽出的单位很分散 没有利用其它辅助信息
43
分层抽样
将抽样单位按某种规则划分为不
同的层,然后从不同的层中独立、随机地
抽取样本。
重点调查
总体单位
调查单位
只调查重点单位(单位 数不多但其标志量占标 志总量比重较大的单位)
32
统计调查的组织方式
在对调查对象有一定了解的基础上,
典型调查 有意识地选择少数典型单位 进行
调查的一种非全面调查组织方式
一定条件下能估计总体指 作 标数值 用 可以补充全面调查的不足
可以用来研究新生事物
局 不能确定推断的把握程度, 限 无法计算和控制推断误差
数值型数据表示事物的数量特征,定量数 据或数量数据(qualitative data)。
对不同类型的数据,采用的统计方法可能 有所不同 。
10
4、截面数据(cross-sectional data)
在相同或近似相同的时间点上收集的数 据
描述现象在某一时刻的变化情况 比如,2002年我国各地区的国内生产总
51
系统抽样
定义:将个体按一定顺序排列,在规定的 范围内随机地抽取一个单位作为初始单位 ,然后按事先规定好的规则确定其它样本 单位
优点:操作简便
缺点:对总体参数的估计比较复杂
52
系统抽样的步骤
(1) 将总体单位排列。
(2) 决定抽样间距(总体单位数/样本数)。
(3) 采用简单随机抽样法抽出一个单位作为起点 。
《非概率抽样方法》课件
代表性差
由于样本不是随机抽取的,非概率抽样的样 本可能不具有广泛代表性。
与概率抽样的区别
概率抽样依赖于随机原则,确保每个潜在样本都有被选中的机会。而非概率抽样则基于主观判断或特 定目的进行选择。
概率抽样的目标是获得具有代表性的样本,而非概率抽样的主要目的是为了探索性研究和满足特定需求 。
概率抽样通常用于大样本、长期研究或需要精确估计的场合,而非概率抽样则适用于快速、低成本或探 索性的研究。
自愿者抽样
总结词
自愿者抽样是一种非概率抽样方法,它通过 招募自愿参与的样本,来进行调查研究。
详细描述
自愿者抽样通常用于探索性和定性研究,尤 其是在难以接触到目标总体的情况下。研究 者通过发布招募信息、社交媒体邀请等方式 ,吸引自愿参与的样本,然后对这些样本进 行调查和访谈。由于自愿者可能存在偏差, 因此自愿者抽样的结果需要谨慎解释,并在
THANKS
感谢观看
VS
社会趋势预测
通过非概率抽样方法,可以对社会趋势进 行预测,了解社会发展的方向和速度,为 政府和社会组织提供决策依据。
04
非概率抽样的优缺点
优点
高效性
非概率抽样方法通常比概率抽样方法更快、更高效,因为它们不 需要随机抽样或复杂的样本设计。
灵活性
非概率抽样方法更加灵活,可以根据研究目的和资源进行有针对性 的抽样。
快速反馈
由于非概率抽样方法通常涉及较小的样本量,因此可以更快地获得 初步结果和反馈。
缺点
代表性不足
由于非概率抽样方法不是基于概 率的,因此样本可能不具有广泛 代表性,其结果可能不适用于总 体。
误差控制困难
非概率抽样方法通常缺乏误差控 制机制,因此难以评估样本误差 或偏差。
市场研究课件:非概率抽样
非概率抽样
年龄(岁) 人数
性别
人数
月收入 (元)
人合计
80 120 140 60
400
男 女
合计
200 200
400
500以下 500-1000
1000-1500
1500以上
合计
40 100 140 120
400
非概率抽样
从上表可以看出,对年龄、性别、收入三个分类标准, 分别规定了样本数额,而没有规定三者之间的关系。
因此,在调查具体选取不同年龄段的消费者时,不需 要顾及性别和月收入标准。同样,在选取不同性别或月收 入的消费者时,也不必顾及其他两个分类标准
非概率抽样
2、相互控制配额抽样法:是指对调查对象的各个特 征的样本数额交叉分配,结果如下表:
非概率抽样
500元以下
性别
男女
25岁以下 4
4
年 26-35岁 6
非概率抽样
非概率抽样
概率抽样的优点与缺点: 1、能够精确估计抽样误差 2、加大调查的成本(需要获得严格的抽样框 和其他辅助条件) 非概率抽样:不遵循随机原则,以调查人员的 主观意志设立的某个标准,从方便出发来抽取样本 优点:简单易行,适用于探索性研究、试调查、 心理测验 缺点:不能推断总体、代表性差、偶然性强、 无法估计和控制抽样误差
优点:使调查者在判断抽选单位时,有比较大的机会去选择总体 中的样本
缺点:调查人员可能因一时方便,过于偏向某一组样本的选择, 从而影响样本的代表性
例:对某市化妆品消费需求的调查,确定样本总数是400人,选 择按消费者的年龄、性别、收入三个标准分类。采用独立控制配额抽 样方式,其具体的抽样分配比例及配额数见下表:
真实的估计 步骤: 1、选取少量样本 2、对第一阶段的样本进行调查,然后请被调查者推荐
随机抽样与非随机抽样PPT资料(正式版)
一类是根据行政、地域以及自然形成的群体; 三、抽样调查的一般程序
整群抽样中的“群”可分为两类: 缺点:如果调查人员在选取样本时主观判断出现偏差,则判断抽样极易发生较大的抽样误差。
(1)可用于经常性的市场调查;
随当机对抽 调样查具的有总统体一计不类推够算清是的楚原,根则或据。者太行复杂政,、不适地于采域取以随机及抽样自时然,那形么,成就的需要群用非体随;机抽样来抽出样本; 一该类抽是 样根方据法行保政证二、每类地一域抽是以样及单一自位个然都形有连成相的同续群的的体非;零总抽中体概,率,可并给由出调总体查参数者的根自加据权估需计求值。来适当确定群体的大小。
➢ 如进行现场访问,任意选择一群消费者或者营业人员进行谈话,了解他 们对商品质量的看法或购买动向。
➢ 举例:在街头向过路行人做访问调查;上门对一栋大楼内的每个公司进 行访问式调查;在柜台销售商品过程中向购买者做询问调查等(样本的 选取完全随调查人员的方便而定)
➢ 理论依据:认为被调查的母体中的每一个个体都是相同的 ➢ 注意:适用于非正式的探测性调查,或调查前的准备工作。
2.适用于经常性的调查和方便灵活的调查。
非随机抽样和随机抽样的比较
Байду номын сангаас
抽样方 法
非随机抽 样
作用
研究总体的 局部现象
抽样原则 误差判断 应用
非随机抽 出样本, 主观性强
不能计算 和判断抽 样误差
可随时随 地采用
随机抽样 以部分推 随机抽出
断总体
样本,客 观性强
不能计算 和判断抽 样误差
只能定期 采用
优缺点
p = n/N
整群抽样 1.整群抽样群的划分问题
基本要求是:一是群与群之间不重叠;
整群抽样中的“群”可分为两类: 缺点:如果调查人员在选取样本时主观判断出现偏差,则判断抽样极易发生较大的抽样误差。
(1)可用于经常性的市场调查;
随当机对抽 调样查具的有总统体一计不类推够算清是的楚原,根则或据。者太行复杂政,、不适地于采域取以随机及抽样自时然,那形么,成就的需要群用非体随;机抽样来抽出样本; 一该类抽是 样根方据法行保政证二、每类地一域抽是以样及单一自位个然都形有连成相的同续群的的体非;零总抽中体概,率,可并给由出调总体查参数者的根自加据权估需计求值。来适当确定群体的大小。
➢ 如进行现场访问,任意选择一群消费者或者营业人员进行谈话,了解他 们对商品质量的看法或购买动向。
➢ 举例:在街头向过路行人做访问调查;上门对一栋大楼内的每个公司进 行访问式调查;在柜台销售商品过程中向购买者做询问调查等(样本的 选取完全随调查人员的方便而定)
➢ 理论依据:认为被调查的母体中的每一个个体都是相同的 ➢ 注意:适用于非正式的探测性调查,或调查前的准备工作。
2.适用于经常性的调查和方便灵活的调查。
非随机抽样和随机抽样的比较
Байду номын сангаас
抽样方 法
非随机抽 样
作用
研究总体的 局部现象
抽样原则 误差判断 应用
非随机抽 出样本, 主观性强
不能计算 和判断抽 样误差
可随时随 地采用
随机抽样 以部分推 随机抽出
断总体
样本,客 观性强
不能计算 和判断抽 样误差
只能定期 采用
优缺点
p = n/N
整群抽样 1.整群抽样群的划分问题
基本要求是:一是群与群之间不重叠;
非概率抽样
4
.
二、抽样调查的特点
抽样调查方法的特点具体表现在如下几个方面: 第一、时间短、收效快。 第二、质量高、可信程度好。 第三、费用省、易推广。
5
.
三、抽样方案设计
(一)抽样方案设计的基本内容 1、确定抽样调查的目的; 2、确定调查对象(总体)的范围的抽样单位; 3、确定抽取样本的方法; 4、确定必要的样本量; 5、对主要抽样指标的精度提出要求; 6、确定总体目标量的估算方法; 7、制订实施总体方案的办法和步骤。
确定样本容量即确定样本数量的大小。 抽样误差的大小与样本容量的大小和概率把握程度直接 相关。
9
.
抽样调查的基本思想
抽样调查的概念 抽样调查的特点 抽样方案设计
2
.
一、抽样调查的概念
抽样调查也称样本调查。它是按照随机原则,从研究总 体的所有单位中,抽取部分单位作为样本,然后以样本 的观测或调查结果对总体的数量特征作出具有一定可靠 程度和精确度的估计或推断的一种调查方法。
3
.
抽样调查分为概率抽样和非概率抽样两类,通常我们所 说的抽样调查,如果未加限定,大多指概率抽样调查。
.
(二)抽样方案设计的主要程序
确定调查总体 测算结果
建立抽样框 实施调查
选择调查样 本
7
.
确定调查总体,即明确调查的全部对象及其范围。 抽样框是指供抽样所用的所有被调查对象的详细名单。 抽样框确定之后,还要确定具体的抽样方法,例如,是 选择纯随机抽样、分层抽样,系统抽样还是整群抽样等 等。
8
.
.
二、抽样调查的特点
抽样调查方法的特点具体表现在如下几个方面: 第一、时间短、收效快。 第二、质量高、可信程度好。 第三、费用省、易推广。
5
.
三、抽样方案设计
(一)抽样方案设计的基本内容 1、确定抽样调查的目的; 2、确定调查对象(总体)的范围的抽样单位; 3、确定抽取样本的方法; 4、确定必要的样本量; 5、对主要抽样指标的精度提出要求; 6、确定总体目标量的估算方法; 7、制订实施总体方案的办法和步骤。
确定样本容量即确定样本数量的大小。 抽样误差的大小与样本容量的大小和概率把握程度直接 相关。
9
.
抽样调查的基本思想
抽样调查的概念 抽样调查的特点 抽样方案设计
2
.
一、抽样调查的概念
抽样调查也称样本调查。它是按照随机原则,从研究总 体的所有单位中,抽取部分单位作为样本,然后以样本 的观测或调查结果对总体的数量特征作出具有一定可靠 程度和精确度的估计或推断的一种调查方法。
3
.
抽样调查分为概率抽样和非概率抽样两类,通常我们所 说的抽样调查,如果未加限定,大多指概率抽样调查。
.
(二)抽样方案设计的主要程序
确定调查总体 测算结果
建立抽样框 实施调查
选择调查样 本
7
.
确定调查总体,即明确调查的全部对象及其范围。 抽样框是指供抽样所用的所有被调查对象的详细名单。 抽样框确定之后,还要确定具体的抽样方法,例如,是 选择纯随机抽样、分层抽样,系统抽样还是整群抽样等 等。
8
.
非概率抽样调查
(A)
(B)
(C)
年龄(岁)
18~34 35~44 45~60 61岁以上 总计 40 60 70 30 200 男 女
性别 100 100 200
收入
高
中 低
40
60 100
总计
总计
200
Байду номын сангаас
收入 性别 样本数目 年龄
高 男 4 7 6 3 20 40 女 4 7 6 3 20 男 6 9 10 5 30
非概率抽样
非概率抽样,是指概率抽样法范围之外 的抽样法。 在实践中,使每个样本被抽取的机会相 等的方法,并非对所有调查都具有可行 性。 为什么呢?
非概率抽样技术的分类
非 概 率 抽 样 方 法
任 意 抽 样 方 法
判 断 抽 样 方 法
配 额 抽 样 方 法
独 立 控 制 配 额 抽 样 相 互 控 制 配 额 抽 样
实行配额抽样法的主要 理论依据:认为特征相 同的调查对象,如同一 类别年龄、性别、收入 的居民,其要求、反应 大致相似,误差不大, 因而不必再按随机抽样 法抽取样本。
独立控制的配额抽样:这种方法只对具有某种特征的 样本数规定配额,而对具有两种或两种以上特性的样 本数则不作规定。
例1:控制特性为年龄、性别、收入三种,已 经确定样本总数为200,按独立控制的配额抽 样,则可列成如下三表:
任意抽样法
概念:是一种随意选取样本的方法。 例如:在街头向路人作访问、在柜台销售产品的 过程中向买者作当面访问。 优点:便利、方便。 缺点:抽样误差较大。 适用于:市场初步调查、对市场情况不甚了解 时,正式市场调查中较少使用。
判断抽样法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
-有关标志排队等距抽样 无关标志排队等距抽样
由于有关标志抽样利用一致的信息或辅助资料进行 排列或分层,一般而言增强样本的代表性,比无关 标志抽样或简单随即抽样效果要好 -随机起点等距抽样 、中间起点等距抽样、对称等 距抽样
7.1.4分层抽样/类型抽样
• --应用最为广泛的抽样组织形式。分层的基本要求是 层内差异小,层间差异大。因为数理统计证明,估 计量方差的大小只与 层内方差相关,而与层间方差 无关。
样本至少应该是总体的5%” • 优点是简单实用。 • 但是:耐克公司曾经设计一种训练用鞋—特安士龙训练
者,专为铁人三项运动员设计。估计在美国有10000名 运动员,5%的话,样本容量应该是500。如果想对“飞 人乔丹”进行调查,美国大约有200万使用者,5%将是 10万样本,是前者200倍。那么,飞人乔丹调查所需要 的人数必须是前者的200倍吗?换个角度说,打篮球的 人的差异性是铁人三项运动员的200倍吗。
7.2.3 推荐抽样
• 有时又叫滚雪球抽样,要求回答者提供附加回答者的 名单,于是调研者为符合研究的要求起初汇编一个比 总体样本要小得多的样本目录。在采访了每个回答者 后,要求他或她提供其他可能的回答者名单。如此, 先前的回答者就提供了额外的回答者,其他名单意味 着,样本像雪球滚下坡一样越滚越大。
第七章 样本的确定
-非概率抽样
பைடு நூலகம்
7.1 概率抽样
• 7.1.1概率抽样 • ――指总体的成员都有一个被选为样本的已知概率。 • 7.1.2 简单随机抽样 • 抽签法 • 滚球法 • 随机数字表法 • 计算机模拟法 -大中型计算机中一般带有随机数字
发生器,利用产生的随机数字确定样本单位。
7.1.3 系统抽样/等距抽样
7.2.2 判断抽样
• 判断抽样不同于便利抽样,因为它需要判断或推测谁能 代表总体。具有大量有关总体知识的调研者或某些有助 于调研者的个体,将选择他或她觉得该选取的那些个体 组成样本。
• 焦点小组座谈会通常利用判断抽样。
• 最近一个小组座谈会调查人们关注对低卡路里、低 脂肪微波炉烹饪技术的要求并选择12名妇女作为目 前和未来市场的代表。这些妇女中有6名已经拥有微 波炉在3年或3年以上。另有3名妇女拥有微波炉至少 3年,还有3名妇女在市场上寻找微波炉。
• 可以确定最小样本容量,确保可信度或保证统计结 果的正确性。
7.3.5 从小总体中抽样
• 小总体抽样要运用有限乘数法进行调整。有限乘数是 指近似于不包括样本的总体比率的平方根的一个调整 因素。
• 如假定总体为1000,选定的样本是400家,会产生一 个0.77左右的有限乘数,或是0.6的平方根(1000400/1000),此时样本可以改为308家=0.77*400, 可以减少92个样本而不至于影响调研精确度。
• 对调研者来说以时间的效率表示最方便的场合莫过于 交通要道。
• 例如只限行人活动的商业区或行人来往频繁的十字路 口。
• 该方法可使得总体的某些成员被自动地从抽样过程中 排除。
• 例如有些人可能是偶然来此或偶尔光顾闹市区的游客。
• 另一方面,在缺乏精确的选择程序时,可以省略总体 的某些成员,因为他们的有形外表、通常的举止或他 们事实上都是成群结队的而不是单独的。
--等比例类型抽样 --不等比例性抽样;大学教育质量的评价:一般地大
四的学生的评价最为稳定或相似,而一年级新生的 评价则可能最不一致。因此四年级的学生少抽,新 生则多抽。
7.1.5 整群抽样
• ----分群原则: • 扩大群间差异,减少群内差异 • ----缺点:相对于简单抽样,整群抽样抽样误差较,抽
• 对个体的外貌特征比较了解的公司常常使用定额抽 样,他们希望从事特殊的营销调研项目。例如一家 大银行可以规定最终的样本是50%的成年男子和50 %的成年女子,因为在他们掌握的市场中,男性和 女性的消费层面大约是50对50。
7.3 样本容量
• 7.3.1教条式方法 • --以经验为幌子,认为样本容量应该是“为保证精确,
样估计精度低。因为整群抽样抽样单位相对集中,在 总体中分布不太均匀,对总体的代表性差一些。
7.2 非概率抽样
• 含义:指总体中的成员被选为样本的概率是未知的。 • 一般而言,任何不满足概率抽样要求的抽样都被归
为非概率抽样,非概率抽样的缺点是不能计算抽样 误差,这意味着评估非概率抽样的总体质量有很大 的困难。
• 当手头只有一份有限的且少得可怜的样本架构时, 而回答者有可能提供对调查可能有用的别的回答者 的名单时,推荐抽样是最合适的。
• 推荐抽样的非概率方面来自运用了全部的选择。最 初的名单在某些方面也可能是特殊的,然而增加样 本的主要方法是通过原始名单中那些人的回忆产生 的。
7.2.4 定额抽样
✓定额抽样为各类要采访的个体确定一个具体的定额。
它是调研者普遍使用的一种非概率抽样。 • 例如,指派采访者获得一个女性黑人、男性黑人、
女性白人、男性白人各50名的定额样本,他们在人 种和性别上都具有特定资格。 • 假如实地工作者在路上收集样本,它将根据外形特 征来确定样本的代表性,从而使四种类型都符合定 额。所以定额体系可以克服无推荐抽样在内的许多 非代表性危机。
7.2.1便利抽样
• 顾名思义,便利抽样是因为便利。 • 例如,一家食品公司的研发部门可能经常让员工对其开发
的新产品进行初步测试。固然这个方法看上去有很大的偏 差,然而他们不要求雇员评估现有的产品或与竞争对手的 产品进行比较。他们要求雇员提供总的感觉如成色、脆度、 油腻度等。 • 在类似情况下,便利抽样是获取必要信息的有效而实用的 方法。在进行试探性调研时,既缺乏经验而又急需真实数 据的近似值时,这种方法很实用。
• 7.3.2约定式方法
• --认为某一个约定或某一个数量就是正确的样本量, 如1000-2000名调研者。但可能忽略了与所要进行的 研究相关的情况,而且往往进行研究所花费比使用正 确的样本容量要高的多。
• 7.3.3成本基础法
• 将成本作为确定样本容量的基础。
• 7.3.4 统计分析法
• ----一般地在大样本概率抽样中,不超过2000的样本 就可以代表无限大的总体
由于有关标志抽样利用一致的信息或辅助资料进行 排列或分层,一般而言增强样本的代表性,比无关 标志抽样或简单随即抽样效果要好 -随机起点等距抽样 、中间起点等距抽样、对称等 距抽样
7.1.4分层抽样/类型抽样
• --应用最为广泛的抽样组织形式。分层的基本要求是 层内差异小,层间差异大。因为数理统计证明,估 计量方差的大小只与 层内方差相关,而与层间方差 无关。
样本至少应该是总体的5%” • 优点是简单实用。 • 但是:耐克公司曾经设计一种训练用鞋—特安士龙训练
者,专为铁人三项运动员设计。估计在美国有10000名 运动员,5%的话,样本容量应该是500。如果想对“飞 人乔丹”进行调查,美国大约有200万使用者,5%将是 10万样本,是前者200倍。那么,飞人乔丹调查所需要 的人数必须是前者的200倍吗?换个角度说,打篮球的 人的差异性是铁人三项运动员的200倍吗。
7.2.3 推荐抽样
• 有时又叫滚雪球抽样,要求回答者提供附加回答者的 名单,于是调研者为符合研究的要求起初汇编一个比 总体样本要小得多的样本目录。在采访了每个回答者 后,要求他或她提供其他可能的回答者名单。如此, 先前的回答者就提供了额外的回答者,其他名单意味 着,样本像雪球滚下坡一样越滚越大。
第七章 样本的确定
-非概率抽样
பைடு நூலகம்
7.1 概率抽样
• 7.1.1概率抽样 • ――指总体的成员都有一个被选为样本的已知概率。 • 7.1.2 简单随机抽样 • 抽签法 • 滚球法 • 随机数字表法 • 计算机模拟法 -大中型计算机中一般带有随机数字
发生器,利用产生的随机数字确定样本单位。
7.1.3 系统抽样/等距抽样
7.2.2 判断抽样
• 判断抽样不同于便利抽样,因为它需要判断或推测谁能 代表总体。具有大量有关总体知识的调研者或某些有助 于调研者的个体,将选择他或她觉得该选取的那些个体 组成样本。
• 焦点小组座谈会通常利用判断抽样。
• 最近一个小组座谈会调查人们关注对低卡路里、低 脂肪微波炉烹饪技术的要求并选择12名妇女作为目 前和未来市场的代表。这些妇女中有6名已经拥有微 波炉在3年或3年以上。另有3名妇女拥有微波炉至少 3年,还有3名妇女在市场上寻找微波炉。
• 可以确定最小样本容量,确保可信度或保证统计结 果的正确性。
7.3.5 从小总体中抽样
• 小总体抽样要运用有限乘数法进行调整。有限乘数是 指近似于不包括样本的总体比率的平方根的一个调整 因素。
• 如假定总体为1000,选定的样本是400家,会产生一 个0.77左右的有限乘数,或是0.6的平方根(1000400/1000),此时样本可以改为308家=0.77*400, 可以减少92个样本而不至于影响调研精确度。
• 对调研者来说以时间的效率表示最方便的场合莫过于 交通要道。
• 例如只限行人活动的商业区或行人来往频繁的十字路 口。
• 该方法可使得总体的某些成员被自动地从抽样过程中 排除。
• 例如有些人可能是偶然来此或偶尔光顾闹市区的游客。
• 另一方面,在缺乏精确的选择程序时,可以省略总体 的某些成员,因为他们的有形外表、通常的举止或他 们事实上都是成群结队的而不是单独的。
--等比例类型抽样 --不等比例性抽样;大学教育质量的评价:一般地大
四的学生的评价最为稳定或相似,而一年级新生的 评价则可能最不一致。因此四年级的学生少抽,新 生则多抽。
7.1.5 整群抽样
• ----分群原则: • 扩大群间差异,减少群内差异 • ----缺点:相对于简单抽样,整群抽样抽样误差较,抽
• 对个体的外貌特征比较了解的公司常常使用定额抽 样,他们希望从事特殊的营销调研项目。例如一家 大银行可以规定最终的样本是50%的成年男子和50 %的成年女子,因为在他们掌握的市场中,男性和 女性的消费层面大约是50对50。
7.3 样本容量
• 7.3.1教条式方法 • --以经验为幌子,认为样本容量应该是“为保证精确,
样估计精度低。因为整群抽样抽样单位相对集中,在 总体中分布不太均匀,对总体的代表性差一些。
7.2 非概率抽样
• 含义:指总体中的成员被选为样本的概率是未知的。 • 一般而言,任何不满足概率抽样要求的抽样都被归
为非概率抽样,非概率抽样的缺点是不能计算抽样 误差,这意味着评估非概率抽样的总体质量有很大 的困难。
• 当手头只有一份有限的且少得可怜的样本架构时, 而回答者有可能提供对调查可能有用的别的回答者 的名单时,推荐抽样是最合适的。
• 推荐抽样的非概率方面来自运用了全部的选择。最 初的名单在某些方面也可能是特殊的,然而增加样 本的主要方法是通过原始名单中那些人的回忆产生 的。
7.2.4 定额抽样
✓定额抽样为各类要采访的个体确定一个具体的定额。
它是调研者普遍使用的一种非概率抽样。 • 例如,指派采访者获得一个女性黑人、男性黑人、
女性白人、男性白人各50名的定额样本,他们在人 种和性别上都具有特定资格。 • 假如实地工作者在路上收集样本,它将根据外形特 征来确定样本的代表性,从而使四种类型都符合定 额。所以定额体系可以克服无推荐抽样在内的许多 非代表性危机。
7.2.1便利抽样
• 顾名思义,便利抽样是因为便利。 • 例如,一家食品公司的研发部门可能经常让员工对其开发
的新产品进行初步测试。固然这个方法看上去有很大的偏 差,然而他们不要求雇员评估现有的产品或与竞争对手的 产品进行比较。他们要求雇员提供总的感觉如成色、脆度、 油腻度等。 • 在类似情况下,便利抽样是获取必要信息的有效而实用的 方法。在进行试探性调研时,既缺乏经验而又急需真实数 据的近似值时,这种方法很实用。
• 7.3.2约定式方法
• --认为某一个约定或某一个数量就是正确的样本量, 如1000-2000名调研者。但可能忽略了与所要进行的 研究相关的情况,而且往往进行研究所花费比使用正 确的样本容量要高的多。
• 7.3.3成本基础法
• 将成本作为确定样本容量的基础。
• 7.3.4 统计分析法
• ----一般地在大样本概率抽样中,不超过2000的样本 就可以代表无限大的总体