样本量与抽样注意问题

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
样本量的计算
1、影响样本量的因素
Kingfather_28@126.com
出版市场调查
静恩英
样本量的计算

Kingfather_28@126.com
出版市场调查
静恩英
抽样的基本概念
3、总体指标(参数)
指调查的目标量,即有关的总体参数。通过有关样本的 指标(统计量)来估计。 例如: (1)收入水平 (2)阅报时间 (3)阅报内容 (4)期望阅读内容
注意:
(1)分层应加大层间差别,减少层内差别。
(2)分层指标应与主要目标量密切相关。
Kingfather_28@126.com
出版市场调查
静恩英
4、整群抽样(cluster sampling)
先将总体分若干个特征比较相近的群,以群为(初级) 抽样单元进行抽样,对抽中的群内的所有单元(次级单
元)都进行调查,没有抽中的群则不作调查。
交叉配额抽样
在实际调查中,经常遇到几个控制变量将总体分多层的情况,这时就需要交叉配额 抽样,也就是按多个控制变量交叉起来确定样本,这样的样本才具有代表性。独立 控制配额抽样在实际中很少使用,也不成为一个独立的抽样方法。
3. 分层抽样 4. 整群抽样 5. 多级抽样
Kingfather_28@126.com
出版市场调查
静恩英
简单随机抽样
简单随机抽样(无放回)
也称纯随机抽样,是从含有 N 个抽样单元的总体中,一次抽取 n 个 n n 单元,于是有 C N 种不同的结果,每种被抽中的概率都等于1 / CN , 这种抽样方法叫简单随机抽样。(总体的单元数非常大) 非常简单随机抽样(有放回) 每一次抽取都与上一次抽取都是相互独立的,即每次抽出的样本再 放回总体中,因此每次抽样的概率是不变的。
适用于总体数量不太庞大,且总体分布比较均匀时。
Kingfather_28@126.com
出版市场调查
静恩英
简单随机抽样
简单随机抽样的实施方法: 1、抽签法:为总体每个单元编号,幵做成号签,将号签混合 之后,抽取所需单位数,然后按照抽中的号码,查对调查 单位,登记调查。
2、随机数字表法:为总体每个单元编号,利用随机数字表从 中读出所需单位数,然后登记调查。
解:先计算抽样间距:
k 640 /12 53.33 53
每隔53户抽取一户,当然也可以取54。实施时,按照 左手规则(或右手规则),先将640户排列、编号, 然后随机地确定一个编号(假设为84号)为样本的第 一单元,然后抽取的这12户样本编号分别是:
84 137 190 243 296 349 402 455 508 561 614 27(614+53=667>640,667—640=27)
End
Kingfather_28@126.com
出版市场调查
静恩英
判断抽样
也是一种方便抽样形式,样本单元的选择完全根据研究者 个人的经验和判断。判断抽样相当主观,适用于不需对总 体进行推断,而且研究者具有丰富的经验。
End
Kingfather_28@126.com
出版市场调查
静恩英
配额抽样(quota sampling)
Kingfather_28@126.com
出版市场调查
静恩英
抽样的基本概念
课堂练习:
以湛江市20—45岁市民为总体的调查中,选择一种与上述方法不 同的抽样单元划分方法,解释抽样单元划分依据,并说明对应的 抽样框。
Kingfather_28@126.com
出版市场调查
静恩英
抽样的基本概念
6、抽样误差
End
Kingfather_28@126.com
出版市场调查
静恩英
抽样调查的组织形式三-----非概率抽样
1. 方便抽样
2、判断抽样
3、配额抽样
4. 滚雪球抽样
Kingfather_28@126.com
出版市场调查
静恩英
方便抽样
从便利的角度考虑样本的抽取。例如在报刊、杂志、互联 网等媒体上刊登调查问卷,在街头随机调查。这种调查花 费很低,但抽样偏差严重。
Kingfather_28@126.com
出版市场调查
静恩英
抽样的基本概念
5、抽样框
全部抽样单元的资料,如地图、名单、大小等,称之为抽 样框,抽样框中每个抽样单元都有自己对应的位置,常 常用编号来实现。 如例1:按年龄划分3个抽样单元,
20≦age1≧25 抽样单元1的详细人员名单(统计局) 26≦age2≧32 抽样单元2的详细人员名单(统计局) 33≦age3≧45 抽样单元3的详细人员名单(统计局) 那么,这份从统计局获取的详细人员名单即为抽样框。
出版市场调查
静恩英
PPS抽样(sampling with probability proportional to size)
样本量固定,有放回的、按单元“大小”成比例的概率来抽 取样本的方法。 实施步骤:(假设总体为 M 0 ) (1)规定总体单元的大小 M i ; (2)计算总体中各单元被抽中的概率
用样本指标去估计总体参数时产生的误差,可以计算也 可以控制,但无法避免。
7、非抽样误差
抽样调查中由于人为的差错所造成的误差。
Kingfather_28@126.com
出版市场调查
静恩英
抽样的基本概念
8、总体参数的点估计
利用样本数据计算得到统计量的具体数值,对总体的相 应参数进行估计。
9、总体参数的区间估计
上述所有这些:企业名单,企业的职工名单、各级政府名单及其 员工名单、部队名单,各部队各级军人名单、部队名单,各部队各 级军人名单、其他职业的人员名单,为本次抽样的抽样框。
Kingfather_28@126.com
出版市场调查
静恩英
抽样的基本概念
如例3:将20—45岁市民按所属街道办事处划分N个抽样单元: 抽样单元1:XX街道办事处 抽样单元2:XY街道办事处 抽样单元3:XZ街道办事处 抽样单元4:XS街道办事处 抽样单元5:X街道办事处 · · · · · · 该市所有街道办事处名单,各街道办事处所辖人口名单为本次抽样 的抽样框。
2. 非概率抽样(非概率抽样)
Kingfather_28@126.com
出版市场调查
静恩英
抽样调查的组织形式(一)-----等概率抽样
1. 简单随机抽样 2. 系统抽样
等概率抽样适用于总 体中的单元相差不大, 各个单元“大小”基本 相同、或各个单元在 总体中所占的地位或 重要性比较相似,否 则,就不会产生好的 效果。
Kingfather_28@126.com
出版市场调查
静恩英
3、分层抽样(stratified sampling)
也称分类抽样或类型抽样。先将总体按照某些重要指标分成若干个 互不重叠的穷尽的子总体,使总体中的每一个元素都属于且只属于 一个子总体。这样的子总体也叫层或类。然后在每个子总体内或层 内分别抽取一个子样本,再将各层的子样本综合成一个总体。
Kingfather_28@126.com
出版市场调查
静恩英
抽样的基本概念
如例2:按职业划分6个抽样单元:
抽样单元1:无业(无业人员名单) 抽样单元2:企业单位工作(企业名单,企业的职工名单 ) 抽样单元3:政府机关公务员(各级政府名单及其员工名单) 抽样单元4:军人(部队名单,各部队各级军人名单) 抽样单元5:自主经营(自主经营者名单) 抽样单元6:其他职业(其他职业的人员名单)
Kingfather_28@126.com
出版市场调查
静恩英
抽样的基本概念
例3:将20—45岁市民按所属街道办事处划分N个抽样单元: 抽样单元1:XX街道办事处 抽样单元2:XY街道办事处 抽样单元3:XZ街道办事处 抽样单元4:XS街道办事处 抽样单元5:X街道办事处 · · · · · · · ·
利用样本数据和置信区间构造出总体相对应参数的随机 区间。区间宽度在某种程度上代表了精确度,置信度 表示该区间盖住总体目标的概率,即表示区间估计的 可靠程度。 End
Kingfather_28@126.com
出版市场调查
静恩英
抽样调查的组织形式
1. 概率抽样(随机抽样)
(1) 等概率抽样
(2) 不等概率抽样
End
Kingfather_28@126.com
出版市场调查
静恩英
5、多级混合抽样
在大型调查中,常常采用多级抽样,而每一级又采取不同的抽样方 法。
Kingfather_28@126.com
出版市场调查
静恩英
抽样调查的组织形式(二)-----不等概率抽样
1. PPS抽样
2. 二重抽样
Kingfather_28@126.com
Kingfather_28@126.com
出版市场调查
静恩英
抽样的基本概念
4、抽样单元
为了便于抽样,将总体划分成有限个互不重叠的部分, 每个部分叫做一个抽样单元。 例1:将20—45岁市民按年龄段划分3个抽样单元: 20≦age1≧25 抽样单元1 26≦age2≧32 抽样单元2 33≦age3≧45 抽样单元3
Kingfather_28@126.com
出版市场调查
静恩英
解题过程如下表:
Kingfather_28@126.com
Leabharlann Baidu
出版市场调查
静恩英
二重抽样(double sampling)
也称二相抽样,先从总体中抽取一个比较大的样本,获取来自样本 中全部元素的信息;然后从原始样本即第一重样本中再抽取一个子 样本,并从这个子样样中获取更详细的附加信息。一般第二重样本 是调查的主样本,第二重调查的内容才是研究的重点。
P Mi / Mi Mi / M o i
(3)根据概率 Pi 确定分配给总体中各单元的代码数; (4)利用随机数字表抽出样本单元。
End
Kingfather_28@126.com
出版市场调查
静恩英
例:
要从12种晚报中抽取4种进行内容分析,12种晚报的发行 量分别为:20,67,45,120,39,85,58,98,76,210,25, 150万份,用PPS如何抽取。
Kingfather_28@126.com
出版市场调查
静恩英
简单随机抽样
简单随机抽样的优缺点: 1、优点:简单直观,总体名单完整时,可直接从中抽取,由于 抽取的概率相同,抽样误差和总体指标推断比较方便。 2、缺点: (1)对总体每个单元逐一编号不太可能,特别是总体较大时。 (2)某些调查对象不适于简单随机抽样。【连续生产的大量产品抽
Kingfather_28@126.com
出版市场调查
静恩英
抽样的基本概念
例2:将20—45岁市民按职业划分6个抽样单元: 抽样单元1:无业(应包括具体说明) 抽样单元2:企业单位工作(应包括具体说明) 抽样单元3:政府机关公务员(应包括具体说明) 抽样单元4:军人(应包括具体说明) 抽样单元5:自主经营(应包括具体说明) 抽样单元6:其他职业(应包括具体说明)
Kingfather_28@126.com
出版市场调查
静恩英
5、多级抽样(multi-stage-sampling)
从总体中先抽取若干较大的群体(初级单元或一级单 元),然后从所抽取的群体中再抽取若干较小的二级单
元;依次类推。
Kingfather_28@126.com
出版市场调查
静恩英
例:
假定要在一座拥有640户的居民楼内抽取12户进行调查,如何 实施。
样检验,无法编号】
(3)总体指标变异程度较大时,不如先分组再抽样。 (4)由于抽出样本较为分散,调查人力、物力费用消耗较大。
Kingfather_28@126.com
出版市场调查
静恩英
2、系统抽样(systematic sampling)
也称机械抽样。先将总体中的N个单元按照某种顺序排列,然后 在规定的范围内随机地抽取一个编号为起始单元,再按照某种规 则抽取样本的其他单元。 常用的等概率系统抽样是等距抽样。 假定从含有N个单元的总体中抽取含n个单元的样本,先求出抽 样间距k,然后随机从某个起点开始(假设起点的编号为i),每 隔k个单元就抽取一个作为入样单元,直至抽足n个单元为止。
配额抽样一般分两个阶段:第一阶段是分配份额,即将总体中的元素按照某些重 要指标或特性分类,然后规定样本中所应包含的每类元素数。通常,样本中具备 这些控制特性的元素比例与总体中这些特征元素的比例相同。第二阶段根据所分 配的份额选取样本元素,选取的方法可采用判断抽样、方便抽样。 即:先分层,再根据比例确定各层样本量,具体样本的抽取是随机。
与分层抽样的区别: 1、分层抽样中,分层的指标必须与调查目的有关,而配额抽样中无须考虑调查 目的,而且这种分层指标常常是自然存在的。 2、分层抽样中,具体样本的确定是按概率抽样,而配额抽样中具体样本的选择往 往是非概率的,这时无法计算误差。
Kingfather_28@126.com
出版市场调查
静恩英
相关文档
最新文档