第七讲抽样设计
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
取层样本,所得分层样本被称为分层随机样本。
¾ 要求 z 每个总体单位都必须属于且只属于某一层;
z 每一层的总体单位数已知;
13
z 在任何两层所进行的抽样都是独立的。
二、抽样组织形式及方法
类型抽样(分层抽样)
•方法:将总体全部单位分类,形成若干个类型组,后从各类 型中分别抽取样本单位,合成样本。
总体 N
2.非随机抽样
¾ 指在抽取样本时不是遵循随机原则,而是按照调查人员的主 观判断、经验或其他原则来抽取样本,也称非概率抽样。
非随机抽样在统计调查中被经常运用的原因
¾ 受客观条件限制,无法实行随机抽样调查。 ¾ 为尽快取得调查数据提高实效性。 ¾ 节约调查成本。 ¾ 总体各单位间差异不大,且有关的调查人员具有丰富的
(3)分层原则
¾ 以与调查的核心项目关系密切的项目为标准。 ¾ 当总体各标志值之间的差距很大,总体分布非常分散 15 时,以引起其分散的主要原因或标识为分层标志。
二、抽样组织形式及方法
1-4.整群抽样
¾ 整群抽样是将调查对象按某一标志分组后形成的每个群 视为单元进行随机抽样,而后对抽中的每个群进行全面 调查,也称集团抽样、群体抽样。
例如:某地有2.4万名教师,他们分布在全市10个区的200所学校 里,现在要抽取一个由1200名教师组成的样本,按照三级抽样的方 法,有以下几种抽样方案:
方案1
第一阶段 10个区
第二阶段 每个区抽4所学校
第三阶段 每所学校抽30名教师
方案2
10个区
每个区抽20所学校 每所学校抽6名教师
方案3 从10个区中抽5个区 每个区抽12所学校 每所学校抽20名教师
1-1.简单随机抽样
(1)什么是简单随机抽样
¾ 是对调查对象不做任何划类、分组、排队等加工整理的 一种随机抽样的组织形式,也称纯随机抽样。
¾ 在市场调查中适用于总体容量不太庞大、总体单位差异 程度小以及总体分布比较均匀的调查对象。
(2)简单随机样本的抽选方法
¾ 直接抽选法
¾ 抽签法
¾ 随机数表法
z 随机数表又称为乱数表,指抽样时使用的,不仅将
第七讲第七讲抽样设计抽样设计一抽样设计的基本问题一抽样设计的基本问题二抽样组织形式及方法二抽样组织形式及方法三样本容量的确定三样本容量的确定四非抽样误差及其控制四非抽样误差及其控制五专五专题题穿插其中穿插其中22一抽样设计基本问题一抽样设计基本问题一抽样组织形式二样本抽选方法三抽样设计的主要内容四抽样设计的结果评价抽样使我们能从总体具有代表性的部分样本中获取数据从而可以得到关于整个总体的有效结论
¾ 缺点 取得的样本偶然性很大,存在着选择偏差, 调查结 果可信度低。
23
二、抽样组织形式及方法
2-2.判断抽样
¾ 指基于调查人员的主观意愿、经验和知识,依据对总体有 关特征及实际情况的了解,从目标总体中抽选有代表性的 典型单位作为样本单位,或由了解情况的专家圈定样本的 一种抽样组织形式,也称立意抽样、目的抽样、主观抽样 或专家抽样。
¾ 即使抽样调查中能够一个个地取样,出于经济的考虑也会 选择整群抽样。
(2)整群抽样的特点
¾ 调查单位比较集中,进行调查比较方便,可以减少调查人 员与调查单位之间来往的时间和费用。
¾ 设计和组织抽样比较方便,尤其是对那些无法事先掌握总 体单位情况的调查对象,采用整群抽样更为适宜。
18
二、抽样组织形式及方法
志划分成 个层,然后ni从含有 ( =1,2,…,i ; i=1 )个 个体的层K中随机抽取 个样本单位组成第 层的层样本,
所有n 这n = 个∑K 层ni 的层样本汇总起来构成的总样本就是容量
为 ( i=1 )的分层样本。我们也又称它为类型抽样 或分类抽样。
¾ 分层随机抽样 在每一层中都采用单纯随机抽样法来抽
¾ 分群原则 应选择能使群间方差尽量小,而群内方差尽 量大的标志作为分群标志。
16
二、抽样组织形式及方法
例: 总体群数R=16 样本群数r=4 样本容量
A D E
B F G
M CN
Jபைடு நூலகம்
LP KO
HI
LP HD
n = nd +np +nl +nh
17
二、抽样组织形式及方法
(1)整群抽样的适用性
¾ 在某些一个个地抽取样本单位不适合的情况下,不得不采 用整群抽样。
标)有密切的关系。
z 采用有关标志排队可以利用总体的有关信息,提高样
10
本代表性并提高抽样估计精度。
二、抽样组织形式及方法
(1)系统抽样的排序方法
¾ 无关标志排队法 z 无关标志 指用于排队的标志与所调查的项目(指 标)没有直接关系,或者关系很小。 z 采用无关标志排队的总体实际上是一个随机总体,因 而按无关标志排队的系统抽样,可以视为不重复的简 单随机抽样。
方案4 从10个区中抽3个区 每个区抽10所学校 每所学校抽40名教师
方案5 从10个区中抽1个区 每个区抽12所学校 每所学校抽100名教师
思考: 1、哪一种方案最节省人力和经费? 2、哪一种方案得到的样本精确度最高? 3、考虑到实际情况,你在抽样中会选择哪种方案?为什么?
21
二、抽样组织形式及方法
1-5.多阶段抽样
例:在某省100多万农户抽取1000户调查农户生产性投资情
况。 第一阶段:从省内部县中抽取5个县 第二阶段:从抽中的5个县中各抽4个镇 第三阶段:从抽中的20个乡中各抽5个村 第四阶段:从抽中的100个村中各抽10户 样本n=100×10=1000(户)
19
20
二、抽样组织形式及方法
(4) 92,144 81,642 28,677 86,089 1,414 98,250 32,556 95,753 61,371 82,835 32,222 00,230 35,168 70,361 42,991
(5) 81,034 8,971 95,961 38,157 1,413 70,060 89,822 34,095 1,534 98,378 75,433 58,220 81,438 15,819 00,142
生的。 ¾ 是衡量各种抽样方式效果好坏的一个比较标准 。
(4)简单随机抽样的局限性
¾ 对于大总体,抽样时所需的逐一编号工作往往很难完成。 ¾ 当总体的标志变异程度较大时,样本代表性不如经过分层
后再抽样的代表性高。 ¾ 当调查对象中的个体较为分散时,调查所需的人力、物
力、财力较大。
9
二、抽样组织形式及方法
体的了解。 ¾ 适用性 适用于总体单位规模小,单位间差异也较小
的情况。
2-3.配额抽样
¾ 指先将总体所有单位按一定的标志分成若干类(组),然 后在各个类(组)用方便抽样或判断抽样方法选取样本单 位的抽样组织形式,又称定额抽样。
¾ 特点 其控制特征是以调查目标的关联度为基准,兼顾总 体的结构特征,不仅使样本的分布比较均匀,便于实施, 而且使样本的代表性高于其他非随机抽样。
整群随机 抽样调查
系统 抽样调查
判断抽样
方便抽样
配额抽样 滚雪球抽样
5
二、抽样组织形式及方法
课堂练习:
某中学有4800名学生,分为4个年级,80个班,现 在要抽取480名学生进行学生身体健康状况调查,运用 简单随机抽样、系统抽样、分层抽样和整群抽样的方法 分别如何抽取样本?
6
二、抽样组织形式及方法
(6) 40,582 7,411 78,346 95,620 37,231 5,436 2,713 93,566 69,205 83,513 27,397 9,756 44,850 35,037 90,852
二、抽样组织形式及方法
(3)简单随机抽样的优点
¾ 方法简单、直观,是最基本的随机抽样组织形式。 ¾ 各种组织形式的随机抽样都是在单纯随机抽样基础上派
1-2. 系统抽样
¾ 也称机械抽样或等距抽样,首先要选择标志将调查对象的 全部个体按一定顺序排队,其次要依简单随机抽样方式从 总体中抽取第一个样本点,即所谓随机起点,然后依据按 某种固定顺序和规律依次抽取其余样本点,最终构成系统 样本。
(1)系统抽样的排序方法
¾ 有关标志排队法
z 有关标志 指用于排队的标志与所调查的项目(指
¾ 确定判定样本单位的通常做法
z 选择最能代表普遍情况的群体作为样本,常以“平均 型”或“多数型”为标准。
z 利用总体的全面统计资料,按照主观设定的某一标 准,选择样本。
24
二、抽样组织形式及方法
2-2.判断抽样
¾ 优点 方便易行,问卷回答率高,适用于探索性调查。 ¾ 缺点 样本质量取决于调查者的业务素质和对目标总
表7-2 随机数表
(2) 69,037 96,070 94,987 21,792 76,940 61,958 64,638 17,964 75,707 59,247 40,951 6,837 69,834 97,334 88,373
(3) 29,655 82,592 66,441 71,635 22,165 83,430 11,359 50,940 16,750 74,955 99,279 96,483 57,402 77,178 26,934
(3)系统抽样的局限性
¾ 系统抽样的前提是要有总体中每个单位的有关材料, 这是一项很复杂、细致的工作。
¾ 当抽选间隔和调查对象本身的循环周期性重合时,就 会影响调查的精度。
¾ 机械抽样的抽样误差计算较为复杂。
12
二、抽样组织形式及方法
1-3.分层抽样
¾ 分层抽样:K是先将包含N个总体单Ni 位i的调查对K象N按=某∑K 一Ni标
第七讲 抽样设计
一、抽样设计的基本问题 二、抽样组织形式及方法 三、样本容量的确定 四、非抽样误差及其控制 五、专 题(穿插其中)
一、抽样设计基本问题
(一)抽样组织形式 (二)样本抽选方法 (三)抽样设计的主要内容 (四)抽样设计的结果评价
抽样使我们能从总体具有代表性的部分样本中获取数据,从而 可以得到关于整个总体的有效结论。
25
二、抽样组织形式及方法
2-3.配额抽样
¾ 配额抽样按配额的要求不同分为: z 独立控制配额抽样 例如,某市进行空调器消费需求调查,确定样本容量为 200名,选择消费者收入、年龄、性别三个标准为控制特 征进行独立控制配额抽样,其各个样本配额比例及配额 数如下表7-3所示。
一、抽样设计基本问题
(二)评价抽样设计的原则
¾ 在费用一定条件下,使估计精度最高。 z 抽样设计中确定不同抽样组织形式的效果是以抽
样误差为基 准,使用比值比较和差值比较 ,即
Deff= D(θ1) D(θ2 ) 或者 差值= D(θ1) − D(θ2)
z 这两种比较方法反映相同经费下两种不同组织形 式抽样误差的差异程度。
———[英]托尼·普罗科特
2
一、抽样设计基本问题
(一)抽样设计的主要内容
¾ 确定调查目的与要求。 ¾ 确定调查对象及其调查范围。 ¾ 确定要收集的资料及其收集方法。 ¾ 编制抽样框。
z 抽样框指抽样调查前在可能条件下作 出的由抽样单元构成的有序名录。
¾ 确定抽样及估算方法。 ¾ 规定精度。 ¾ 确定样本容量。 3 ¾ 经费核算。
¾ 在估计精度一定条件下,使费用最少。
4
二、抽样组织形式及方法
(一)抽样调查的组织形式
¾ 随机抽样调查
z 单纯随机抽样 z 系统抽样 z 分层抽样 z 整群抽样
抽样调查 的类型
¾ 非随机抽样调查 z 方便抽样
z 判断抽样 z 配额抽样
z 滚雪球抽样
随机抽样 调查
非随机抽 样调查
简单随机 抽样调查
分层随机 抽样调查
抽样调查经验。
22
二、抽样组织形式及方法
2-1.方便抽样
¾ 指事先不确定样本点,根据调查者的方便与否来抽取样 本的一种非随机抽样组织形式,也称便利抽样、任意抽 样或偶然抽样。
¾ 优点 操作简便,能及时获得所需要的信息数据,省时省 力,节省调查经费,效率较高,并能为非正式的探索性研 究提供很好的数据源。
0~9的数字随机排列,而且使其中任何号码出现的概
7
率都相同的一张表。其形式如表8-2所示。
二、抽样组织形式及方法
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
8
(1) 32,044 23,821 82,383 68,310 94,856 95,000 20,764 71,401 88,464 59,442 11,818 65,785 5,933 31,722 95,118
¾ 系统抽样需满足的条件 z 调查对象中的每个总体单位都必须而且只属于一个 系统样本; z 任何一个系统样本中所含总体单位数一般都相等; z 任何一个系统样本都具有同等被抽中的机会。
11
二、抽样组织形式及方法
1-2. 系统抽样
(2)常用的系统抽样方式
¾ 随机起点等距抽样。 ¾ 半距起点等距抽样。 ¾ 随机起点对称系统抽样。
N1
n1
N2
n2
··· ···
Nk
nk
样本 n
n1 = n2 = " = nk
等额
k
n = ∑ ni
i =1
等比例
n1
=
Ni N
⋅n
∑ 最优
n1 =
Ni ⋅σi2 Ni ⋅σi2
⋅
n
14
二、抽样组织形式及方法
(1)分层抽样方法
¾ 等比例抽样 ¾ 不等比例抽样
(2)分层抽样的特点
¾ 可同时对各层的指标进行估计。 ¾ 实施灵活方便,便于依托行政管理机构进行组织和实施。 ¾ 可使样本在总体中分布更均匀,从而具有更好的代表性。 ¾ 可缩小抽样误差,提高调查的精度。