第8章 抽样设计
第八章 二阶及多阶抽样课件
n
M
i 2V
( yi)
V1
N
i1
n
E
1
N
2
i1
n2
V1
N
n
Y
i
i1
n
E
1
N
2
n i1
M
2 i
1 f2i mi
S
2 2i
n2
PPT学习交流
15
(2)比估计:
N
Yi
Y M0
i1 N
, 可用比估计
Mi
i1
,以
M
为辅助变量:
i
n
Yˆi
YˆR M 0
i1 n
Mi
PPT学习交流
2
性质l 对于两阶抽样,有
(1)E(ˆ)E1E2(ˆ)
(2 )V (ˆ) V 1 E 2 (ˆ) E 1 V 2 (ˆ)
式中,E2,V2为在固定初级单元时对第二阶抽样 求均值和方差;E1,V1为对第一阶抽样求均值和 方差。
PPT学习交流
3
8.2 初级单元大小相等时的二阶抽样
9.2.1总体均值的估计量: 假定总体由N个初级单元组成,每个初级单元都含有M个次级单元。 从N个初级单元中按简单随机抽样抽取n个初级单元, 在每个被抽中的初级单元中按简单随机抽样抽取m个次级单元。
142 5[1 ( 51.8 4)2(16.15.8 4)2(1 61.8 4)2(1 31.8 4)2(1.5 31.8 4)2] 5(51)
97.6 72 65
PPT学习交流
21
估计量的标准差为 s(Y ˆPP ) S v(Y ˆPP ) S 97.672 6 9 5.8 88 因此,小区居民数为2146人,在置信度为 95%时,估计的相对误差为
八抽样推断考试习题
单项选择題1. 抽样调查的主要目的在于(A. 计算和控制误差B. 了解总体单位情况C .用样本来推断总体 D.对调查单位作深入的研究2. 抽样调查所必须遵循的基本原则是( 人 A.随意原则 B. 可比性原则C .准确性原则 D. 随机氐则3. 无偏性是指( A.抽样指标等于总体指标B. 样本平均数的平均数等于总体平均数C .样本平均数等于总体平均数D.样本成数等于总协成数4. 一致性是指当样本的单位数充分大时,抽样指标( )。
A.小于总体指标B.等于总体指标C .大于总体指标D.充分靠近总体指标5. 有效性是指作为优良估计量的方差与其他估计量的方差相比,有( )A.前者小于后者B.前者大于后者C.两者相等D.两者不等6. 能够事先加以计算和控制的误差是( A.抽样误差 B.登记误差C .代表性误差 D. 系统性误差7. 对两个工厂工人平均工资进行不重复的随机抽样调查,抽查的工人人数一样, 但第二个厂工人数比第一个厂工人数整整多一倍。
抽样平均误差( 人A.第一工厂大B. 第二个工厂大C .两工厂一样大 D.无法做出结论8. 在同样情况下,不重复抽样的抽样平均误差与重复抽样的抽样平均误差相比, 是( )。
A.两者相等B.两者不等C .前者小于后者 D.前者大于后者。
9. 反映抽样指标与总体指标之间抽样的可能范围的指标是(第八章 抽样推断两工厂工人工资方差相同,A.抽样平均误差B. 抽样误差系数C.概率度D. 抽样极限逞差.10. 在进行纯随机重复抽样时,为使抽样平均误差减少25%则抽样单位数应()。
A.增加25%B. 增加78%C. 增加1.78%D. 减少25%11. 在其它同等的条件下,若抽选5%的样本,则重复抽样的平均误差为不重复抽样平均误差的()倍。
A. 1.03B. 1.05 C . 0.97 D. 95%12. 在总体方差一定的情况下,下列条件中抽样平均误差最小的是(A.抽样单位数为20B. 抽样单位数为40C.抽样单位数为90D.抽样单位数为100 13.通常所说的大样本是指样本容量(人A.小于10B. 不大于10C.小于30D. 不小于3014. 抽样成数指标P值越接近1,则抽样成数平均误差值()A. 越大B越小C越接近0.5 D越接近115. 对400名大学生抽取19%进行不重复抽样调查,优等生比重为20%概率为0.9545,优等生比重的极限抽样误差为()。
审计学:《第八章 审计抽样》(2013-2014学年第二学期)
因而得出错误结论的风险。
2、可能导致非抽样风险的原因 (1)注册会计师选择的总体不适合于测试目标 例如,确认应收账款的漏记(完整性认定存在错报)却把
应收账款明细账作为总体。
(2)注册会计师未能适当地定义误差(包括控制偏差或
错报),导致注册会计师未能发现样本中存在的偏差或错 报。
例如,注册会计师在测试现金支付授权控制的有效性时,
分层;
(3)分层可以降低每一层中项目的变异性,从而在抽样风险
没有成比例增加的前提下减小样本规模。 (4)如果注册会计师将某类交易或账户余额分成不同的层, 需要对每层分别推断错报。在考虑错报对该类别的所有交易或 账户余额的可能影响时,注册会计师需要综合考虑每层的推断
错报。
例如,函证应收账款时,可以按应收账款账户金额大小
体的实物就可能是记录在销售明细账中的销售交易,也 可能是销售发票;
③如果认为代表总体的实物遗漏了应包含在最终评价中
的总体项目,注册会计师应选择新的实物,或对被排除 在实物之外的项目实施替代程序。
2、定义抽样单元 抽样单元:是指构成总体的个体项目。可以是实物项目也
可以是货币单元。
(1)在控制测试中,抽样单元通常是能够提供控制运行
第二节 审计抽样的基本原理和步骤
一、审计抽样的三大环节及目的 二、样本设计阶段 三、选取样本阶段
四、评价样本结果
一、审计抽样的三大环节及目的
各环节 1.样本设计 阶段 2.选取样本 阶段
目的 根据测试的目标和抽样总体,制定选取 样本的计划 按照适当的方法从相应的抽样总体中选 取所需的样本,并对其实施检查,以确 定是否存在误差 根据对误差的性质和原因分析,将样本 结果推断至总体,形成对总体的结论
第8章审计抽样和其他选取测试项目
总体变异性 总体规模
总体规模
总体变异性 总体规模
与样本规模的关系 反向变动 反向变动 同向变动 同向变动 影响很小
指审计人员能够容 忍的最大误差
指审计人员预期在审计 过程中会发现的误差
指总体的某一特征(如金额) 在各项目之间的差异程度
(五)、样本选取
(一)总体要求
• 要求审计人员选取的样本对总体而言具有代表性。
第一节 选取测试项目的方法
• 在设计审计程序时,审计人员应当确定选取测试项目的适 当方法,具体包括: (1)选取全部项目 (2)选取特定项目 (3)审计抽样
一、选取全部项目 • 通常存在下列情形之一时,审计人员应考虑选取全部项目
进行测试: 1.总体由少量的大额项目构成。 2.存在特别风险且其他方法未提供充分适当的审计证据。 3.由于信息系统自动执行的计算或其他程序具有重复性, 对全部项目进行检查符合成本效益原则。 • 对全部项目进行检查,通常更适用于细节测试,而不适合 控制测试。
项目将没有机会被选取,因此,选取特定项目进行测试 不能根据所测试项目中发现的误差推断审计对象总体的 误差。 4、当总体的剩余部分重大时,审计人员应当考虑是否需要 针对该剩余部分获取充分、适当的审计证据,即对剩余 项目实施审计程序,包括实施分析程序和细节测试。
三、审计抽样
1、定义 • 审计抽样是指审计人员对某类交易或账户余额中低于百分
导致审计人员得出错误结论的可能性。 • 对于非抽样风险,即使对总体中的所有项目实施检
查,审计程序也可能无效。 2、可能导致非抽样风险的原因包括 (1)审计人员选择的总体不适合于测试目标。 (2)审计人员未能适当地定义控制偏差或错报,导致
审计人员未能发现样本中存在的偏差或错报。 (3)审计人员选择了不适于实现特定目标的审计程序。 (4)审计人员未能适当地评价审计发现的情况。 (5)其他原因。
08-第八章_整群抽样
i = 1,2, , N ; j = 1,2,, M 。记 y ij 为样本第 i 群中第 j 的小单元(次级
单元)的指标值, i = 1,2, , n ; j = 1,2, , M ,又 f =
n 是抽样比。 N
Yi = å Yij , y i = å y ij
j =1 j =1
M
M
分别是总体和样本中第 i 群的指标和,简称为群和。
过程完毕。 在求出了总体均值 Y 的无偏估计量 y 及其方差 V ( y ) 后,我们现在求估 计量方差的估计量 v( y ) 。 容易知道, v( y ) = 过程如下: 因为对群的抽样是简单随机的, 若将 Y i =
1- f 2 sb nM Yi 看作是单元指标值, 则Y i M
的样本方差
2 sb S2 2 2 是总体方差 b 的无偏估计,从而 sb 是 Sb 的无偏估计。也 M M
N
N
M
因为中间项等于零
N é M ù ( Y Y )( Y Y ) = ( Y Y ) (Yij - Y i )ú i i i ê åå å å ij i =1 j =1 i =1 ë j =1 û N M
= å (Y i - Y ) × 0
i =1
N
=0
所以平方和的分解式变为
åå (Yij - Y ) 2 = åå (Yij - Y i ) 2 + åå (Y i - Y ) 2
过程如下: 如果将 Z i =
1 M (Yij - Y i ) 2 作为单元的指标值,则它的样本均值 å M - 1 j =1
n M 1 n é 1 M 1 2ù 2 y y = ( ) ( yij - y i )2 = sw åê å ij i ú n( M - 1) åå n i =1 ë M - 1 j =1 i =1 j =1 û
第八章审计抽样
8.1概述 8.2样本的设计与选取 8.3抽样结果的评价 8.4统计抽样的具体运用
第一节 审计抽样概述
一、审计测试项目的选取方法 在设计审计程序时,审计人员应当确定选取
测试项目的适当方法。审计人员可以使用选取 全部项目、选取特定项目和审计抽样等三种方 法。
(一)选取全部项目
2.非抽样风险
非抽样风险是指由于某些与样本规模无关的因素而导致 审计人员得出错误结论的可能性。即使注册会计师对全部 样本实施某种审计程序,仍未能发现重大错报或控制失效 的可能性,可见非抽样风险与样本规模无关。
显然,这种风险并非抽样所致,而是由其他因素引起的。 导致非抽样风险的原因主要包括:审计人员未能辨别样本中的 错误、运用不当或无效的审计程序、错误解释样本结果等。
2.审计抽样的含义
审计抽样是指审计人员对某类交易或账户余 额中以低于百分之百的项目实施审计程序,使所 有抽样单元都有被选取的机会;这使得注册会计 师能够获取或评价与被选取项目的某些项目有关 的审计证据,以形成和帮助形成队从中抽取样本 总体的结论。其中抽样单元是指构成总体的个体 项目;总体是指审计人员从中选取样本并据此得 出结论的整套数据。总体可以分成多个层次或子 总体,每一层次或子总体可分别予以检查。
例如,审计人员在决定使用审计抽样时,必须依 靠专业判断去决定是运用统计抽样还是运用非统计 抽样。而在运用统计抽样的全过程中,如确定审计 对象总体及其特征、设计与选择样本、对抽样结果 进行质量和数量的评价等,审计人员也均需要运用 专业判断。
第二节 样本的设计与选取
一、样本的设计
审计人员运用审计抽样方法需要在科学、具体 的规划指导下进行。在抽样之前,首要的工作是进 行样本设计。
(二)属性抽样与变量抽样
第8章 传统变量抽样
二、在细节测试中使用统计抽样统计抽样和非统计抽样的流程和步骤完全一样、只是在确定样本规模、选取样本和推断总体的具体方法上有所差别。
注册会计师在细节测试中使用的统计抽样方法主要包括传统变量抽样和概率比例规模抽样法(以下简称PPS抽样)。
两种统计抽样方法的区别主要体现在确定样本规模和推断总体两个方而。
(一)传统变量抽样传统变量抽样在确定样本规模时需要量化可接受的抽样风险、可容忍错报、预计总体错报等影响因素,并代入专门的统计公式中计算所需的样本数量。
根据推断总体的方法不同,传统变量抽样又可以分为三种具体的方法:均值估计抽样、差额估计抽样和比率估计抽样。
1.均值估计抽样。
均值估计抽样是指通过抽样审査确定样本的平均值,再根据样本平均值推断总体的平均值和总值的一种变量抽样方法。
使用这种方法时,注册会计师先计算样本中所有项目审定金额的平均值,然后用这个样本平均值乘以总体规模,得出总体金额的估计值。
总体估计金额和总体账面金额之间的差额就是推断的总体错报.例如,注册会计师从总体规模为1000、账面金额为1 000 000元的存货项目中选择了200个项目作为样本。
在确定了正确的采购价格并重新计算了价格与数量的乘积之后,注册会计师将200个样本项目的审定金额加总后除以200,确定样本项目的平均审定金额为980元。
然后计算估计的存货余额为980 000元(980×1 000)。
推断的总体错报就是20 000元(1 000 000-980 000)。
2.差额估计抽样。
差额估计抽样是以样本实际金额与账面金额的平均差额来估计总体实际金额与账面金额的平均差额,然后再以这个平均差额乘以总体规模,从而求出总体的实际金额与账面金额的差额(即总体错报)的一种方法。
差额估计抽样的计算公式如下:]推断的总体错报=平均错报×总体规模使用这种方法时,注册会计师先计算样本项目的平均错报,然后根据这个样本平均错报椎断总体。
例如,注册会计师从总体规模为1 000个的存货项目中选取了200个项目进行检査。
抽样调查-第8章多阶段抽样
Yu
N n
n i1
Mi
yi
N n
n
Yi
i1
根据性质1,不仅可以证明这个估计量是无偏的,并
且它的方差为:
V (Yu )
N 2 (1 n
f1)
1 N
1
N i1
(Yi
Y )2
N n
N i1
M
2 i
(1
mi
f
2i
)S
2 2i
V (Yu ) 的一个无偏估计为:
例如:某个新开发的小区拥有相同户型的15个 单元的楼盘,居民已经陆续搬入新居,每个单元住 有12户居民,为调查居民家庭装修情况,准备从 180户居民户中抽取20户进行调查。如下表:
编号 单 元
房
号
1 一栋A座 1 2 3 4 5 6 7 8 9 10 11 12 2 一栋B座 1 2 3 4 5 6 7 8 9 10 11 12 3 一栋C座 1 2 3 4 5 6 7 8 9 10 11 12 4 二栋A座 1 2 3 4 5 6 7 8 9 10 11 12 5 二栋B座 1 2 3 4 5 6 7 8 9 10 11 12 6 二栋C座 1 2 3 4 5 6 7 8 9 10 11 12 7 三栋A座 1 2 3 4 5 6 7 8 9 10 11 12 8 三栋B座 1 2 3 4 5 6 7 8 9 10 11 12 9 三栋C座 1 2 3 4 5 6 7 8 9 10 11 12 10 四栋A座 1 2 3 4 5 6 7 8 9 10 11 12 11 四栋B座 1 2 3 4 5 6 7 8 9 10 11 12 12 四栋C座 1 2 3 4 5 6 7 8 9 10 11 12 13 五栋A座 1 2 3 4 5 6 7 8 9 10 11 12 14 五栋B座 1 2 3 4 5 6 7 8 9 10 11 12 15 五栋C座 1 2 3 4 5 6 7 8 9 10 11 12
2012年统计学第8章抽样调查理论与方法
8-26
一、估计总体均值时样本容量的确定
重复抽样时
1. 估计总体均值时样本容量n为 允许误差
n x
(z 2 )2 2
2
x
其中: x
z 2
n
2. 可见,样本容量
✓ 与总体方差成正比 ✓ 与允许误差成反比 ✓ 与置信度成正比
《统计学》第8章抽样调查理论与方法
8-27
不重复抽样时:
n x
NZ2 / 2 2
X
1 N
N i 1
Xi
N
X Xi N X
i 1
总体比例 总体方差 标准差
P N1 ,Q N0 N N1 1 P N NN
2
1 N
N
(Xi X )2
i 1
1 N
N
( Xi X )2
i 1
《统计学》第8章抽样调查理论与方法
8-9
统计量:是根据样本的n个单元的变量值计 算出来一个量,也叫估计量
解:Q N 15000 n 150
p 147 98% 150
p
p(1 p) n
0.98 (1 0.98) 1.14% 150
若按不重复抽样方式:
p
p(1 p) (1 n ) 0.98 (1 0.98) (1 150 ) 1.1374%
n
N
150
15000
《统计学》第8章抽样调查理论与方法
8-24
8.5.1影响样本容量确定的主要因素
总体被研究标志的变异程度 调查者对推断精确度的要求 抽样调查的方式和方法 人力、物力和财力的允许条件
《统计学》第8章抽样调查理论与方法
8-25
8.5.2 样本容量的确定
一、估计总体均值时样本容量的确定 二、估计总体比率时样本容量的确定
《市场调查与预测》第八章 抽样设计(28P)
▪ 分层抽样在操作上分为四种方法:比例分层、纽 曼分层、德明分层和多次分层。
2020/6/24
17
概率抽样方法
❖4.整群抽样(Cluster Sampling)
▪ 指首先将调查总体区分为若干群,然后采用SRS方法 抽出部分群作样本,最后对这些样本群进行全面调查。 即,两段整群抽样。在两段整群抽样中,如果不对所 抽样本群进行全面调查,而是进一步将这些群划分为 若干小群,然后按照随机原则抽出一部分群进行全面 调查,就形成所谓的三段整群抽样。
▪ 整群抽样有以下主要优点:
• 由于样本相对集中,整群抽样能大大降低数据收集的费用。 • 当总体单位自然聚合成群时,创建地域抽样框较容易;
• 对于研究变量而言,若群内单元差异大且群间差异小,则整 群抽样策略比SRS的统计效率更高。
2020/6/24
18
概率抽样方法
❖5.与个体大小成比例的概率抽样(PPS)
▪ 使用前须评估要素:所需费用;涵盖范围;更新频率; 来源稳定性;定义一致性;合法且正式的关系。
2020/6/24
8
抽样框架的类型
❖2.区域框
▪ 区域框是指个体由地理区域构造的一种特殊的 名录框,调查总体则由这些地理区域组成。
▪ 区域框适用于以下所述两种情况:
• 当调查本质就是地理性质的; • 或者调查机构不能获得一个适当的名录框。
▪ 时效性: 时效应该用抽样框架的更新日期与调查标准 日期的接近程度来计量。
▪ 费用大小: 1)衡量为建立抽样框花费的总费用。2) 将建立抽样框的费用与本次调查总费用进行比较。
2020/6/24
12
8.3 抽样方法
35第8章抽样调查理论与方法
《统计学》第8章抽样调查理论与方法
8-11
概率抽样
(probability sampling)
又称随机抽样,是指依据随机原则,按照某种事 先设计的程序,从总体中抽取部分单元的抽样方 法
特点
✓ 按一定的概率以随机原则抽取样本
抽取样本时使每个单位都有一定的机会(概率)被 抽中
“随机”不等于“随便” “随机”不等于“等概率” ✓ 用样本指标数值去推断总体的指标数值
✓ 抽样调查会产生抽样误差,这个误差可以计算,并且 可以加以控制
2020/3/25
《统计学》第8章抽样调查理论与方法
8-12
概率抽样 (probability sampling)
概率抽样被视为狭义的抽样调查,在实践中被广 泛加以采用,通常所谓的抽样调查,均指概率抽 样调查。
概率抽样有多种形式:简单随机抽样、分层抽样、 系统抽样、整群抽样等。
2020/3/25
《统计学》第8章抽样调查理论与方法
8-6
便利抽样
是根据调查者的方便与否来抽取样本的一种非概 率抽样方法。典型的形式是“拦截式”调查。调 查过程中由调查员依据方便的原则,自行确定入 抽样本的单位
✓调查员在街头、公园、商店等公共场所进行拦 截调查
✓厂家在出售产品柜台前对路过顾客进行的调查
8-15
分层抽样
(stratified sampling)
一般选择“平均型” 、“众数型”、“特殊型” 单元作为样本
样本量小及样本不易分门别类挑选时有其较大的优 越性
由于其估计精度严重依赖于研究者对调查对象的了 解程度、判断水平和对结果的解释情况,所以,一 般不轻易地用于对总体进行数量方面的判断
2020/3/25
《统计学》第8章抽样调查理论与方法
第8章 工作抽样
35
7、观测数据的整理与分析
管理界限 P 3 P(1 P) n
式中:P ——观测事项发生率的百分数;
n ——平均每日观测次数。
36
7、观测数据的整理与分析
例:某观测结果如下表所示
观测班次 1 2 3 4 5 6
合计
每班观测次数(N) 工作次数 工作比率(%)
8.2 工作抽样原理与方法步骤
一、工作抽样的原理
工作抽样是根据数理统计的理论,以概 率论作为基础的方法,即从“母集团 (总体)”中随机地取样本,如果这个 样本足够大,则从样本的性质可以推断 出总体的状态。
14
一、工作抽样的原理
⒈正态分布 工作抽样法处理的现象接近于正态分布曲线。
68.27%
40
7、观测数据的整理与分析
P 129 124 125 119 120 77.13% 160 5
E 2 P(1 P) 2 0.7713(1 0.7713) 0.0297
Байду номын сангаас
n
160 5
S 2 1 0.7713 0.0388 160 5
41
7、观测数据的整理与分析
原选择的相对精度为±5%,故此可以肯 定观测有效。
100
%
标准时间
总观测时间 工作比率 平均绩效指标 观测期间的总产量
宽放
提供人工效率因素: 人工效率因素=工作比率×平均绩效指标 确定宽放时间
11
8.1 工作抽样概述
四、工作抽样的优缺点
⒈ 优点 ⑴高效经济;国外经验,是秒表研究费
用的5%~50%。 ⑵观测数据失真小,准确性高;——作
53 54
将1h分成60格(60分钟),然后随机取出10个数作 为观测的时分,如4,9,12,19,25,29,34,47, 53,54。观测结果:3次空闲,7次工作,则:
第8章 在细节测试中使用非统计抽样(样本设计)
【考点8.4】审计抽样在实质性细节测试中的应用I.测试目标掌握审计抽样的基本概念和内容,达到能力等级(2级)II.考点精讲一、在细节测试中使用非统计抽样方法(一)样本设计阶段在细节测试中进行审计抽样,可能使用统计抽样,也可能使用非统计抽样。
两种抽样方法的基本流程和主要步骤相同,但在部分环节所用的具体方法有所差别。
实施细节测试时,注册会计师在样本设计阶段必须完成的工作包括四个环节:明确测试目标、定义总体、定义抽样单元,以及界定错报。
1.明确测试目标在细节测试中,抽样通常用来为有关财务报表金额的一项或多项认定(如应收账款的存在性)提供特定水平的合理保证。
因而细节测试旨在对各类交易、账户余额或披露的相关认定进行测试,尤其是对存在或发生、计价认定的测试。
注册会计师实施审计程序的目标就是确定相关认定是否存在重大错报。
通过在账户余额中选取项目进行测试,注册会计师可以检查出那些虚构项目、余额中不应包含的项目(分类错误的项目)以及评估错误的项目。
2.定义总体(1)考虑总体的适当性和完整性。
注册会计师应确信抽样总体适合于特定的审计目标。
例如,注册会计师如果对已记录的项目进行抽样,就无法发现由于某些项目被隐瞒而导致的金额低估。
为发现这类低估错报,注册会计师应从包含被隐瞒项目的来源选取样本。
例如,注册会计师可能对随后的现金支付进行抽样,以测试由隐瞒采购所导致的应付账款账面金额低估;或者对装运单据进行抽样,以发现由已装运但未确认为销售的交易所导致的低估销售收入问题。
2)识別单个重大项目(超过可容忍错报应该单独测试的项目)和极不重要的项目。
在细节测试中计划抽样时,注册会计师应当运用职业判断,判断某账户余额或交易类型中是否存在及存在哪些应该单独测试而不能放在抽样总体中的项目。
某一项目可能由于存在特別风险或者金额较大而应被视为单个重大项目。
注册会计师应当对单个重大项目逐一实施检查,以将抽样风险控制在合理的范围。
单个重大项目包括那些潜在错报可能超过可容忍错报的所有单个项目,以及异常的余额或交易。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
又叫多重抽样,先抽取一有很多单位的大样本,收集 基本信息,然后在这个大样本中抽一个子样本,收集 更详细的信息。第一相收集的数据能够用于分层及筛 选信息,同时也可以用来提高估计的效率。 适用于抽样框缺乏辅助信息,而想对总体进行分层或 筛选部分总体的情况。如:养牛场信息调查。 适用于预算不足,或工作量太大,或调查内容中项目 数据收集成本差异太大。如:健康调查。
14
抽样框的评估
1.抽样框的可能缺陷
不完全覆盖(如新注册成立的公司) 过涵盖(如破产注销的公司) 重复 分类错误
15
2.合格抽样框的标准
关联性:抽样框与目标总体对应的程度和据此与目标 总体的个体接触难易程度的一种度量。 精确性:涵盖误差、分类误差、联系资料。 时效性:抽样框的更新日期与调查标准日期的接近程 度来计量。 费用大小:衡量建立抽样框花费的总费用;并与本次 调查的总费用进行比较。
39
缺点:
注册会计师的审计PPS抽样例子
40
6.其他概率抽样方法
1)多阶段抽样
两个或以上连续阶段抽取样本的过程。第一阶段抽取的单位 成为初级单位,第二阶段抽取的单位称为次级抽样单位,以 此类推。 例如:第一阶段:地理区域,第二阶段:小区内住所; 例如:第一阶段:时间单位,第二阶段:乘客;若更复杂则 第二阶段:达到的客机,第三级单位:飞机上实际座位。
3.分层抽样
又叫分类随机抽样,指将调查总体中的所有单位按照 一定的属性或特征分为不相重叠的若干层次(或类 别),然后每一个层次中进行简单随机抽样或等距抽 样。 对总体分层的标志为总体的某种重要属性或特征。 分层的目的是使样本在各层、类中分布均匀,具有更 好代表性,因此层间要差别明显,层内应保持一致性。
35
分群抽样与分层抽样的比较
层 内 差 异 小 层间差异大
a
a a a
a
a a
a
a a a
b b
b
b
b b
层2
c c c c c c c c c c c c
层3
层1
分层抽样的各层
群 内 差 异 大 群间差异小
a a a c b b b c d a c b a c b c a c b b a b a c b c a c b
缺点:
37
5.与个体成大小比例的概率抽样(PPS)
PPS(Probability Proportionate to Size Sampling) 抽样是一种使用辅助信息从而使入样概率不相等(每 个单位按其规模大小成比例的被抽中概率 )的抽样技 术。 PPS抽样可以如同大海捞针一样发现极少量的大额错报 (不适合测试低估),原因在于它通过将少量的大额 实物单元拆成数量众多、金额很小的货币单元,从而 赋予大额项目更大的机会被选入样本。
; 更高的代表性,避免产生“差的”样本; 操作和管理简便; 在不同层可以采用不同抽样框和抽样方法。 抽样框单元辅助信息; 费用高,复杂; 如果调查变量与分层变量不相关,统计效率可能比简单随 机抽样更低; 估计值计算比简单随机抽样和系统抽样稍复杂。
34
缺点:
优点:
简单、典型、易于理解; 抽样框不需要其他信息就能进行抽样; 理论成熟,样本推断总体比较可靠; 构建抽样框可能较困难;
样本可能很大、地理可能很分散,增加了时间和成本;
不足:
精度较低; 样本不一定具有很好的代表性。
23
2.系统抽样(SYS)
又叫等距抽样或机械抽样,指将调查总体单位按照一 定标志进行顺序排列,然后根据总体单位数和样本单 k k 位数计算抽样间距( ),并从抽样框中每隔 个单位 抽选一个个体,组成样本。
群3
a b
c a
群2
群1
分群抽样的各群
36
整群抽样的优缺点
优点:
大大减低调查费用; 总体单位自然聚合时,按外观或地域标准创建群组比简单随 机抽样或系统抽样更容易; 群内单元差异大、群间差异小,效率更高。 如群内调查单元趋同(群内差异小),则效率较低; 无法明确调查样本数目; 组织较为复杂。 方差估计可能较简单随机抽样复杂。
11
抽样框的类型
1.名录框
一份涵盖所有总体中个体的实际的或概念的名录清单。 概念名录框:某天早上8点-9点之间进入某购物中心停 车场的所有车辆名录,是临时性的。 实际名录框:各级政府或特定机构因各自的管理需要 都保存一些名录,是对抽样框进行维护的最有效资料 来源。如生命统计等登记、商业注册、地址邮政编码 册、电话号码薄。
抽样间距( k) 总体单位数( N) 样本单位数( n)
总体单位:50000 样本量:500 抽样间距:50000/500=100 在1~100中随机确定一个初始单位如36,则可以确定其他样本序号
24
四舍五入
系统抽样中,总体单位的排列顺序决定了按抽样间距所抽 取样本的代表性。 1)排序指标与需要研究特征无关,则与简单随机抽样 类似; 2)排序指标与需要研究的特征有关,增加代表性; 3)如果总体排序呈现循环特征,抽样间距如与循环周 期相同则降低代表性。
4.整群抽样
指首先将调查总体区分为若干群,然后采用简单随机 抽样方法抽出一部分群作为样本,最后对这些样本群 进行全面调查。 整群抽样与分层抽样的区别:
1)分层标准是与调查主题内容密切相关的总体属性或特征, 整群抽样标准则是调查总体的外部标志(区域) 2)分层抽样层内差异小,整群抽样群间差异小,都可以采 取简单随机抽样 3)适用性不同
3
2、相对劣势
(1)不支持小区域估计 (2)不支持稀少个体的特征估计 (3)调查误差 (4)其他考虑
4
抽样设计的程序
5
程序1:定义目标总体
(注意跟调查总体的区别)
定义目标总体的四个因素:
总体中个体的类型。个人、家庭还是企业单位; 个体的特征。包括人口统计特征、行为甚至心理特征; 个体地理位置。即区域范围; 调查的标准时点或时期。
19
概率抽样方法
1.简单随机抽样 2.系统抽样 3.分层抽样 4.整群抽样 5.与个体成大小比例的概率抽样 6.其他概率抽样方法
20
1.简单随机抽样(SRS)
按照随机原则,从总体中不加任何分组、分类、排序 等先行工作,直接地抽取样本,适合于均匀总体。 重复抽样 非重复抽样
27
1)分层比例抽样
分层比例抽样法就是按照每个层次单位的数量占总体单位数的 比重,等比例地分配各层的样本单位数。计算公式:
ni n( Ni / N )
N ——总体单位数;
Ni ——第i层总单位数;
n ——样本总数; ni ——第i层抽取样本单位数。
28
例子
29
2)纽曼分层抽样
不是简单按照各层单位数占总体单位数的比例分配样本数量,而 是结合考虑其他因素调整各层的样本单位数,如重要性、差异性 等。 理由:①照顾比例小的层或类;②增加异质性较大的层或类的单 位数;③增加重要的层或类的样本单位。
21
简单随机抽样——随机数表法 [P366附录B-1]
1. 将总体进行编号,并确定样本量; 2. 确定使用随机数的哪几位数字作为样本编号; 3. 随机选择选样的起点、方向,抽取样本; 4.对于符合要求的单位作为一个样本,对于重复的单位只取一个后 补充增加。
22
简单随机抽样的优点和不足
25
系统抽样的优点和不足
优点:
没有抽样框时,可以代替简单随机抽样; 不需要抽样辅助信息; 与简单随机抽样相比,系统抽样样本分布较好 成熟的理论,估值容易; 简单、成本低、容易实现。 周期性; 抽样效率不高;
26
不足:
分层抽样
分层比例抽样 纽曼分层抽样 德明分层抽样 多次分层抽样
41
多阶段抽样的优缺点
优点:
群变量同质时,多阶段抽样比整群抽样效率高; 样本分布比简单随机抽样集中,所需时间和费用低; 不需要整个总体的抽样框。
缺点:
比简单随机抽样效率低; 不能提前知道多阶段抽样的样本量; 调查组织更复杂; 估计值和方差计算更复杂。
42
2)多相抽样
N i Si Ci ni n ( N S C ) i i i
Ci ——第i层每个样本单元调查费用的估计值
32
4)多次分层抽样
指对调查总体进行初次分层后,再对某些层进 行第二次甚至第三次分层,以便可以在每层内 按照简单随机抽样方法抽取样本。
33
分层随机抽样的优点缺点
6
程序2:制定抽样框架
对目标总体定义后,需要决定辨别和接触总体中个体 的手段或途径。抽样框架提供抽取样本的工具或名单, 提供了辨别和联系调查总体中个体的有效途径。
7
程序3:选择抽样方法
放回抽样(重复抽样)与非放回抽样(非重复抽样) 概率抽样与非概率抽样 抽样误差与抽样方法、样本量相对总体的大小等相关
17
8.3 抽样方法
抽样方法分类及特点
概率法则:任意为非立意 按是否严格遵循概率法则,分为概率抽样和非概率抽 样 概率抽样最大特点是:可确定样本估计值的精度,计 算置信区间,对总体进行合理推断; 非概率抽样的特点是:操作简便、时效快、成本低, 可以推断总体但无法确定精度。