PPS抽样PPT精选文档
第四章 审计抽样-概率比例规模抽样(简称PPS抽样)
2015年注册会计师资格考试内部资料审计第四章 审计抽样知识点:概率比例规模抽样(简称PPS抽样)● 详细描述:1.PPS抽样的概念 PPS抽样是一种运用属性抽样原理对货币金额而不是对发生率得出结论的统计抽样方法。
PPS抽样以货币单元作为抽样单元,有时也被称为金额加权抽样,货币单元抽样,累计货币金额抽样,以及综合属性变量抽样等。
假定注册会计师欲从9张销售发票组成的总体中选择4张进行测试,已知9张发票总计金额为5 000元,总体项目单位的累计金额表如下:采用系统选样:系统选样首先要将总体分为几个有同样的货币单位构成的组,并从每一组中选择一个逻辑单元(即实际单位)。
每组的货币单位数量就是抽样间隔。
假定本例中拟抽取4个样本,则抽样间隔=5 000÷4=1 250。
在第一个间距内选择随机数500,则选出的4个样本数额为500,1 750,3 000,4 250,这4数字分别包含在第1,3,6,7张销售发票的累计金额以内,选择样本即为这4张发票。
在该方法下总体中的每个货币单元被选中的机会相同,所以总体中某一项目被选中的概率等于该项目的金额与总体金额的比率。
项目金额越大,被选中的概率就越大。
如果某逻辑单元的账面金额超过抽样间隔,它可能不止一次的被选中。
注册会计师进行PPS抽样必须满足两个条件: (1)总体的错报率很低(低于10%),且总体规模在2000以上。
(2)总体中任一项目的错报不能超过该项目的账面金额(不适合于查低估)。
2.PPS抽样的优缺点 PPS抽样的优点: (1)PPS抽样一般比传统变量抽样更易于使用。
由于PPS抽样以属性抽样原理为基础,注册会计师可以很方便地计算样本规模,手工或使用量表评价样本结果。
(2)PPS抽样可以发现极少量的大额错报,原因在于它通过将少量的大额实物单元拆成数量众多、金额很小的货币单元,从而赋予大额项目更大的机会被选入样本。
(3)PPS抽样的样本规模不需考虑被审计金额的预计变异性。
PPS抽样
PPS抽样:
(1)请计算抽样规模和抽样间隔;
总体错报上限 =基本界限+第1个错报所增加的错报上限+第2个错报所增加的上限
其中:
BV――账面金额合计
――错报最大发生率(最大错报数量:MFx ;样本规模:n)
t ――错报比例
简化公式:
推断总体错报=(t1+t2+……+t n)×抽样间隔
样本规模n= =150
抽样间隔I=3000000÷150=20000
(2)如果在样本中发现了2个错报。
第一个账面金额为1000元的项目有500元的高估错报,第二个账面金额为2000元的项目有1600元的高估错报。
请分别推断总体错报和估计总体错报上限;
错报比例:t1=1600/2000=0.8 t2=500/1000=0.5
总体错报上限=(3000000 × 3.00/150 × 1)+(3000000 ×1.75/150 ×0.8)+(3000000×1.55/150×0.5)
=60000+28000+15500=103 500(元)
其中包含的推断错报为26 000元(0.8×20 000+0.5×20 000)
细节测试统计抽样——传统变量抽样:
初始样本规模可用下列公式计算:
细节测试非统计抽样:
控制测试中统计抽样:样本规模(查表法)。
PPS抽样
甲:800户居民
乙:200户居民
甲居委会每一户居民被抽中的概率=20/200 × 50/800=1/160 乙居委会每一户居民被抽中的概率=20/200 × 50/200=1/40
不符合等概率原则
1. PPS抽样——概率与元素的规模大小成比例的抽样 (Sampling to Size)
《社会调查与统计分析》
第四章 抽样
知识点10 PPS抽样
学习导航
PPS抽样
PPS抽样的定义 PPS抽样的原理 PPS抽样的具体操作
1. PPS抽样——概率与元素的规模大小成比例的抽样 (Sampling with Probability Proportional to Size)
多段抽样暗含的假定:每一个阶段抽样时,其元素的规 模是相同的。
原理:以阶段性的不等概率换取最终的、总体的等概率 。
实质:在第一个阶段中,大的群被抽中的概率大,而小 的群被抽中的概率小;这样到了第二个阶段,被抽中的 大的群中的元素被抽中的概率就小于被抽中的小的群中 的元素了。正是这一大一小,平衡了由于群的规模不同 带来的概率差异。
2. PPS抽样的原理
每一个元素被抽中的概率
甲居委会中居民被抽中的概率=20×1/125×1/16=1/100 乙居委会中居民被抽中的概率=20×1/500×1/4=1/100
3. PPS的具体操作
例2:从全市100家企业(总共20万名职工)中,抽取 1000名职工进行调查。
THE END
谢 谢 观 看!
=
所抽取的群数
群的规模 总体规模
平均每个群中要抽的元素 群的规模
=所抽取的群数╳平均每个群中所要抽取的元素/总体的规模 =样本规模/总体规模
抽样PPT优选课件
2020/10/18
12
谢谢您的聆听与观看
THANK YOU FOR YOUR GUIDANCE.
生病的次数 1-2次 3-6次
7次以上
人数 4 5 1
(1)你同意他们的做法吗?说说你的理由.
(2)为了了解我市老年人的健康状况,你认为应当怎样收集数
据?与同伴交流.
2020/10/18
6
(3)小华利用派出所的户籍网随机调查了该地区10% 的老年人,发现他们一年平均生病3次左右你认为他的 调查方式如何?
3.下列叙述正确的是( B )
A. 大样本一定能保证调查结论正确 B. 抽样调查时,既要关注样本的大小,又要关注样本的代表性 C. 大样本调查一定比小样本调查准确 D. 所有调查都应该采用普查,而不应该采用抽样调查
2020/10/18
9
4.为了估计湖里有多少条鱼,我们从湖里捕上100条做上标记, 然后放回湖里,经过一段时间待带标记的鱼完全混合于鱼群 中后,第二次捕得200条,发现其中带标记的鱼25条,通过这种
象小华这种随机调查的方式是收集数据常用的方法
议一议: 抽样调查时应注意什么?
答:抽样调查时要注意样本的代表性和广泛性.即被调查的 对象不得太少,被调查对象应是随意抽取的,调查数据应 是真实的。
抽样调查的可行性:
1.抽样调查只考查总体的一部分,因此它的优点是 调查范围小,节省时间、人力、物力和财力;
2.但其调查结果往往不如普查得到的结果准确.
PPS抽样法
“ 确定样本规模
①公式法 ②查表法
总体账面价值 风险系数 可容忍错报(预计总体错报 扩张系数)
确定样本规模的时候,并没有进行测试,所以这时并不知道是存 在几个错报。因此先根据假设错报为0时计算出样本规模,进而 计算出基本界限。
PPS抽样法“怎么抽”?
“ 选取样本方法
①随机选样法 ②系统选样法
“优
计算简单,不用计算标准差 易于发现极少量的大额错报,被选中概率和规模成正比。 样本规模无需考虑预计变异性,货币单元无差异性 生成的样本自动分层,如果项目超过选样间距,PPS将 自动识别所有单个重大项目 如果预计错报不存在或很小,PPS样本规模通常比传统 变量抽样方法更小
PPS抽样法的优缺点
概率比例规模抽样法
“ PPS抽样
Probability Proportionate to Size Sampling
PPS抽样的特征和条件
抽样单元
货币单元
特征
总体规模
实物单元 金额累计
总体错报率很低(低于10%),且总体规模在2000以上。 总体中的任意项目错报不能超过该项目的账面金额。
PPS抽样法“抽多少”?
“缺
实物单元的错报金额不能超出其账面金额,即t≤1。 金额被低估,被选取的概率更低。不适用于测试低估。 零余额项目在PPS抽样中不会被选取,负余额需要分离 出去。需要特别考虑零余额和负余额 错报金额越大,t越大,误拒风险增大。总体错报数量增 加,为了减少误拒风险需要增加样本规模。。 注册会计师需要逐个累计总体金额。
PPS抽样法
“ THA
①推断总体错报 ②总体错报上限
错报比例(t)= 错报金额/项目账面金额 ① 如果样本中没有发现错报 按降序排列错报比例 ② 如果样本中发现1个错报 t1>t2>t3 …… ③ 如果样本中发现2个错报… 总体错报上限=基本界限+发现错报 所增加的错报上限
PPS抽样与户内抽样
➢ 原理:“对冲” 以阶段性的不等换取最终的相等。
➢ 实质:第一阶段中,大的群具有比小的群更大的概率,
➢
而到了第二阶段,每个被抽中的群都抽取同样多
➢
的元素,即小群中元素被抽中的概率大于大群的,
➢
两相平衡。
精品课件
PPS原理公式:
每个元素被抽取的概率=
所抽取群
的数目
( 群的规模 ) 总体的规模
(平均每个群要抽取的元素) 群的规模
此假定显然与实 际不符,易造成
较大的误差
PPS
bug
patch
精品课件
什么是PPS抽样:
➢ 定义:是一种通过使用辅助信息,使得每个抽样单位
都可以按照其规模大小及在总体中所占比例确
定各自被抽取的概率,从而确保各个抽样单位
被抽取的概率相等的一种抽样方式。
➢ 特点:概率与元素规模大小成比例,即不等概率。
从中抽出公管1、公管2两个班级
获取两个班体育成绩前十的同学名单
两个班明显规 模不一样,却 抽取了同样数
目的运动员
各从中随机取6个 同学作管院代表
精品课件
你认为,这 合理吗?
多段抽样暗含的假定:
在进行每一个阶段的抽样时,其元素的规模大 小相同。也就是说,在进行多段抽样前,我们 已经人为地假定了每一个阶段中各个抽样单位 的规模是相等的,即各个抽样单位被抽中的概 率相等
第四节
PPS抽样 与户内抽样
精品课件
一、户内抽样
精品课件
概念
◦ 户内抽样(within-household sampling),指的是 以家庭为分析单位时,从所抽中的家庭中抽取一个 成年人,以构成访谈对象的抽样方法。
方法:Kish选择法
PPS抽样——精选推荐
第六章 不等概率抽样第一节 等概率抽样概述一、不等概率抽样的必要性在简单随机抽样中,总体(或层)中的每个单元入样的概率都相等。
但是在许多实际问题中,我们还需要使用不等概率抽样。
一种情况是调查的总体单元与抽样总体的单元可能不一致; 另一种需要用到不等概率抽样的情况是,抽样单元在总体中所占的地位不一致;第三种需用不等概率抽样的情况是为了改善估计量的特性。
二、不等概率抽样的主要分类不等概率抽样可按多种原则进行分类。
放回抽样与不放回抽样。
对于不放回抽样,按其样本单元抽取方式的不同又可分为:逐个抽取法;重抽法;系统抽取法;全样本方法。
三、不等概率抽样的特点不等概率抽样的主要优点是由于使用了辅助信息,提高了抽样策略的统计效率,与简单随机抽样甚至与分层抽样相比,能显著地减少抽样误差。
不等概率抽样有以下的缺点:抽样框中的所有单元,都要有高质量的、能用作大小度量的辅助信息;抽样框的创建比简单随机抽样和系统抽样成本高,更复杂,因为需要度量和存储总体中每一个单元的大小;并非在任何情况下都能使用,因为并不是每一个总体都有稳定且与主要调查变量相关的有关大小或规模的度量;抽样及估计(特别对不放回抽样)相当复杂; 当单元大小度量不准确或不稳定时不适用,此时更好的办法是将单元按大小分组并使用分层抽样。
第二节 放回不等概率抽样一、多项抽样多项抽样是一种最简单的不等概率抽样。
它是从容量为N 的总体中有放回地进行独立抽样,每次抽样中,使抽到第i 个单元的概率为Z i ,i =1,2,…,N ,11Nii Z==∑,连续抽n 次,从而抽到n 个单元。
若记i t 为总体中第i 个单元在n 次抽样中被抽到的次数,显然对每个i 都有:0i t n ≤≤,且1Ni i t n ==∑。
作为随机变量(1t ,2t ,…,N t ),它的联合分布即是以下的多项分布:121212!!!!N t t t NN n Z Z Z t t t 这就是多项抽样这个术语的来源。
pps抽样介绍
PPS抽样调查法一、什么是PPS抽样调查法按规模大小成比例的概率抽样,简称为PPS抽样,它是一种使用辅助信息,从而使每个单位均有按其规模大小成比例的被抽中概率的一种抽样方式。
其抽选样本的方法有汉森-赫维茨方法、拉希里方法等。
PPS 抽样是指按概率比例抽样,属于概率抽样中的一种。
是指在多阶段抽样中,尤其是二阶段抽样中,初级抽样单位被抽中的机率取决于其初级抽样单位的规模大小,初级抽样单位规模越大,被抽中的机会就越大,初级抽样单位规模越小,被抽中的机率就越小。
就是将总体按一种准确的标准划分出容量不等的具有相同标志的单位在总体中不同比率分配的样本量进行的抽样。
二、PPS抽样的目的和设定[1]选择一个具体的统计抽样方式需要:(1)、从样本得出的结论能反映审计者的测试目的;(2)、设定的方式要和会计总体的特性相匹配。
PPS抽样是设计用来为审计者找出审计的总体中存在错误的货币数量(包括夸大和缩小错误)。
用PPS进行实质性测试是第五章介绍的变量抽样方法的另一种普遍采用的方法。
PPS抽样产生的结论与下述相似:抽样结果证明有X%可靠性,在某会计核算中错误的、货币总数不超过¥Y(Y取决于抽样结果),审计人员将¥Y与可认可的错误进行比较作出可否认可会计帐面值的决定。
审计人员在决定采用PPS抽样方式之前,应该确定设定的模式是不是适用被测试的会计总体。
采用PPS抽样方式有两个条件:l、会计总体中错误率应较小(小于10%),并且会计总体中至少要包含2000个项目,并使用泊松概率分布去评估样本;2、任何项目中的错误量不能超过该项目的会计帐面值。
如果设定的PPS抽样方式适用于会计总体测试并使用方式得出的结论符合审计目标,那么审讦人员应考虑采用PPS抽样。
三、PPS抽样的基本概况[1]PPS抽样变种于属性抽样,用于找出在会计总体中全体货币量的错误数。
不像传统的属性抽样方法那样着眼于会计总体的物理单元(发票、支票),PPS抽样的着眼点在货币单元。
PPS抽样与户内抽样
样本成本比较
总结词
在同等样本量条件下,PPS抽样的成本通常 低于户内抽样。
详细描述
PPS抽样通过简单随机抽样方法在各个层内 进行抽样,降低了样本成本。而户内抽样需 要在特定区域内进行调查和筛选,可能涉及 更多的时间和人力成本。
04
PPS抽样与户内抽样的选择 依据
调查目的和精度要求
精度要求
如果调查对精度要求较高,PPS抽样可能更适合。由于PPS抽样每个样本被选中的概率 与其总体权重成正比,因此能更准确地估计总体参数。
调查目的
如果调查目的是为了估计总体参数,并且总体中各元素的重要性差异不大,PPS抽样可 以提供更稳定和准确的估计。
调查时间和资源限制
时间
如果调查时间有限,PPS抽样可能更为快捷 ,因为它基于总体权重进行抽样,减少了样 本单位的处理时间。
资源
如果资源有限,PPS抽样可能更节省资源, 因为它允许使用较小的样本规模来达到相同
PPS抽样的要点和注意事项
02
确保抽样框完整、准确,避免遗漏或重复。
根据总体变化情况定期更新抽样框。
03
两种抽样方法的实施要点和注意事项
户内抽样的要点和注意事 项
注意控制抽样误差,提高 样本的可靠性。
合理设置抽样间隔,平衡 样本代表性和数量。
01
03 02
两种抽样方法的实施要点和注意事项
确保抽样框的完整性和准 确性,特别是对于难以接 触的住户。
的精度。
调查对象和样本单位的特性
要点一
异质性
要点二
可访问性
如果调查对象具有较大的异质性,PPS抽样可能更为适合 。由于PPS抽样考虑了总体权重,因此能够更好地处理总 体内部的变异。
PPS抽样
甲:500户居民
乙:500户居民
1. PPS抽样——概率与元素的规模大小成比例的抽样 (Sampling with Probability Proportional to Size)
例1:一个城市有100000户居民,分属200个居委会,要从 中抽取1000户居民构成样本。
甲:800户居民
乙:200户居民
甲居委会每一户居民被抽中的概率=20/200 × 50/800=1/160 乙居委会每一户居民被抽中的概率=20/200 × 50/200=1/40
不符合等概率原则
1. PPS抽样——概率与元素的规模大小成比例的抽样 (Sampling with Probability Proportional to Size)
=
所抽取的群数
群的规模 总体规模
Hale Waihona Puke 平均每个群中要抽的元素 群的规模
=所抽取的群数╳平均每个群中所要抽取的元素/总体的规模 =样本规模/总体规模
2. PPS抽样的原理
在第一阶段,甲居委会被抽中的概率=800/100000=1/125 乙居委会被抽中的概率=200/100000=1/500 在第二阶段,甲居委会的居民被抽中的概率 =50/800=1/16 乙居委会的居民被抽中的概率=50/200=1/4
甲居委会中居民被抽中的概率=20×1/125×1/16=1/100 乙居委会中居民被抽中的概率=20×1/500×1/4=1/100
3. PPS的具体操作
例2:从全市100家企业(总共20万名职工)中,抽取 1000名职工进行调查。
THE END
谢 谢 观 看!
第四章 抽样3
14
一、样本规模
推论总体人数(或百分比) 推论总体人数 (或百分比)的样本规模的 计算公式: 计算公式: t2×p(1-p) p(1 n=---------------n=---------------e2 其中, 为总体的成数或百分比; 其中,p为总体的成数或百分比;t,e含义 同上。 同上。
15
21
作业思考题
从社会学期刊中选择三篇研究报告, 从社会学期刊中选择三篇研究报告,分 析并评价这些研究中所采用的抽样方法。 析并评价这些研究中所采用的抽样方法。
22
8
1、KISH选择法 KISH选择法
③ 确定样本户的编号。 通常的做法是 :调查员 确定样本户的编号。通常的做法是: 调查的第一户的编号为1 第二户的编号为2 调查的第一户的编号为1,第二户的编号为2, 以次类推。 以次类推。 样本编号末位数所在列, ④ 样本编号末位数所在列,和家庭成员人口数 所在行对应的数为该户成员年龄由大到小排列 的编号,此编号所对应的人为抽样样本。 的编号,此编号所对应的人为抽样样本。
17
二、影响样本规模确定的因素
3、总体的异质性程度。总体的异质性程度越 总体的异质性程度。 总体的方差越大, 则抽样误差越大, 高 , 总体的方差越大 , 则抽样误差越大 , 样 本规模就越大;反之,样本规模就越小。 本规模就越大;反之,样本规模就越小。
18
二、影响样本规模确定的因素
4、研究者所拥有的经费、人力和时间。从抽 研究者所拥有的经费、人力和时间。 样的可行性、 简便性考虑, 样的可行性 、 简便性考虑 , 样本规模是越小 越好; 究竟选择多大规模的样本, 越好 ; 究竟选择多大规模的样本 , 往往需要 做出选择。 而选择的一个重要砝码, 做出选择 。 而选择的一个重要砝码 , 就是研 究者所拥有的经费、人力和时间。 究者所拥有的经费、人力和时间。
PPS抽样调查法
PPS抽样调查法PPS抽样调查法( Probability Proportionate to Size Sampling)又称,按规模大小成比例的概率抽样一、什么是PPS抽样调查法按规模大小成比例的概率抽样,简称为PPS抽样,它是一种使用辅助信息,从而使每个单位均有按其规模大小成比例的被抽中概率的一种抽样方式。
其抽选样本的方法有汉森-赫维茨方法、拉希里方法等。
PPS 抽样是指按概率比例抽样,属于概率抽样中的一种。
是指在多阶段抽样中,尤其是二阶段抽样中,初级抽样单位被抽中的机率取决于其初级抽样单位的规模大小,初级抽样单位规模越大,被抽中的机会就越大,初级抽样单位规模越小,被抽中的机率就越小。
就是将总体按一种准确的标准划分出容量不等的具有相同标志的单位在总体中不同比率分配的样本量进行的抽样。
二、PPS抽样的特点与优点PPS抽样的特点是总体中含量大的部分被抽中的概率也大,可以提高样本的代表性。
PPS抽样的主要优点是:使用了辅助信息,减少抽样误差;主要缺点是:对辅助信息要求较高,方差的估计较复杂等。
三、PPS抽样的设计PPS抽样其具体的做法是:1、首先确定初级抽样单位(PSU),PSU可以是固定的常规单位,确定PSU 需要有这些初级抽样单位的具体名录,以及每个初级抽样单位中被调查人员的具体数目,这个数目可以的估计的人数。
2、确定抽取哪些初级抽样单位,如果初级抽样单位比较少,可以全部抽取,如果初级抽样单位太多,则可以随机抽取部分的抽样单位。
3、在选取的初级抽样单位中选择具体的调查对象,如果将第二步中选取的初级抽样单位的组成人员全部作为调查对象,称为二阶段整群抽样,如果只是在初级抽样单位中按人数的多少,来决定在每个抽样单位中抽取多少人,则称为PPS抽样,此时,需要进行一定的计算,详见有关统计书籍。
四、PPS抽样的举例假设要从全市100家企业,总共20万名职工中,抽取1000名职工进行调查。
我们采取多段抽样的方法,首先从100家企业中随机抽取若干家企业,如抽取20家;然后再从这20家企业中分别抽取50名职工(50X20=1000)构成样本。
PPS抽样与户内抽样
.
Kish 选择表
.
Kish 选择表
.
Kish 选择表
.
Kish 选择表
.
3.给抽中家庭每个成年人进行编号并排序。
排序方法:男性在前女性在后,年级大的在前, 年龄小的在后。
.
4.根据调查表上的编号找出编号相同的那种 “选择表”查出中选个体的序号,进行调查
.
二、PPS抽样
.
运动员抽取问题:
校运会将至,要求从人文与管理学院各班共抽 取12名同学代表学院出战校运会。出于某些原 因,现只考虑公管1班与公管2班的同学。已知 行公管1班有35人,公管2班有24人,请使用多 段抽样的方法对两班各自出战人数进行计算。
.
解题步骤:
已知人文与管理院有公管1、公 管2、公管3、公管4等班级
➢ 原理:“对冲” 以阶段性的不等换取最终的相等。
➢ 实质:第一阶段中,大的群具有比小的群更大的概率,
➢
而到了第二阶段,每个被抽中的群都抽取同样多
➢
的元素,即小群中元素被抽中的概率大于大群的,
➢
两相平衡。
.
PPS原理公式:
每个元素被抽取的概率=
所抽取群
的数目
( 群的规模 ) 总体的规模
(平均每个群要抽取的元素) 群的规模
第四节
PPS抽样 与户内抽样
.
一、户内抽样
.
概念
◦ 户内抽样(within-household sampling),指的是 以家庭为分析单位时,从所抽中的家庭中抽取一个 成年人,以构成访谈对象的抽样方法。
方法:Kish选择法
.
具体做法:
什么是PPS抽样调查法
什么是PPS抽样调查法对PPS抽样的初步认识和了解一、什么是PPS抽样调查法PPS抽样调查法是指放回的按规模大小成比例的概率抽样,简称为PPS抽样。
它是一种使用辅助信息,从而使每个单位均有按其规模大小成比例的被抽中概率的一种抽样方式。
其抽选样本的方法有汉森-赫维茨方法、拉希里方法等。
PPS 抽样是按概率比例抽样,属于概率抽样中的一种,是指在多阶段抽样中,尤其是二阶段抽样中,初级抽样单位被抽中的机率取决于其初级抽样单位的规模大小,初级抽样单位规模越大,被抽中的机会就越大,初级抽样单位规模越小,被抽中的机率就越小。
PPS 抽样就是将总体按一种准确的标准划分出容量不等的具有相同标志的单位在总体中不同比率分配的样本量进行的抽样。
二、PPS抽样的应用与说明PPS(Probility proportional to size ) 抽样在社会、经济和人口调查中经常使用,它是将总体按一种标准划分出容量不等的具有相同标志的单位在总体中不同比率分配的样本量进行的抽样,在层或群内,再采取概率、等比例或不等比例等方法再次选择具体样本。
PPS 抽样是一种分层抽样与简单随机抽样或者不等比例抽样相配合的两阶段抽样,有时也进一步进行多阶段抽样。
在第一阶段,根据样本所在层或群的大小,给予各个层或群不同的中选概率,然后在第二阶段的各个层或群内以等样本量的方法抽取样本。
它的公式是:其中,Mosa是各个群的样本规模,b群是每个群所需要抽取的样本量,F是总体中每多少个数量抽取一个样本的代表值,f 为抽样比例。
这种方法最根本的优点是能够较大程度地提高抽样精度,较好地推论总体。
三、PPS抽样的特点与优点PPS抽样的特点是总体中含量大的部分被抽中的概率也大,可以提高样本的代表性。
PPS抽样的主要优点是:使用了辅助信息,减少抽样误差;主要缺点是:对辅助信息要求较高,方差的估计较复杂等。
四、PPS抽样的设计PPS抽样其具体的做法是:1、首先确定初级抽样单位(PSU),PSU可以是固定的常规单位,确定PSU需要有这些初级抽样单位的具体名录,以及每个初级抽样单位中被调查人员的具体数目,这个数目可以的估计的人数。
PPS抽样与户内抽样.PPT
的规模是相等的,即各个抽样单位被抽中的概
率相等
PP
此假定显然与实 际不符,易造成
较大的误差
S
bug
patch
.
13
什么是PPS抽样:
➢ 定义:是一种通过使用辅助信息,使得每个抽样单位
都可以按照其规模大小及在总体中所占比例确
定各自被抽取的概率,从而确保各个抽样单位
被抽取的概率相等的一种抽样方式。
➢ 特点:概率与元素规模大小成比例,即不等概率。
➢ 原理:“对冲” 以阶段性的不等换取最终的相等。
➢ 实质:第一阶段中,大的群具有比小的群更大的概率,
➢
而到了第二阶段,每个被抽中的群都抽取同样多
➢
的元素,即小群中元素被抽中的概率大于大群的,
➢
两相平衡。
.
14
PPS原理公式:
每个元素被抽取的概率=
所抽取群
的数目
( 群的规模 ) 总体的规模
(平均每个群要抽取的元素) 群的规模
2.方差的估计较复杂
.
17
小试牛刀:
校运会将至,要求从人文与管理学院各班共抽取12 名同学代表管院出战校运会。出于某些原因,现只 考虑行公管1班与公管2班的同学。已知公管1班有 35人,公管2班有24人,请使用PPS抽样的方法对两 班各自出战人数进行计算。
.
18
参考解法:
公管1规模
(
35
35
24
一、户内抽样
.
1
概念
◦ 户内抽样(within-household sampling),指的是 以家庭为分析单位时,从所抽中的家庭中抽取一个 成年人,以构成访谈对象的抽样方法。
方法:Kish选择法
PPS抽样法
PPS抽样法
“ 推断总体
①推断总体错报
②总体错报上限
错报比例(t)= 错报金额/项目账面金额 ① 如果样本中没有发现错报
按降序排列错报比例
② 如果样本中发现1个错报
t1>t2>t3 ……
③ 如果样本中发现2个错报…
总体错报上限=基本界限+发现错报 所增加的错报上限
PPS抽样法的优缺点
“优 计算简单,不用计算标准差 易于发现极少量的大额错报,被选中概率和规模成正比。 样本规模无需考虑预计变异性,货币单元无差异性 生成的样本自动分层,如果项目超过选样间距,PPS将 自动识别所有单个重大项目 如果预计错报不存在或很小,PPS样本规模通常比传统 变量抽样方法更小
需要逐项累计总体中的项目 每个货币单元被选中的概率相同(1/7376) 每个实物单元被选中的概率不同,被选取的概率与规模成正比(357/7376) 注册会计师不是对总体中的货币单元实施检查,而是对包含选取货币单元的实 物单元实施检查 货币单元只可能被选中一次,实物单元可能被重复选中,但是不改变样本规模。
选取样本方法系统选样法随机选样法需要逐项累计总体中的项目每个货币单元被选中的概率相同17376每个实物单元被选中的概率不同被选取的概率与规模成正比3577376注册会计师不是对总体中的货币单元实施检查而是对包含选取货币单元的实物单元实施检查货币单元只可能被选中一次实物单元可能被重复选中但是不改变样本规模
“ 确定样本规模
①公式法
②查表法
总体账面价值 风险系数 可容忍错报 (- 预计总体错报 扩张系数)
确定样本规模的时候,并没有进行测试,所以这时并不知道是存 在几个错报。因此先根据假设错报为0时计算出样本规模,进而 计算出基本界限。
PPS抽样法“怎么抽”?
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 分层抽样
• 目的:一方面是要提高各层间的异质性与同层中的同质性,另一方面也是 为了照顾到某些比例小的层次,使得所抽样本的代表性进一步提高,误差 进一步减小。
• 其方法:则是完全依据概率原则,排除主观因素,客观地、等概率地到各 层中进行抽样
若按分层抽样的方法,则可以先将其分为本科 院校和专科院校,然后分别从每一类中抽取若 干高校;
3
几种抽样方法的比较 第二阶段:从10所高校中分别抽取500名学生
按整群抽样的方法
(假设其中一个学校有100个班级,每班50名学生)
4
• 多段抽样中,其实暗含了一个假定:即每一个阶段抽 样时,其元素的规模是相同的。
• 如同滚雪球一样,我们可以找到越来越多具有相同性质的群体成员
。
研究退休老人的生活
18
• 非概率抽样其样本的代表性往往较小,误差有 时相当大,且这种误差又无法估计。
• 所以,在大规模的正式研究中,一般很少用非 概率抽样,常常只是在探索性研究中采用。
19
定额抽样与分层抽样的区别
• 定额抽样
• 其目的:在于要抽选出一个总体的“模拟物”, • 其方法:则是通过主观的分析来确定和选择组成这种模拟物的成员。也就
•偶遇抽样 •判断抽样 •定额抽样 •雪球抽样
12
一、偶遇抽样
• 又称作方便抽样或自然抽样
• 是研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作 为调查对象,或者仅仅选择那些离得最近的、最容易找到的人作为 调查对象
• 区别随机抽样: 偶遇抽样没有保证总体中的每一个成员都具有同等的被抽中的概
率。
14
三、定额抽样
• 又称作配额抽样
• 是指调查人员将调查总体样本按一定标志分类或分层,确定各类( 层)单位的样本数额,在配额内任意抽选样本的抽样方式。
例:假设某高校有4000名学生,其中男生占60%,女生占40
%;文科学生和理科学生各占50%;一年级学生占40%、二年 级、三年级、四年级学生分别占30%、20%和l0%。
抽样
• 假设从某市100所高校的50万大学生中, 抽取5000名学生进行环保意识的抽样调查 。
二阶段抽样:大学——学生
2
几种抽样方法的比较 第一阶段:从100所高校中抽取10所
按简单随机抽样或系统抽样的方法,则首先需 要弄到一份100所高校的名单,并对其进行编号 ,然后根据抽签、随机数表或通过计算抽样间 距直接从抽样框中抽取;
入选号码 入样单位
01
4000
4000
000001-004000 002032 单位1
02
5000
9000
004001-009000
03
3200
12200
009001-012200 009786 单位2
04
20000
32200
012201-032200 012234 单位3、4
029824
05 …… 99 100
13
二、判断抽样
• 研究者根据研究的目标和自己主观的分析来选择和确定研究对象的 方法。
• 由于抽样标准的确定带有较大的主观性,所以,此法的运用结果如 何往往与研究者的理论修养、实际经验以及对对象的熟悉程度有很 大关系。
• 在实际中,这种抽样多用于总体规模小、所涉及的范围较窄或时间 、人力等条件有限而难以进行大规模抽样的情况
(二)做法(以二阶段为例):
• 1、在第一阶段,每个群按照其规模(其所含元 素的数量)被给予大小不等的抽取概率。
• 2、到了第二阶段,从每个抽中的群中都抽取同 样多的元素(也是不等概率的)。
• 正是这一大一小,平衡了由于群的规模带来的 概率差异。
8
(三)公 式
每一个元素
群的规模
平均每个群中 所要抽取的元素
现在要用定额抽样方法依上述三个变数抽取一个规模 为100人的样本。
15
依据总体的构成和样本规模,我们得到的定额表 :
年级
男生(60人)
文科(30人)
理科(30人)
女生(40人)
文科(20人)
理科(30人)
一二三四
一二三四
一二三四
一二三四
人数
12 9 6 3
12 9 6 3
8 6 42
8 6 42
16
= 所抽取的群数
被抽中的概率
×
总体的规模
×
群的规模
PPS的做法已经排除了群的规模这一影响因素——第一个分子与第 二个分母相互约掉了——每一个元素的被选中概率变成了:(所抽取 的群数*每个群中所抽取的元素数目)/总体的规模。
这实际上就是样本规模除以总体规模。
9
(四)PPS的具体操作方法:
• 1、在确定的总体内,给每个抽样单位按序编号 ,并且写出它们的规模;
20
21
定额抽样与分层抽样的区别
• 分层抽样是完全依据概率原则,排除主观因素,客观地 、等概率地到各层中进行抽样;
• 配额抽样是由调查人员在配额内主观判断选定样本。 先“分层”(事先确定每层的样本量,即抽选出一个总体
的 “模拟物” ) 再“判断”(在每层中以判断抽样的方法选取抽样个体)
17
四、雪球抽样
• 当我们无法了解总体情况时,可以从总体中少数成员入手,对他们 进行调查,向他们询问还知道哪些符合条件的人;再去找那些人并 再询问他们知道的人。
• 比如第一阶段抽取学校时,暗含了每个学校的规模相 同。
• 在这样的假定下,采取上述几种随机抽样的方法,最 终每名学生被抽中的概率相等。
5
• 但现实生活中,每一个学校包含的学生人数不同,因 而按照上述多段抽样的方法来抽取样本时,最终每名学 生被抽中的概率实际上是不同的。
• (规模不一样大)假设甲学校比较大,有2万名学生,乙学校比较小 ,只有3千名学生。那么当二者在第一阶段都被抽中后,第二阶段分 别从他们中抽取500名学生,
• 甲学校学生被抽中的概率为:(10/100)*(500/20000)=1/400 • 乙学校学生被抽中的概率为:(10/100)*(500/30000)=1/60
6
§4 PPS抽样
一、PPS抽样 (概率与元素的规模大小成比例的抽样)
(一)原理:
• 以阶段性的不等概率换取最终的、总体 的等概率。
7
• 2、累计相加每个抽样单位包含的单位数,并根 据累计相加结果确定每个单位的号码范围;
• 3、采用随机数表的方法或等距抽样的方法选择 号码,号码所对应的单位行第二阶段抽样。
10
用PPS方法抽取第一阶段样本举例
学校序号 学生人数/人 累计人数/人 号码范围
6000 …… 10000 8000
38200 …… 492000 500000
032201-038200
……
……
482001-492000 484551
492001-500000
…… 单位20
11
§5 非概率抽样方法
• 非概率抽样,不是按照概率均等的原则,而是根据人们 的主观经验或其他条件来抽取样本。