PPS抽样与户内抽样ppt课件
PPS抽样与户内抽样
=所抽取群的数目
样本规模 = 总体的规模
PPS操作步骤:
PPS的优劣势:
优势:
目的性原则
1.总体中含量大的部分被抽中的概率也大, 可以提高样本的代表性 2.使用了辅助信息,可以减少抽样误差
劣势:
可行性原则
1.对辅助信息要求较高,实践中较难获得 对所有群的规模的认识 2.方差的估计较复杂
1 2 3 4 5
1 1 1 1 1
1 2 3 4
1 1 1 1
5
6或以上
2
2
6或以上
1
Kish 选择表
B2 式选择表 如果家庭户中18 岁以上人口数为 被抽选人的 序号为
C 式选择表 如果家庭户中18岁 以上人口数为 被抽选人的 序号为
1 2 3 4 5 6或以上
1 1 1 2 2 2
1 2 3
PPS抽样 与户内抽样
户内抽样的方法
概念
◦ 户内抽样(within-household sampling),指的是 以家庭为分析单位时,从所抽中的家庭中抽取一个
成年人,以构成访谈对象的抽样方法。
方法:Kish选择法
具体做法:
1 、先将调查表编号,分为以下八种不同的表格。 每种表格所占数量比例不同。
序号 1 2 成员特征 爸爸50岁 儿子23岁
F 式选择表 如果家庭户中18岁以上 人口数为 被抽选人的 序号为
1 2 3
1 2 3
3
4 5
奶奶70岁
妈妈48岁 女儿27岁
4 5
6或以上
4 5
6
运动员抽取问题:
校运会将至,要求从人文与管理学院各班共抽 取12名同学代表学院出战校运会。出于某些原 因,现只考虑公管1班与公管2班的同学。已知 行公管1班有35人,公管2班有24人,请使用多 段抽样的方法对两班各自出战人数进行计算。
PPS抽样
甲:800户居民
乙:200户居民
甲居委会每一户居民被抽中的概率=20/200 × 50/800=1/160 乙居委会每一户居民被抽中的概率=20/200 × 50/200=1/40
不符合等概率原则
1. PPS抽样——概率与元素的规模大小成比例的抽样 (Sampling to Size)
《社会调查与统计分析》
第四章 抽样
知识点10 PPS抽样
学习导航
PPS抽样
PPS抽样的定义 PPS抽样的原理 PPS抽样的具体操作
1. PPS抽样——概率与元素的规模大小成比例的抽样 (Sampling with Probability Proportional to Size)
多段抽样暗含的假定:每一个阶段抽样时,其元素的规 模是相同的。
原理:以阶段性的不等概率换取最终的、总体的等概率 。
实质:在第一个阶段中,大的群被抽中的概率大,而小 的群被抽中的概率小;这样到了第二个阶段,被抽中的 大的群中的元素被抽中的概率就小于被抽中的小的群中 的元素了。正是这一大一小,平衡了由于群的规模不同 带来的概率差异。
2. PPS抽样的原理
每一个元素被抽中的概率
甲居委会中居民被抽中的概率=20×1/125×1/16=1/100 乙居委会中居民被抽中的概率=20×1/500×1/4=1/100
3. PPS的具体操作
例2:从全市100家企业(总共20万名职工)中,抽取 1000名职工进行调查。
THE END
谢 谢 观 看!
=
所抽取的群数
群的规模 总体规模
平均每个群中要抽的元素 群的规模
=所抽取的群数╳平均每个群中所要抽取的元素/总体的规模 =样本规模/总体规模
社会研究方法 第6章
整群抽样
不同子群
子群抽取
整群抽样
优点:简便易行,节省费用 扩大抽样应用范围
缺点: 样本分布不广, 代表性相对较差
适用对象: 总体的不同子群之间差别不大, 而每个子群内部差异较大
五、多段抽样
按抽样元素的隶属、层级关系把抽样过程分为 几个阶段进行:先从总体中随机抽取几个大群, 然后再从这几个大群内随机抽取几个小群,这 样一级级抽下去直到抽到最基本的元素为止。
第六章 抽样
第一节 抽样的意义与作用 第二节 概率抽样的原理与程序 第三节 概率抽样方法 第四节 户内抽样与PPS抽样 第五节 非概率抽样方法 第六节 样本规模与抽样误差
第一节 抽样意义与作用
一、抽样的概念
(1)总体(population):构成它的所有元素的 集合,用“ N ”表示。
(2)元素(element):构成总体的最基本单位。
出总体内在结构的变量作为分层变量。 c:以那些已有明显层次区分的变量作为分层变量 (2)分层的比例 a:按比例分层抽样 b:不按比例分层抽样
按比例分层抽样
分层
学生
1200
女生1000 (5/6)
男生200 (1/6)
抽 样(120人)
100人 5/6
样 本 20人 1/6 120
按各种类型或层次中单位数目同总体单位数目间 的比例来抽取子样本的方法。可以确保得到一个 与总体结构完全一样的样本。
样本规模的计算
简单随机抽样中样本规模的计算 置信水平对应的临界值
➢
推论总体均值
:
n
t2
e2
பைடு நூலகம்
2
总体的标准差 允许的抽样误差
推论总体成数:
t 2 p(1 p)
PPS抽样与户内抽样PPT课件
=所抽取群的数目 (平均每个群要抽取的元素) 总体的规模 样本规模
= 总体规模
15
PPS操作步骤:
16
PPS的优劣势:
➢优势:
目的性原则
1.总体中含量大的部分被抽中的概率也大, 可以提高样本的代表性
2.使用了辅助信息,可以减少抽样误差
➢劣势:
可行性原则
1.对辅助信息要求较高,实践中较难获得 对所有群的规模的认识
一、户内抽样
1
概念
◦ 户内抽样(within-household sampling),指的是 以家庭为分析单位时,从所抽中的家庭中抽取一个 成年人,以构成访谈对象的抽样方法。
方法:Kish选择法
2
具体做法:
1 、先将调查表编号,分为以下八种不同的表格。 每种表格所占数量比例不同。
2.印制若干套选择卡(1套8种),给每个调查员发 一套(八张)。
2.方差的估计较复杂
17
小试牛刀:
校运会将至,要求从人文与管理学院各班共抽取12 名同学代表管院出战校运会。出于某些原因,现只 考虑行公管1班与公管2班的同学。已知公管1班有 35人,公管2班有24人,请使用PPS抽样的方法对两 班各自出战人数进行计算。
18
参考解法:
公管1规模
(
35
35
24
)
➢ 原理:“对冲” 以阶段性的不等换取最终的相等。
➢ 实质:第一阶段中,大的群具有比小的群更大的概率,
➢
而到了第二阶段,每个被抽中的群都抽取同样多
➢
的元素,即小群中元素被抽中的概率大于大群的,
➢
两相平衡。
14
PPS原理公式:
每个元素被抽取的概率=
所抽取群
第六章 抽样
简单随机抽样
• 简单随机抽样(纯随机抽样):按等概率 原则直接从含有N个元素的总体中随机抽取 n个元素组成样本(N>n)。 • 概率抽样中最基本形式,其他形式都是以 此为基础。
系统抽样
• 系统抽样(等轴抽样、等距抽样、机械抽 样):把总体的单位进行编号排序,再计 算出其中间隔,然后按这个固定的间隔抽 取个体的号码来组成样本的方法。
整群抽样与分层抽样
• 当总体由若干个自然界限或区分的组(子 群、层)所组成时
– 若组内部差异较大,组间差异较小----整群抽样。 – 若组内部差异较小,组间差异较大----分层抽样。
• 一.抽样的概念 • 二.抽样的作用 • 三.抽样的类型
抽样的概念
• • • • • • • 1. 2. 3. 4. 5. 6. 7. 总体(Population) 样本(Sample) 抽样(Sampling) 抽样单位(Sampling Unit) 抽样框(Sampling Frame) 参数值(Parameter) 统计值(Statistics)
抽样的概念
• 统计值(样本值):样本中某一个变量的 综合描述。 • 是从样本中计算出来的。 • 是作为总体值的估计值。
抽样的作用
• 用十分有限的人力、财力、时间去了解庞 杂、广阔、纷繁、多变的社会现象。
• 比如:民意测验,要求迅速、准确。往往 调查对象不到2000人。
第二节 概率抽样的原理与程序
• 比如家庭、班级、居委会。
– 特点:抽样单位不是个体,而是成群的个体。
• 比如:某大学共有100个班,每班都是30名同学,总 共 3000名学生,现在要抽取300名。先从100个班中 抽取10个班,则这10个班的全部学生就构成了样本。
PPS抽样与户内抽样
样本成本比较
总结词
在同等样本量条件下,PPS抽样的成本通常 低于户内抽样。
详细描述
PPS抽样通过简单随机抽样方法在各个层内 进行抽样,降低了样本成本。而户内抽样需 要在特定区域内进行调查和筛选,可能涉及 更多的时间和人力成本。
04
PPS抽样与户内抽样的选择 依据
调查目的和精度要求
精度要求
如果调查对精度要求较高,PPS抽样可能更适合。由于PPS抽样每个样本被选中的概率 与其总体权重成正比,因此能更准确地估计总体参数。
调查目的
如果调查目的是为了估计总体参数,并且总体中各元素的重要性差异不大,PPS抽样可 以提供更稳定和准确的估计。
调查时间和资源限制
时间
如果调查时间有限,PPS抽样可能更为快捷 ,因为它基于总体权重进行抽样,减少了样 本单位的处理时间。
资源
如果资源有限,PPS抽样可能更节省资源, 因为它允许使用较小的样本规模来达到相同
PPS抽样的要点和注意事项
02
确保抽样框完整、准确,避免遗漏或重复。
根据总体变化情况定期更新抽样框。
03
两种抽样方法的实施要点和注意事项
户内抽样的要点和注意事 项
注意控制抽样误差,提高 样本的可靠性。
合理设置抽样间隔,平衡 样本代表性和数量。
01
03 02
两种抽样方法的实施要点和注意事项
确保抽样框的完整性和准 确性,特别是对于难以接 触的住户。
的精度。
调查对象和样本单位的特性
要点一
异质性
要点二
可访问性
如果调查对象具有较大的异质性,PPS抽样可能更为适合 。由于PPS抽样考虑了总体权重,因此能够更好地处理总 体内部的变异。
抽样教学课件 PPT
第一节 抽样得意义与作用
一、抽样得概念
1、总体:构成它得所有元素(个体、分析单位、研 究对象)得集合,就是从中抽取样本得元素(个体) 得集合体。
2、样本:按照一定方法从调查总体中抽取出来元 素得集合 。
3、抽样:从总体中按照一定方式抽取样本得过程。
4、抽样单位:指一次直接抽样过程中使用得基本 单位,它往往就是多层次得。
4、优缺点
优点:方便易行、较为灵活,特别适用于调查 范围大,单位多,情况复杂得调查对象
缺点:误差较大,可相应增加开头阶段得样本 数而减少最后阶段得样本数。
第四节 户内抽样与PPS抽样
一、户内抽样得方法——kish选择法
1、kish选择法 (1)将调查表分为八种, A、B1、B2、C、D、 E1、E2、F, A、C、D、F各占总数得1/6、 B1、 B2、 E1、E2 1各占/12。 (2)印制相应八种选择卡 (3)将家体中成员进行排序编号,顺序就是:最 年长男性、次年长男性……最年幼男性、最 年长女性、次年长女性……最年幼女性 (4)按照调查表上得编号,用相应得选择卡进 行选择。
抽样得程序
总体 抽样框
抽样方法
样本
四、抽样设计得原则
1、目得性原则: 以课题研究得总体方案与研究目标为依据
2、可测性原则 能够从样本自身计算出有效得估计值或抽样 变动得近似值。
3、可行性原则 抽样方案必须在实践中切实可行
4、经济性原则 方案设计与研究得经费、时间、人力等适应
大家有疑问的,可以询问和交流
元素2
G院
900
9
70 061~070 076
元素3
H院
800
8
78 071~078
抽样方法 pps
抽样方法pps抽样方法是指在研究中从总体中选择一部分样本进行调查或观察,然后通过对样本的研究结果进行推断从而得出总体的结论。
抽样方法在许多研究领域和实际应用中都起到了重要的作用,可以节省时间和资源,并且能够提供相对准确的结果。
PPS(Probability Proportional to Size)抽样方法是一种常用的抽样方法,它是以样本单位的大小与总体单位的大小成正比来决定样本被抽取的概率。
在PPS 抽样方法中,样本单位越大,被抽取的概率就越大,样本单位越小,被抽取的概率就越小。
这种方法适用于总体中存在着横向差异的情况,可以提高样本的代表性。
PPS抽样方法的步骤包括:确定总体单位的大小,计算每个单位的抽样概率,对总体单位按抽样概率进行排序,设定一个随机数表,对总体单位进行抽样。
首先,确定总体单位的大小,也就是需要进行研究或观察的总体中的单位数量。
例如,研究一个学校的学生,总体单位就是学生的数量。
接下来,计算每个单位的抽样概率。
这个概率通常是根据单位的大小来计算的,单位越大,概率就越大。
计算抽样概率的公式是:抽样概率= 单位大小/ 总体单位的总大小。
然后,对总体单位按抽样概率进行排序。
这个排序的目的是为了把总体单位按照从大到小的顺序排列,方便后续的抽样操作。
接下来,设定一个随机数表,用于产生随机数。
随机数表可以是一个包含随机数的表格或者一个随机数生成器。
最后,根据随机数表和总体单位的排序,对总体单位进行抽样。
抽样的过程是根据随机数表中的随机数,找到对应的总体单位,并将其选为样本。
这个过程是重复进行的,直到完成所需的样本数量。
总的来说,PPS抽样方法是一种根据总体单位的大小来决定抽样概率的方法,适用于总体单位存在横向差异的情况,可以提高样本的代表性。
它的步骤包括确定总体单位的大小,计算每个单位的抽样概率,对总体单位按抽样概率进行排序,设定一个随机数表,对总体单位进行抽样。
通过使用PPS抽样方法,可以得到具有代表性的样本,并将样本结果推断到总体上,从而得出总体的结论。
PPS抽样
甲:500户居民
乙:500户居民
1. PPS抽样——概率与元素的规模大小成比例的抽样 (Sampling with Probability Proportional to Size)
例1:一个城市有100000户居民,分属200个居委会,要从 中抽取1000户居民构成样本。
甲:800户居民
乙:200户居民
甲居委会每一户居民被抽中的概率=20/200 × 50/800=1/160 乙居委会每一户居民被抽中的概率=20/200 × 50/200=1/40
不符合等概率原则
1. PPS抽样——概率与元素的规模大小成比例的抽样 (Sampling with Probability Proportional to Size)
=
所抽取的群数
群的规模 总体规模
Hale Waihona Puke 平均每个群中要抽的元素 群的规模
=所抽取的群数╳平均每个群中所要抽取的元素/总体的规模 =样本规模/总体规模
2. PPS抽样的原理
在第一阶段,甲居委会被抽中的概率=800/100000=1/125 乙居委会被抽中的概率=200/100000=1/500 在第二阶段,甲居委会的居民被抽中的概率 =50/800=1/16 乙居委会的居民被抽中的概率=50/200=1/4
甲居委会中居民被抽中的概率=20×1/125×1/16=1/100 乙居委会中居民被抽中的概率=20×1/500×1/4=1/100
3. PPS的具体操作
例2:从全市100家企业(总共20万名职工)中,抽取 1000名职工进行调查。
THE END
谢 谢 观 看!
06 第四章 抽样
现在,我们决定从那里开始。可以闭着眼睛随便戳一个数字。也
(二)方法
A 总体元素较少时,类似于抽签方法。
B 总体元素较多时,随机数表法 小总体时 抓阄,抽签, 较大总体时 随机数字表.使用方法. 简单随机样本是概率抽样的理想类型,他从 随机样本的抽取到对总体进行推断有一套健全的规 则.但是当总体所含个体的数目太多时采用这种方法 不仅费事,工作繁杂,而且费用太高.此外当总体内分 类明显时,这种抽样无法按类别特征自动分配样本数, 若想保证样本的代表性,必须增大样本量,从而使整 个工作的工作量增大.
因此,我们在使用系统抽样方法时,一定要注意抽样
框的编制方法。
注意:
总体名单中,个体的排列具有某种次序上的先后、等级上的高低的情况
例如:我们从2000户家庭的社区,抽取50户进行消费状况的调查,
而2000户家庭的名单是按照家庭收入的多少按照由高到低排列的。
抽样间距=2000/50=40
如果两个人选择样本,一个人选择初始号码为3,另一个人选择初 始号码为38,那么肯定前者家庭平均收入远远高于后者。
随机数表中的数码
8432990906 1053873020 9427410041 0139022507 9361404310 1359866042 6321912683 9420582507 2725651176
选用的数码
0906
不选用的原因
后面四位数大于3000
第四章 抽样3
14
一、样本规模
推论总体人数(或百分比) 推论总体人数 (或百分比)的样本规模的 计算公式: 计算公式: t2×p(1-p) p(1 n=---------------n=---------------e2 其中, 为总体的成数或百分比; 其中,p为总体的成数或百分比;t,e含义 同上。 同上。
15
21
作业思考题
从社会学期刊中选择三篇研究报告, 从社会学期刊中选择三篇研究报告,分 析并评价这些研究中所采用的抽样方法。 析并评价这些研究中所采用的抽样方法。
22
8
1、KISH选择法 KISH选择法
③ 确定样本户的编号。 通常的做法是 :调查员 确定样本户的编号。通常的做法是: 调查的第一户的编号为1 第二户的编号为2 调查的第一户的编号为1,第二户的编号为2, 以次类推。 以次类推。 样本编号末位数所在列, ④ 样本编号末位数所在列,和家庭成员人口数 所在行对应的数为该户成员年龄由大到小排列 的编号,此编号所对应的人为抽样样本。 的编号,此编号所对应的人为抽样样本。
17
二、影响样本规模确定的因素
3、总体的异质性程度。总体的异质性程度越 总体的异质性程度。 总体的方差越大, 则抽样误差越大, 高 , 总体的方差越大 , 则抽样误差越大 , 样 本规模就越大;反之,样本规模就越小。 本规模就越大;反之,样本规模就越小。
18
二、影响样本规模确定的因素
4、研究者所拥有的经费、人力和时间。从抽 研究者所拥有的经费、人力和时间。 样的可行性、 简便性考虑, 样的可行性 、 简便性考虑 , 样本规模是越小 越好; 究竟选择多大规模的样本, 越好 ; 究竟选择多大规模的样本 , 往往需要 做出选择。 而选择的一个重要砝码, 做出选择 。 而选择的一个重要砝码 , 就是研 究者所拥有的经费、人力和时间。 究者所拥有的经费、人力和时间。
PPS抽样法
PPS抽样法
“ 推断总体
①推断总体错报
②总体错报上限
错报比例(t)= 错报金额/项目账面金额 ① 如果样本中没有发现错报
按降序排列错报比例
② 如果样本中发现1个错报
t1>t2>t3 ……
③ 如果样本中发现2个错报…
总体错报上限=基本界限+发现错报 所增加的错报上限
PPS抽样法的优缺点
“优 计算简单,不用计算标准差 易于发现极少量的大额错报,被选中概率和规模成正比。 样本规模无需考虑预计变异性,货币单元无差异性 生成的样本自动分层,如果项目超过选样间距,PPS将 自动识别所有单个重大项目 如果预计错报不存在或很小,PPS样本规模通常比传统 变量抽样方法更小
需要逐项累计总体中的项目 每个货币单元被选中的概率相同(1/7376) 每个实物单元被选中的概率不同,被选取的概率与规模成正比(357/7376) 注册会计师不是对总体中的货币单元实施检查,而是对包含选取货币单元的实 物单元实施检查 货币单元只可能被选中一次,实物单元可能被重复选中,但是不改变样本规模。
选取样本方法系统选样法随机选样法需要逐项累计总体中的项目每个货币单元被选中的概率相同17376每个实物单元被选中的概率不同被选取的概率与规模成正比3577376注册会计师不是对总体中的货币单元实施检查而是对包含选取货币单元的实物单元实施检查货币单元只可能被选中一次实物单元可能被重复选中但是不改变样本规模
“ 确定样本规模
①公式法
②查表法
总体账面价值 风险系数 可容忍错报 (- 预计总体错报 扩张系数)
确定样本规模的时候,并没有进行测试,所以这时并不知道是存 在几个错报。因此先根据假设错报为0时计算出样本规模,进而 计算出基本界限。
PPS抽样法“怎么抽”?
户内抽样发简介
样本量一般较小,而结论性研究如描述性的调查,就需要较大的样本;
收集有关许多变量的数据,样本量就要大一些,以减少抽样误差的累
积效应;如果需要采用多元统计方法对数据进行复杂的高级分析,样
本量就应当较大;如果需要特别详细的分析,如做许多分类等,也需
要大样本。针对子样本分析比只限于对总样本分析,所需样本量要大
得
多
。
具体确定样本量还有相应的统计学公式,不同的抽样方法对应不同的
确定样本容量
确定样本容量的大小是比较复杂的问题,既要有定性的考虑也要有定
量的考虑。从定性的方面考虑样本量的大小,其考虑因素有:决策的
重要性,调研的性质,变量个数,数据分析的性质,同类研究中所用
的样本量,发生率,完成率,资源限制等。具体地说,更重要的决策,
需要更多的信息和更准确的信息,这就需要较大的样本;探索性研究,
甲学校学生被抽中的概率为:(10/100)*(500/20000)=1/400 乙学校学生被抽中的概率为:(10/100)*(500/30000)=1/60
二、PPS抽样
定义:是指放回的按规模大小成比例的概率抽样,简称 为PPS抽样。(概率与元素的规模大小成比例的抽样)
(一)原理:
以阶段性的不等概率换取最终的、总体的等概率。
按这种方法抽出的人组成的样本,在年龄、性别、文化 程度等方面的分布与总体的分布往往十分接近。
假设从某市100所高校的 50万名大学生中,抽取5000 名学生进行手机流量使用情况 的抽样调查
第一阶段:从100所高校中抽取10所
按简单随机抽样或系统抽样的方法,则首先需要弄到一 份100所高校的名单,并对其进行编号,然后根据抽签上述几种随机抽样的方法,最终 每名学生被抽中的概率相等。
户内抽样发简介
六、户内抽样好处
不仅可以使研究者收集到样本家庭的资料,同时也可以 收集到由这些被访者所构成的个人样本的资料,这种资 料可以用来描述这一地区所有成年人所构成的总体。 按这种方法抽出的人组成的样本,在年龄、性别、文化 程度等方面的分布与总体的分布往往十分接近。
假设从某市100所高校的 50万名大学生中,抽取5000 名学生进行手机流量使用情况 的抽样调查
甲学校学生被抽中的概率为:(10/100)*(500/20000)=1/400 乙学校学生被抽中的概率为:(10/100)*(500/30000)=1/60
二、PPS抽样
定义:是指放回的按规模大小成比例的概率抽样,简称 为PPS抽样。(概率与元素的规模大小成比例的抽样)
(一)原理:
以阶段性的不等概率换取最终的、总体的等概率。
具体做法:研究者先将调查表分为 A,B,B,C,D,E1,E2,F 八 种 , 每 种 表 分 别 占 调 查 表 总 数 的 1/6,1/12,1/12,1/6,1/6,1/12,1/12,1/6 。同时,印制若 干套(一套八种)“选择卡”发给调查员,每人一套。
三、KISH选择表
四、实例
(二)做法(以二阶段为例):
1 、在第一阶段,每个群按照其规模(其所含元素的数 量)被给予大小不等的抽取概率。 2 、到了第二阶段,从每个抽中的群中都抽取同样多的 元素(也是不等概率的)。
正是这一大一小,平衡了由于群的规模带来的概率差异。
(三)公 式
每一个元素
群的规模
平均每个群中 所要抽取的元素
按整群抽样的方法(假设其中一个学校有100 个班级, 每班50名学生)
[PPT模板]四 抽样
(一)整数抽样间距
当N是n的整数倍,即抽样间距k=N/n是整 数,可使用直线等距抽样.即在算出抽样间 距后,先在1-K范围内抽取一个随机数r 作为起点,然后每隔K个单位抽出一个单位, 直到抽出n个单位,抽中单位的号码分别为: r, r+K,…, r+(n-1)K
提醒:
只有在名单很短而且事先已将所有单位编号, 或用电脑处理过,便于编号的情况下,才会 使用随机抽样,否则抽样工作量太大。没有 实际操作意义。
2、系统抽样(Systematic Sampling)
又称等距抽样或机械抽样。即将N个总体按 一定顺序排列,然后先随机抽取一个单位作 为起始单位,再按某种确定的规则(固定的 间隔)抽取其他n-1个样本单位。
异质的群,同质的层
不同抽样方法比较(例子)
调查的总体是全国所有城市的集合,要抽取一个规模为 40个城市的样本。
简单随机抽样或系统抽样:先弄到一份全国城市的名单, 然后根据随机数表或通过计算抽样间距直接从抽样框中抽 取城市
分层抽样:按城市的规模将总体分为特大城市、大城市、 中等城市、小城市。然后分别从每一类中抽取若干城市, 并将这些城市和起来构成样本。
(二)非整数抽样间距
当N不是n的整数倍,即抽样间距K=N/ n不是整数时,不难看出,这时上述矩阵有 些列有N个单位,有些列不足n个单位,若再 利用直线等距抽样就无法保证每个总体单位 以相等的概率入样。
补充:循环等距抽样
循环等距抽样:先将N个总体单位首尾相接 排成一个封闭圆,抽样间距K取最接近N/ n的整数,再从1-N中随机抽取一个随机 起点作为起始单位,然后每隔K抽取一个单 位,直到抽满n个单位为止。这是由于随机 起点是1-N中的任意一个,因此每个总体 单位入样的概率是相等的。
PPS抽样与户内抽样
.
Kish 选择表
.
Kish 选择表
.
Kish 选择表
.
Kish 选择表
.
3.给抽中家庭每个成年人进行编号并排序。
排序方法:男性在前女性在后,年级大的在前, 年龄小的在后。
.
4.根据调查表上的编号找出编号相同的那种 “选择表”查出中选个体的序号,进行调查
.
二、PPS抽样
.
运动员抽取问题:
校运会将至,要求从人文与管理学院各班共抽 取12名同学代表学院出战校运会。出于某些原 因,现只考虑公管1班与公管2班的同学。已知 行公管1班有35人,公管2班有24人,请使用多 段抽样的方法对两班各自出战人数进行计算。
.
解题步骤:
已知人文与管理院有公管1、公 管2、公管3、公管4等班级
➢ 原理:“对冲” 以阶段性的不等换取最终的相等。
➢ 实质:第一阶段中,大的群具有比小的群更大的概率,
➢
而到了第二阶段,每个被抽中的群都抽取同样多
➢
的元素,即小群中元素被抽中的概率大于大群的,
➢
两相平衡。
.
PPS原理公式:
每个元素被抽取的概率=
所抽取群
的数目
( 群的规模 ) 总体的规模
(平均每个群要抽取的元素) 群的规模
第四节
PPS抽样 与户内抽样
.
一、户内抽样
.
概念
◦ 户内抽样(within-household sampling),指的是 以家庭为分析单位时,从所抽中的家庭中抽取一个 成年人,以构成访谈对象的抽样方法。
方法:Kish选择法
.
具体做法:
PPS抽样 ppt课件
例:假设某高校有4000名学生,其中男生占60%,女生占40
%;文科学生和理科学生各占50%;一年级学生占40%、二年 级、三年级、四年级学生分别占30%、20%和l0%。
现在要用定额抽样方法依上述三个变数抽取一个规模 为100人的样本。
2021/3/26
PPS抽样 ppt课件
3
PPS抽样
第二阶段:从10所高校中分别抽取500名学生
按整群抽样的方法
(假设其中一个学校有100个班级,每班50名学生)
2021/3/26
PPS抽样 ppt课件
4
PPS抽样
• 多段抽样中,其实暗含了一个假定:即每一个阶段抽 样时,其元素的规模是相同的。
2021/3/26
PPS抽样 ppt课件
19
PPS抽样
• 定额抽样
• 其目的:在于要抽选出一个总体的“模拟物”, • 其方法:则是通过主观的分析来确定和选择组成这种模拟物的成员。也就
是说,定额抽样注重的是样本与总体在结构比例上的表面一致性。 (“按事先规定的条件,有目的地寻找”)
• 分层抽样
• 目的:一方面是要提高各层间的异质性与同层中的同质性,另一方面也是 为了照顾到某些比例小的层次,使得所抽样本的代表性进一步提高,误差 进一步减小。
• 比如第一阶段抽取学校时,暗含了每个学校的规模相 同。
• 在这样的假定下,采取上述几种随机抽样的方法,最 终每名学生被抽中的概率相等。
2021/3/26
PPS抽样 ppt课件
5
PPS抽样 • 但现实生活中,每一个学校包含的学生人数不同,因
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.使用了辅助信息,可以减少抽样误差
➢劣势:
可行性原则
1.对辅助信息要求较高,实践中较难获得 对所有群的规模的认识
2.方差的估计较复杂
精品课件
18
小试牛刀:
校运会将至,要求从人文与管理学院各班共抽取12 名同学代表管院出战校运会。出于某些原因,现只 考虑行公管1班与公管2班的同学。已知公管1班有 35人,公管2班有24人,请使用PPS抽样的方法对两 班各自出战人数进行计算。
精品课件
19
参考解法:
公管1规模
(
35
35
24
)
7
12
公管2规模
(
35
24
24
)
5
12
公管1:3512 7 12 =7
59 12
公管2:2412 5 12=5
59 12
精品课件
20
感谢亲观看此幻灯片,此课件部分内容来源于网络, 如有侵权请及时联系我们删除,谢谢配合!
感谢亲观看此幻灯片,此课件部分内容来源于网络, 如有侵权请及时联系我们删除,谢谢配合!
精品课件
10
二、PPS抽样
精品课件
11
运动员抽取问题:
校运会将至,要求从人文与管理学院各班共抽 取12名同学代表学院出战校运会。出于某些原 因,现只考虑公管1班与公管2班的同学。已知 行公管1班有35人,公管2班有24人,请使用多 段抽样的方法对两班各自出战人数进行计算。
精品课件
12
解题步骤:
已经人为地假定了每一个阶段中各个抽样单位
的规模是相等的,即各个抽样单位被抽中的概
率相等
PP
此假定显然与实 际不符,易造成
较大的误差
S
bug
patch
精品课件
14
什么是PPS抽样:
➢ 定义:是一种通过使用辅助信息,使得每个抽样单位
都可以按照其规模大小及在总体中所占比例确
定各自被抽取的概率,从而确保各个抽样单位
每个元素被抽取的概率=
所抽取群
的数目
( 群的规模 ) 总体的规模
(平均每个群要抽取的元素) 群的规模
=所抽取群的数目 (平均每个群要抽取的元素) 总体的规模 样本规模
= 总体规模
精品课件
16
PPS操作步骤:
精品课件
17
PPS的优劣势:
➢优势:
目的性原则
1.总体中含量大的部分被抽中的概率也大, 可以提高样本的代表性
2.印制若干套选择卡(1套8种),给每个调查员发 一套(八张)。
精品课件
4
Kish 选择表
精品课件
5
Kish 选择表
精品课件
6Kish 选择表精品 Nhomakorabea件7
Kish 选择表
精品课件
8
3.给抽中家庭每个成年人进行编号并排序。
排序方法:男性在前女性在后,年级大的在前, 年龄小的在后。
精品课件
9
4.根据调查表上的编号找出编号相同的那种 “选择表”查出中选个体的序号,进行调查
第四节
PPS抽样 与户内抽样
精品课件
1
一、户内抽样
精品课件
2
概念
◦ 户内抽样(within-household sampling),指的是 以家庭为分析单位时,从所抽中的家庭中抽取一个 成年人,以构成访谈对象的抽样方法。
方法:Kish选择法
精品课件
3
具体做法:
1 、先将调查表编号,分为以下八种不同的表格。 每种表格所占数量比例不同。
被抽取的概率相等的一种抽样方式。
➢ 特点:概率与元素规模大小成比例,即不等概率。
➢ 原理:“对冲” 以阶段性的不等换取最终的相等。
➢ 实质:第一阶段中,大的群具有比小的群更大的概率,
➢
而到了第二阶段,每个被抽中的群都抽取同样多
➢
的元素,即小群中元素被抽中的概率大于大群的,
➢
两相平衡。
精品课件
15
PPS原理公式:
已知人文与管理院有公管1、公 管2、公管3、公管4等班级
从中抽出公管1、公管2两个班级
获取两个班体育成绩前十的同学名单
两个班明显规 模不一样,却 抽取了同样数
目的运动员
各从中随机取6个 同学作管院代表
精品课件
你认为,这 合理吗?
13
多段抽样暗含的假定:
在进行每一个阶段的抽样时,其元素的规模大
小相同。也就是说,在进行多段抽样前,我们