第九讲抽样设计

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

PPS抽样
❖ Sampling with probability proportional to size。
因为实际的多阶段抽样中各个阶段的子样本规模 并不一样的。为了保证最终的样本具有相同的概 率,必须采取一定的加权策略。
基本的思想是,各个层次的规模越大,就给之有 更大的被抽中概率。
第九讲抽样设计
❖ 非概率抽样
偶遇抽样(accidental sampling) 立意抽样(judgemental sampling/purposive sampling ) 定额抽样(quota sampling) 滚雪球抽样(snowball sampling)
第九讲抽样设计
概率抽样方式
❖ 简单随机抽样
样本框完整,受访对象容易接触时用得多。 总体规模相对较小。
第九讲抽样设计
概率抽样 v.s. 非概率抽样
• 概率抽样具有两项独特的优势:
☺ 通过随机性避免人为因素对抽样的干扰,往往能够得 到比非概率抽样下更具有代表性的样本。
❖ 整群抽样
将总体分为完备互斥的小单位。优先适用于每个单位之间相似、内部异质性明显。 设计效应大于1,扩大标准误,降低精度,但节省成本。
❖ 分层抽样
先将总体分为完备互斥的次类型,然后在次类型的样本框中分别进行抽样。 通过分层将异质性大的总体划分为内部异质性小而彼此之间差异大的次类型。 设计效应通常小于1,减少抽样误差。但需要获取分层变量信息,成本较大。 等和不等比例分配。
第九讲抽样设计
抽样调查的原理示意图
参数值
统计量
元 抽素样 单位 抽


总体
统计 推论
抽 样
样本
抽样调查的目的或功能:管中窥豹!
第九讲抽样设计
抽样中的基本概念
❖ 总体(population):构成它的所有元素的集合。而元素指构成总体的 基本单位——通常就是调查单位。
❖ 样本(sample):以一定方式从总体中抽出的部分元素。总体的子集。 ❖ 抽样(sampling):从总体中抽取样本的过程。 ❖ 抽样单位(sampling unit):一次直接抽样所用的基本单位。 ❖ 抽样框(sampling frame):一次直接抽样时总体中所有抽样单位的名
估,对抽样质量进行评价。
❖ 确定抽样方法
简单随机?整群?分层的?多阶段? 确定样本规模和主要变量的精度
❖ 构建抽样框
花名册?GPS地图?要求无重复无遗漏
❖ 样本质量的评估
将样本的统计信息与已知的总体信息进行对照比较。
第九讲抽样设计
抽样设计的基本原则
❖ 目的性原则:
以课题研究目的为依据,从研究问题出发,最有利于资料收集。
❖ 多阶段抽样
设计效应通常大于1,但好于整群抽样。大规模调查中用得比较多。
❖ 一种特殊的抽样方式:系统抽样
确定随机起点,然后按照某一相同间隔抽取样本。 系统抽样应该避免清单排布的内部循环性,或者某种排序。 在清单随机排布的情况下,系统抽样相当于随机抽样。 在清单按照某些变量顺序排列的第情九况讲下抽,样相设当计于分层抽样。
❖ 可测性原则
尽量保证概率性和随机性,保证统计推断的能够进行。
❖ 可行性原则
具备实践可行性。
❖ 经济性原则
节省各种资源
❖ 实际上需要在各种追求之间保持平衡。以服务于研究目的为 基础,一定要可行,尽量节省成本。
第九讲抽样设计
抽样的类型
❖ 概率抽样(等概率和不等概率)
简单随机抽样(simple random sampling) 系统抽样(systematic sampling) 分层抽样(stratified sampling) 整群抽样(cluster sampling) 多阶段抽样(multistage sampling)
❖ 如何进行社会研究? 测量——比较——归纳与逻辑推导
❖ 那么,首要的问题是如何选取观察或调查的对象? 选ቤተ መጻሕፍቲ ባይዱ所有个体都作为观察或调查的对象:普查
❖ 成本高(人财物、时间、可控制性低)
选取部分个体来作为观察或调查的对象:抽样调查 普查与抽样调查的比较:适用范围、调查内容、时效性、经济成本 抽样调查的代价——抽样误差 ❖ 抽样调查在学术研究、政策研究、商业研究中普遍存在。
❖ 滚雪球抽样
第九讲抽样设计
概率抽样 v.s. 非概率抽样
❖ 概率抽样和非概率抽样的区分
依据:总体中的单元是否按照一定概率进入样本。
• 概率抽样按照概率原则从总体中选取一定量的单位 来构成样本。
• 非概率抽样则以研究者的方便、主观判断或个人经 验来选取样本。
区别一:个体是否被随机地抽选出来。 区别二:样本对总体是否具有代表性。
第九-十一讲 抽样设计、抽样误差与 统计推断
第九讲抽样设计
第一小节 主要内容
1
为什么要抽样
2
抽样中的基本概念
3
抽样的程序与原则
4
概率抽样类型
5
非概率抽样类型
第九讲抽样设计
为什么要抽样?
❖ 社会研究的目的是什么? 了解社会事实:平均收入是多少?平均受教育年限多高? 揭示或解释社会规律:教育与收入存在正向关系。 预测变化或发展趋势:随着教育程度的提高,人们的收入水平将会提高。
单。 ❖ 参数值(parameter):总体的特征或属性取值。如平均值,中位数,众
数,方差等等。 ❖ 统计量(statistic):样本统计量的取值。如样本均值,中位数、众数,
方差等等。
第九讲抽样设计
抽样的基本程序
❖ 定义总体(分析单位,调查单位)
小孩?家庭户?公司?县? 一定要事先界定好,只有界定清楚才能对样本框进行评
❖ 立意抽样
根据研究者主观确定的标准进行的抽样。与研究者的学 识、能力及对于情况的了解把握程度相关。
❖ 定额抽样
根据总体的主要结构划分不同的层,然后逐层选取样本, 但最终样本中每一层的比例与总体中各层的比例相一致。 不过,具体抽取对象时采用的是偶遇法,只要满足特征, 碰到谁调查谁。此法可以有较好代表性。
PPS抽样
❖ PPS的实现方式
使群单位的中选概率与其规模成比例的具体方法 是将各单位排列起来,然后对它们的规模进行累 计,这样各单位都有一个对应的选择号码范围, 该范围的大小等于单位规模,选择的随机号码落 入哪个群对应的范围,哪个群就被选中 。
第九讲抽样设计
非概率抽样
❖ 偶遇抽样
方便抽样、自然抽样、”随缘“抽样。“见谁逮谁”。
相关文档
最新文档