常用的抽样方法PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
.
(1)两个相关联问题模式: 设计两个相对立的陈述。 例如 问题1:你曾经吸过毒吗? 问题2:你从未吸过毒吗?
①是 ②否 ①是 ②否
(2)两个不相关联问题模式:
第一陈述为敏感性问题,第二陈述是与第一陈
述无关的非敏感性问题,可以得到确切的答案。
例如 问题1:你曾经吸过毒吗? ①是 ②否
问题2:你是工人吗?
先将总体按某种特征分成若干层,再从每一 层内随机抽取一定数量的观察单位,合起来组成 样本。
.
(1)按比例分配:按总体各层观察单位数的多少分配
ni Ni nN
(2)最优分配:按各层观察单位数多少及其变异大小分
配
均数 : ni n
Nii Nii
率:
ni n
Ni i1i Ni i1i
.
2、优缺点
2、所调查总体标准差,若不了解,须通过 预试验的标准差S或前人的资料作出估计;
3、第一类错误的概率 4、对有限总体抽样时,还须了解总体观察 单位数。
.
二、计算公式
均数的抽样:
u 2
n
2
,
X
u2 1
率的抽样 :
n
2
2
, p
.
随机应答技术 Randomized Response Techniques (RRT)
(1)在一定程度上控制了抽样误差,尤其是最优分配法 (2)应尽量使层内差别小而层间差别大,以提高效率 (3)事先应了解各层的总体含量,最优分配还应了解标准差
.
多阶段随机抽样
.
样本含量的估计
.
单纯随机抽样
一、先决条件
1、容许误差,预计样本统计量与相应总体参 数的最大相差控制在什么范围。常取可信区间长 度一半。
.
3.根据概率理论进行计算
(1) 问题1:你曾经吸过毒吗? ①是 ②否 问题2:你从未吸过毒吗? ①是 ②否
假设黑球所占的比例为P,白球所占的比例为 1-P,应答者中回答“是”的总比例为r,那么对第 一个问题回答“是”的比例RA可以由下式推算:
1967年由西蒙斯提出的,其基本思想仍以沃纳模型为基 础,但有一些改进,它将沃纳模型中与敏感性问题相对的 具有特征A的问题改为一个与敏感性问题不相关的其它问 题。 (三)“随机变量和”回答模型
.
一、随机应答技术的步骤
1.向应答者提出一对问题
设计一对问题,使两个问题的答案种数和编码 完全一致,应答者随机选取一个问题,将答案编码 选出,在答案上做出相应的记号。由于答卷上没有 问题的编号,只有一套答案编码,人们无从知晓应 答者回答的是哪一个问题,因而起到保密作用。
常用的抽样方法
.
一、单纯随机抽样(simple random sampling)
1、抽样方法
根据研究目的选定总体,首先对总体中所有的观 察单位编号,遵循随机原则,采用不放回抽取方法, 从总体中随机抽取一定数量观察单位组成样本。
具体方法 ①随机数字法 ② 抽签法
.
2、优缺点
①对所有观察单位编号,当数量大时,有难度 ② 抽样误差的计算较方便
.
敏感问题(sensitive problem)
是指涉及个人(或单位)的隐私或利益的 问题以及大多数人认为不便在公开场合表 态或陈述的问题,在某些情况下,还包括 一些违法犯罪的行为。
.
敏感问题的特点: 一般是社会舆论导向所不认同的或反 对的行为或观点 不同特征的人群有不同的敏感问题 不同敏感问题在敏感程度上存在差异
先将总体划分为若干个“群”组,每个群包括若干 个观察单位,再随机抽取n个群,被抽到的各群的全部观 察单位则组成样本。
.
2、优缺点
(1)在较大规模的现场调查中,易组织,较节省。 (2)若各群间的差异较大,该抽样方法的误差较大。
3、抽样误差
.
四、分层抽样(stratified sampling)
1、抽样方法
.
2、优缺点
(1)抽样方法简便 (2)易得到一个按比例分配的样本,抽样误差较小 (3)仍需对每个观察单位编号 (4)当观察单位按顺序有周期趋势或单调性趋势时, 产生明显偏性
.
3、抽样误差
无固定的计算公式,常按单纯随机抽样方法来计算, 与总体的性质和被抽样个体间的间隔有关。
.
三、整群抽样(cluster sampling) 1、抽样方法
敏感问题的分类: 属性特征敏感问题 数量特征敏感问题
.wenku.baidu.com
对于敏感性问题,若采用直接回答的形 式,被调查者难免产生抵触情绪,不愿据 实回答,这样导致调查数据失真、调查结 果无效。
因此寻求解决敏感性问题调查的有效方 法至关重要。
.
随机应答技术 Randomized Response Techniques (RRT)
随机化回答是指在调查中使用特定的随机化装置,使得被 调查者以预定的概率来回答敏感性问题。这一技术的宗旨就 是最大限度地为被调查者保守秘密,从而取得被调查者的信 任。
RRT技术的基本原理在于当被调查者确信调查者及其他 人无法从被调查者的回答中获知他们的真实行为时,能更加 真实地对敏感问题进行回答。并且RRT技术保护调查对象的 个人隐私,能充分得到调查对象的配合,最终可显著降低无 应答率和误答率,得到高质量的调查结果。
.
3、抽样误差的估计 有限总体与无限总体
总体类型 无限总体
有限总体
均数标准误
s n
s 1 n nN
率的标准误
p1 p
n 1
p1p 1 n
n1
N
.
二、系统抽样(systematic sampling)
又称等距/机械抽样 1、抽样方法
先将总体的观察单位按某顺序号等分成n个部分 再从第一部分随机抽第k号观察单位,依次用相等间 隔,机械地从每一部分各抽取一个观察单位组成样本。
①是 ②否
.
2.设置一个随机装置进行调查
使用一个内装许多黑、白两色小球的 匣子,黑白球的比例接近1:1,但不等于 1:1,例如可以是60%和40%。
混合均匀后,被调查者从匣子中随机 摸取一球,摸取的是黑球还是白球只有被 调查者知道。若摸取的是黑球,则回答第 一个问题,否则,回答第二个问题。
答卷上只有答案选择,没有题号,可 按如下格式设计:“请将你的回答在相应 的编号处做上记号√:①是 ②否”。
.
随机化应答模型
(一)沃纳模型(Warner model) 1965年由Warner提出的,其设计思想是向被调查者显示
两个与敏感性问题(具有特征A)有关,但完全对立的问题, 让调查者按预定的概率从中选一个回答,调查者无权过问 被调查者回答的是哪一个问题,从而起到了为被调查者保 密的效果。 (二)西蒙斯模型
(1)两个相关联问题模式: 设计两个相对立的陈述。 例如 问题1:你曾经吸过毒吗? 问题2:你从未吸过毒吗?
①是 ②否 ①是 ②否
(2)两个不相关联问题模式:
第一陈述为敏感性问题,第二陈述是与第一陈
述无关的非敏感性问题,可以得到确切的答案。
例如 问题1:你曾经吸过毒吗? ①是 ②否
问题2:你是工人吗?
先将总体按某种特征分成若干层,再从每一 层内随机抽取一定数量的观察单位,合起来组成 样本。
.
(1)按比例分配:按总体各层观察单位数的多少分配
ni Ni nN
(2)最优分配:按各层观察单位数多少及其变异大小分
配
均数 : ni n
Nii Nii
率:
ni n
Ni i1i Ni i1i
.
2、优缺点
2、所调查总体标准差,若不了解,须通过 预试验的标准差S或前人的资料作出估计;
3、第一类错误的概率 4、对有限总体抽样时,还须了解总体观察 单位数。
.
二、计算公式
均数的抽样:
u 2
n
2
,
X
u2 1
率的抽样 :
n
2
2
, p
.
随机应答技术 Randomized Response Techniques (RRT)
(1)在一定程度上控制了抽样误差,尤其是最优分配法 (2)应尽量使层内差别小而层间差别大,以提高效率 (3)事先应了解各层的总体含量,最优分配还应了解标准差
.
多阶段随机抽样
.
样本含量的估计
.
单纯随机抽样
一、先决条件
1、容许误差,预计样本统计量与相应总体参 数的最大相差控制在什么范围。常取可信区间长 度一半。
.
3.根据概率理论进行计算
(1) 问题1:你曾经吸过毒吗? ①是 ②否 问题2:你从未吸过毒吗? ①是 ②否
假设黑球所占的比例为P,白球所占的比例为 1-P,应答者中回答“是”的总比例为r,那么对第 一个问题回答“是”的比例RA可以由下式推算:
1967年由西蒙斯提出的,其基本思想仍以沃纳模型为基 础,但有一些改进,它将沃纳模型中与敏感性问题相对的 具有特征A的问题改为一个与敏感性问题不相关的其它问 题。 (三)“随机变量和”回答模型
.
一、随机应答技术的步骤
1.向应答者提出一对问题
设计一对问题,使两个问题的答案种数和编码 完全一致,应答者随机选取一个问题,将答案编码 选出,在答案上做出相应的记号。由于答卷上没有 问题的编号,只有一套答案编码,人们无从知晓应 答者回答的是哪一个问题,因而起到保密作用。
常用的抽样方法
.
一、单纯随机抽样(simple random sampling)
1、抽样方法
根据研究目的选定总体,首先对总体中所有的观 察单位编号,遵循随机原则,采用不放回抽取方法, 从总体中随机抽取一定数量观察单位组成样本。
具体方法 ①随机数字法 ② 抽签法
.
2、优缺点
①对所有观察单位编号,当数量大时,有难度 ② 抽样误差的计算较方便
.
敏感问题(sensitive problem)
是指涉及个人(或单位)的隐私或利益的 问题以及大多数人认为不便在公开场合表 态或陈述的问题,在某些情况下,还包括 一些违法犯罪的行为。
.
敏感问题的特点: 一般是社会舆论导向所不认同的或反 对的行为或观点 不同特征的人群有不同的敏感问题 不同敏感问题在敏感程度上存在差异
先将总体划分为若干个“群”组,每个群包括若干 个观察单位,再随机抽取n个群,被抽到的各群的全部观 察单位则组成样本。
.
2、优缺点
(1)在较大规模的现场调查中,易组织,较节省。 (2)若各群间的差异较大,该抽样方法的误差较大。
3、抽样误差
.
四、分层抽样(stratified sampling)
1、抽样方法
.
2、优缺点
(1)抽样方法简便 (2)易得到一个按比例分配的样本,抽样误差较小 (3)仍需对每个观察单位编号 (4)当观察单位按顺序有周期趋势或单调性趋势时, 产生明显偏性
.
3、抽样误差
无固定的计算公式,常按单纯随机抽样方法来计算, 与总体的性质和被抽样个体间的间隔有关。
.
三、整群抽样(cluster sampling) 1、抽样方法
敏感问题的分类: 属性特征敏感问题 数量特征敏感问题
.wenku.baidu.com
对于敏感性问题,若采用直接回答的形 式,被调查者难免产生抵触情绪,不愿据 实回答,这样导致调查数据失真、调查结 果无效。
因此寻求解决敏感性问题调查的有效方 法至关重要。
.
随机应答技术 Randomized Response Techniques (RRT)
随机化回答是指在调查中使用特定的随机化装置,使得被 调查者以预定的概率来回答敏感性问题。这一技术的宗旨就 是最大限度地为被调查者保守秘密,从而取得被调查者的信 任。
RRT技术的基本原理在于当被调查者确信调查者及其他 人无法从被调查者的回答中获知他们的真实行为时,能更加 真实地对敏感问题进行回答。并且RRT技术保护调查对象的 个人隐私,能充分得到调查对象的配合,最终可显著降低无 应答率和误答率,得到高质量的调查结果。
.
3、抽样误差的估计 有限总体与无限总体
总体类型 无限总体
有限总体
均数标准误
s n
s 1 n nN
率的标准误
p1 p
n 1
p1p 1 n
n1
N
.
二、系统抽样(systematic sampling)
又称等距/机械抽样 1、抽样方法
先将总体的观察单位按某顺序号等分成n个部分 再从第一部分随机抽第k号观察单位,依次用相等间 隔,机械地从每一部分各抽取一个观察单位组成样本。
①是 ②否
.
2.设置一个随机装置进行调查
使用一个内装许多黑、白两色小球的 匣子,黑白球的比例接近1:1,但不等于 1:1,例如可以是60%和40%。
混合均匀后,被调查者从匣子中随机 摸取一球,摸取的是黑球还是白球只有被 调查者知道。若摸取的是黑球,则回答第 一个问题,否则,回答第二个问题。
答卷上只有答案选择,没有题号,可 按如下格式设计:“请将你的回答在相应 的编号处做上记号√:①是 ②否”。
.
随机化应答模型
(一)沃纳模型(Warner model) 1965年由Warner提出的,其设计思想是向被调查者显示
两个与敏感性问题(具有特征A)有关,但完全对立的问题, 让调查者按预定的概率从中选一个回答,调查者无权过问 被调查者回答的是哪一个问题,从而起到了为被调查者保 密的效果。 (二)西蒙斯模型