常用的抽样方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
随机化回答是指在调查中使用特定的随机化装置,使得被 调查者以预定的概率来回答敏感性问题。这一技术的宗旨就 是最大限度地为被调查者保守秘密,从而取得被调查者的信 任。
RRT技术的基本原理在于当被调查者确信调查者及其他 人无法从被调查者的回答中获知他们的真实行为时,能更加 真实地对敏感问题进行回答。并且RRT技术保护调查对象的 个人隐私,能充分得到调查对象的配合,最终可显著降低无 应答率和误答率,得到高质量的调查结果。
随机应答技术 Randomized Response Techniques (RRT)
敏感问题(sensitive problem)
是指涉及个人(或单位)的隐私或利益的 问题以及大多数人认为不便在公开场合表 态或陈述的问题,在某些情况下,还包括 一些违法犯罪的行为。
敏感问题的特点: 一般是社会舆论导向所不认同的或反 对的行为或观点 不同特征的人群有不同的敏感问题 不同敏感问题在敏感程度上存在差异
先将总体按某种特征分成若干层,再从每一 层内随机抽取一定数量的观察单位,合起来组成 样本。
(1)按比例分配:按总体各层观察单位数的多少分配
ni
Ni
n N
(2)最优分配:按各层观察单位数多少及其变异大小
分配
均数 :
ni n
Ni i Ni i
率
:
ni n
Ni i 1 i Ni i 1 i
础,但有一些改进,它将沃纳模型中与敏感性问题相对的 具有特征A的问题改为一个与敏感性问题不相关的其它问 题。
(三)“随机变量和”回答模型
一、随机应答技术的步骤
1.向应答者提出一对问题
设计一对问题,使两个问题的答案种数和编码 完全一致,应答者随机选取一个问题,将答案编码 选出,在答案上做出相应的记号。由于答卷上没有 问题的编号,只有一套答案编码,人们无从知晓应 答者回答的是哪一个问题,因而起到保密作用。
随机化应答模型
(一)沃纳模型(Warner model) 1965年由Warner提出的,其设计思想是向被调查者显
示两个与敏感性问题(具有特征A)有关,但完全对立的问 题,让调查者按预定的概率从中选一个回答,调查者无权 过问被调查者回答的是哪一个问题,从而起到了为被调查 者保密的效果。
(二)西蒙斯模型 1967年由西蒙斯提出的,其基本思想仍以沃纳模型为基
一、单纯随机抽样(simple random sampling)
1、抽样方法
根据研究目的选定总体,首先对总体中所有的 观察单位编号,遵循随机原则,采用不放回抽取方 法,从总体中随机抽取一定数量观察单位组成样本。
具体方法 ①随机数字法 ② 抽签法
2、优缺点
①对所有观察单位编号,当数量大时,有难度 ② 抽样误差的计算较方便
2、所调查总体标准差,若不了解,须通过 预试验的标准差S或前人的资料作出估计;
3、第一类错误的概率 4、对有限总体抽样时,还须了解总体观察 单位数。
二、计算公式
均数的抽样 : 率的抽样 :
u
2
n
2
,
X
u2 1
n
2
2
, p
(1)两个相关联问题模式: 设计两个相对立的陈述。
例如 问题1:你曾经吸过毒吗? 问题2:你从未吸过毒吗?
①是 ②否 ①是 ②否
(2)两个不相关联问题模式:
第一陈述为敏感性问题,第二陈述是与第一陈
述无关的非敏感性问题,可以得到确切的答案。
例如 问题1:你曾经吸过毒吗? ①是 ②否
问题2:你是工人吗?
3.根据概率理论进行计算
(1) 问题1:你曾经吸过毒吗? ①是 ②否 问题2:你从未吸过毒吗? ①是 ②否
①是 ②否
2.设置一个随机装置进行调查
使用一个内装许多黑、白两色小球的 匣子,黑白球的比例接近1:1,但不等于 1:1,例如可以是60%和40%。
混合均匀后,被调查者从匣子中随机 摸取一球,摸取的是黑球还是白球只有被 调查者知道。若摸取的是黑球,则回答第 一个问题,否则,回答第二个问题。
答卷上只有答案选择,没有题号,可 按如下格式设计:“请将你的回答在相应 的编号处做上记号√:①是 ②否”。
2、优缺点
(1)在一定程度上控制了抽样误差,尤其是最优分配法 (2)应尽量使层内差别小而层间差别大,以提高效率 (3)事先应了解各层的总体含量,最优分配还应了解标准差
多阶段随机抽样
样本含量的估计
单纯随机抽样
一、先决条件
1、容许误差,预计样本统计量与相应总体 参数的最大相差控制在什么范围。常取可信区间 长度一半。
先将总体划分为若干个“群”组,每个群包括若干 个观察单位,再随机抽取n个群,被抽到的各群的全部 观察单位则组成样本。
2、优缺点
(1)在较大规模的现场调查中,易组织,较节省。 (2)若各群间的差异较大,该抽样方法的误差较大。
3、抽样误差
四、分层抽样(stratified sampling)
1、抽样方法
2、优缺点
(1)抽样方法简便 (2)易得到一个按比例分配的样本,抽样误差较小 (3)仍需对每个观察单位编号 (4)当观察单位按顺序有周期趋势或单调性趋势时, 产生明显偏性
3、抽样误差
无固定的计算公式,常按单纯随机抽样方法来计算, 与总体的性质和被抽样个体间的间隔有关。
三、整群抽样(cluster sampling) 1、抽样方法
敏感问题的分类: 属性特征敏感问题 数量特征敏感问题
对于敏感性问题,若采用直接回答的形 式,被调查者难免产生抵触情绪,不愿据 实回答,这样导致调查数据失真、调查结 果无效。
因此寻求解决敏感性问题调查的有效方 法至关重要。
随机应答技术 Randomized Response Techniques (RRT)
3、抽样误差的估计 有限总体与无限总体
总体类型 无限总体
有限总体
均数标准误
s n
s 1 n nN
率的标准误ຫໍສະໝຸດ Baidu
p1 p
n 1
p1 p 1 n
n 1
N
二、系统抽样(systematic sampling)
又称等距/机械抽样 1、抽样方法
先将总体的观察单位按某顺序号等分成n个部分 再从第一部分随机抽第k号观察单位,依次用相等间 隔,机械地从每一部分各抽取一个观察单位组成样本。
RRT技术的基本原理在于当被调查者确信调查者及其他 人无法从被调查者的回答中获知他们的真实行为时,能更加 真实地对敏感问题进行回答。并且RRT技术保护调查对象的 个人隐私,能充分得到调查对象的配合,最终可显著降低无 应答率和误答率,得到高质量的调查结果。
随机应答技术 Randomized Response Techniques (RRT)
敏感问题(sensitive problem)
是指涉及个人(或单位)的隐私或利益的 问题以及大多数人认为不便在公开场合表 态或陈述的问题,在某些情况下,还包括 一些违法犯罪的行为。
敏感问题的特点: 一般是社会舆论导向所不认同的或反 对的行为或观点 不同特征的人群有不同的敏感问题 不同敏感问题在敏感程度上存在差异
先将总体按某种特征分成若干层,再从每一 层内随机抽取一定数量的观察单位,合起来组成 样本。
(1)按比例分配:按总体各层观察单位数的多少分配
ni
Ni
n N
(2)最优分配:按各层观察单位数多少及其变异大小
分配
均数 :
ni n
Ni i Ni i
率
:
ni n
Ni i 1 i Ni i 1 i
础,但有一些改进,它将沃纳模型中与敏感性问题相对的 具有特征A的问题改为一个与敏感性问题不相关的其它问 题。
(三)“随机变量和”回答模型
一、随机应答技术的步骤
1.向应答者提出一对问题
设计一对问题,使两个问题的答案种数和编码 完全一致,应答者随机选取一个问题,将答案编码 选出,在答案上做出相应的记号。由于答卷上没有 问题的编号,只有一套答案编码,人们无从知晓应 答者回答的是哪一个问题,因而起到保密作用。
随机化应答模型
(一)沃纳模型(Warner model) 1965年由Warner提出的,其设计思想是向被调查者显
示两个与敏感性问题(具有特征A)有关,但完全对立的问 题,让调查者按预定的概率从中选一个回答,调查者无权 过问被调查者回答的是哪一个问题,从而起到了为被调查 者保密的效果。
(二)西蒙斯模型 1967年由西蒙斯提出的,其基本思想仍以沃纳模型为基
一、单纯随机抽样(simple random sampling)
1、抽样方法
根据研究目的选定总体,首先对总体中所有的 观察单位编号,遵循随机原则,采用不放回抽取方 法,从总体中随机抽取一定数量观察单位组成样本。
具体方法 ①随机数字法 ② 抽签法
2、优缺点
①对所有观察单位编号,当数量大时,有难度 ② 抽样误差的计算较方便
2、所调查总体标准差,若不了解,须通过 预试验的标准差S或前人的资料作出估计;
3、第一类错误的概率 4、对有限总体抽样时,还须了解总体观察 单位数。
二、计算公式
均数的抽样 : 率的抽样 :
u
2
n
2
,
X
u2 1
n
2
2
, p
(1)两个相关联问题模式: 设计两个相对立的陈述。
例如 问题1:你曾经吸过毒吗? 问题2:你从未吸过毒吗?
①是 ②否 ①是 ②否
(2)两个不相关联问题模式:
第一陈述为敏感性问题,第二陈述是与第一陈
述无关的非敏感性问题,可以得到确切的答案。
例如 问题1:你曾经吸过毒吗? ①是 ②否
问题2:你是工人吗?
3.根据概率理论进行计算
(1) 问题1:你曾经吸过毒吗? ①是 ②否 问题2:你从未吸过毒吗? ①是 ②否
①是 ②否
2.设置一个随机装置进行调查
使用一个内装许多黑、白两色小球的 匣子,黑白球的比例接近1:1,但不等于 1:1,例如可以是60%和40%。
混合均匀后,被调查者从匣子中随机 摸取一球,摸取的是黑球还是白球只有被 调查者知道。若摸取的是黑球,则回答第 一个问题,否则,回答第二个问题。
答卷上只有答案选择,没有题号,可 按如下格式设计:“请将你的回答在相应 的编号处做上记号√:①是 ②否”。
2、优缺点
(1)在一定程度上控制了抽样误差,尤其是最优分配法 (2)应尽量使层内差别小而层间差别大,以提高效率 (3)事先应了解各层的总体含量,最优分配还应了解标准差
多阶段随机抽样
样本含量的估计
单纯随机抽样
一、先决条件
1、容许误差,预计样本统计量与相应总体 参数的最大相差控制在什么范围。常取可信区间 长度一半。
先将总体划分为若干个“群”组,每个群包括若干 个观察单位,再随机抽取n个群,被抽到的各群的全部 观察单位则组成样本。
2、优缺点
(1)在较大规模的现场调查中,易组织,较节省。 (2)若各群间的差异较大,该抽样方法的误差较大。
3、抽样误差
四、分层抽样(stratified sampling)
1、抽样方法
2、优缺点
(1)抽样方法简便 (2)易得到一个按比例分配的样本,抽样误差较小 (3)仍需对每个观察单位编号 (4)当观察单位按顺序有周期趋势或单调性趋势时, 产生明显偏性
3、抽样误差
无固定的计算公式,常按单纯随机抽样方法来计算, 与总体的性质和被抽样个体间的间隔有关。
三、整群抽样(cluster sampling) 1、抽样方法
敏感问题的分类: 属性特征敏感问题 数量特征敏感问题
对于敏感性问题,若采用直接回答的形 式,被调查者难免产生抵触情绪,不愿据 实回答,这样导致调查数据失真、调查结 果无效。
因此寻求解决敏感性问题调查的有效方 法至关重要。
随机应答技术 Randomized Response Techniques (RRT)
3、抽样误差的估计 有限总体与无限总体
总体类型 无限总体
有限总体
均数标准误
s n
s 1 n nN
率的标准误ຫໍສະໝຸດ Baidu
p1 p
n 1
p1 p 1 n
n 1
N
二、系统抽样(systematic sampling)
又称等距/机械抽样 1、抽样方法
先将总体的观察单位按某顺序号等分成n个部分 再从第一部分随机抽第k号观察单位,依次用相等间 隔,机械地从每一部分各抽取一个观察单位组成样本。