社会科学研究:抽样调查
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ຫໍສະໝຸດ Baidu
Q2:为什么这样抽样的误差小?换言之,为 什么在同样精度要求下 , 分层抽样可以降 低样本数量?
▲分层抽样适合于异质性高的总体
3.整群抽样(Cluster Sampling) 当总体中的要素明显分成许多子群,且 子群间同质性高,子群内异质性高时, 抽出若干子群就能代表总体(抽中的子 群内所有要素均成为样本)
4.抽样框(Sampling Frame) 抽样框=各阶段抽样单位的实际名单(全部省,市, 县/区,街道/乡,居委会/村,家庭/个人名单) 5.参数值(Parameter)与统计值(Statistic) 参数值=总体中某变量的综合描述 统计值=调查样本中某变量的综合描述
二、抽样的程序 1.界定总体和调查总体 ▲要考虑调查总体是否代表总体 (《文学文摘》抽样失败案例)
普查(General Survey)
概率抽样(Probability Sampling)
抽样调查 非概率抽样(Nonprobability Sampling)
▲概率抽样包括: 简单随机抽样 系统抽样 分层抽样 整群抽样 多阶段抽样 概率比例抽样 ▲非概率抽样包括: 偶遇抽样 目标或判断抽样 定额抽样 滚雪球抽样
简单随机抽样在编码前无须使之随机; 系统抽样须在排列时使之随机
2.分层抽样(Stratified Sampling) Q :当总体异质性高时,为了避免抽取过 大的样本,如何抽样? 操作方法: 1)选择分层变量:要与想描述的变量紧密 相关 例1:调查各类人员对经济体制改革的看法 例2:调查高校在校生的就职倾向 例3:调查企业职工读书的数量
三、概率抽样(Probability Sampling) ▲抽样的核心原则: 使样本能代表总体 => 使任何要素都具有 同等的、独立于任何其他事件的被抽到 的概率(如抽样过程中要素之间的影响)
=>要素的特征的结构与总体相似
1 . 简 单 随 机 抽 样 ( Simple Random Sampling ) 和 系 统 抽 样 ( Systematic Sampling) 简单随机抽样=建立了合适的抽样框后, 编码,然后利用随机数字表来抽样 (1)利用随机数字表来进行简单随机抽样 例:从1100人中抽100人 ---把1100人编号 ---确定4位随机数字 ---确定4位随机数字的选择方法 (方法要固 定)
▲ 注意: ---只挑在1—1100间的数 ---若碰到了以前选过的数:跳过
(2)系统抽样(=等距抽样):每隔K (抽样间距)个要素抽一个
▲ 术语: 抽样比率=样本数/总体数 抽样间距(K)=总体数/样本数
▲ 要求:(两个随机) ---抽样框中要素在抽样前随机排列 ---开始抽的第一个号码须随机
2.总体(Population)=研究总体(袁方书) 研究总体=理论上界定的研究要素的特定集合体 (内容,单位,范围,时间) 如:妇女(15-50岁),人,中国,2004年 3.调查总体(Study Population)=研究者从中 实际抽取调查样本的全体要素的总和 如(上例):除台湾以外、不在医院和监狱里 的
▲抽样成功案例 1968,G. Gallup 的美国民意调查研究 所(American Institute of Public Opinion) 仅用2000人作为样本成功地预 测总统候选人R. Nixon的得票率(抽样调 查预测的支持率为43%,实际得票率 42.9%)。
一、抽样调查(Survey Sampling)的概念与术 语
1 . 要 素 / 元 素 ( Element ) 与 抽 样 单 位 (Sampling Unit) 要素 = 搜集信息的单位(人,家庭,组织,社 区;文章,词,杂志,歌曲;汽车) 抽样单位 = 抽样各阶段中选取的要素或要素集 合(省,市,县 / 区,街道 / 乡,居委会 / 村, 家庭/个人)
▲ 危险:当抽样框中要素,依照其某个特征 变量的值发生有规律的排列时,抽样结果有可 能会产生重大偏误.特别注意如下两种情况: (1)循环排列(Cyclical Pattern) (2)高低有序排列(如学生按成绩从高到底排)
解决方法: ---打乱,使之随机 ---在每个间隔内用简单随机抽样
■简单随机抽样与系统抽样的比较
2)进行分层抽样: 方法 1 :按相对比例从分层得到的次级集 合中随机抽样/系统抽样 方法 2 :把各次级集合连续列表,然后对 列表进行一个随机起始的系统抽样
Q1:在方法2中,能否对各次级集合的连续 列表进行简单随机抽样?
注意:在方法2中,不能对各次级集合的连 续列表进行简单随机抽样!因为这样一来 又回到了简单随机抽样 ( 简单随机抽样对 要素的排列顺序无任何要求)
抽样调查
一 二 三 四
抽样调查的概念与术语 抽样的程序 概率抽样 非概率抽样
▲著名的抽样失败案例 1936,美国《文学文摘》(Literary Digest )预测总统候选人A. Landon 和F. Roosevelt的得票率。 从电话薄的车牌登记名单中抽出1000 万人,收到200万人回应。
抽样调查预测A. Landon的支持率为 57%, F. Roosevelt的支持率为43%,但实 际他以61%的优势获胜。
▲抽子群的方法:随机抽样/系统抽样 例:一个城市中的若干小学;居委会;一 个县的若干村
▲分层抽样与整群抽样的比较
4 . 多 阶 段 整 群 抽 样 (Multistage Cluster Sampling) 是按抽样元素的隶属关系或层次关系, 把抽样过程分成几个阶段进行. 适用的场合 : 在大规模抽样 ( 总体规模大 / 分 布范围广)时,当: 1)子群数或子群内个体数较多 并且, 2)子群间或子群内个体之间差异不大时
2.编制抽样框 3.设计和抽取样本 设计:各阶段抽取多少(根据抽样方法的要求计算) 例:入户访问填答问卷时 不在家或拒答的情况:二访或三访/选左邻
4.评估样本并对总体进行估计
(1)准确性:抽样严格按随机原则;设法 减少无回答率
(2)精确性:比较随机抽取的样本与总体 的特征是否符合(如调查人均受教育年 限时抽取的样本的性别比;调查家庭人 均收入时抽取的样本的户均人口数分布)
Q2:为什么这样抽样的误差小?换言之,为 什么在同样精度要求下 , 分层抽样可以降 低样本数量?
▲分层抽样适合于异质性高的总体
3.整群抽样(Cluster Sampling) 当总体中的要素明显分成许多子群,且 子群间同质性高,子群内异质性高时, 抽出若干子群就能代表总体(抽中的子 群内所有要素均成为样本)
4.抽样框(Sampling Frame) 抽样框=各阶段抽样单位的实际名单(全部省,市, 县/区,街道/乡,居委会/村,家庭/个人名单) 5.参数值(Parameter)与统计值(Statistic) 参数值=总体中某变量的综合描述 统计值=调查样本中某变量的综合描述
二、抽样的程序 1.界定总体和调查总体 ▲要考虑调查总体是否代表总体 (《文学文摘》抽样失败案例)
普查(General Survey)
概率抽样(Probability Sampling)
抽样调查 非概率抽样(Nonprobability Sampling)
▲概率抽样包括: 简单随机抽样 系统抽样 分层抽样 整群抽样 多阶段抽样 概率比例抽样 ▲非概率抽样包括: 偶遇抽样 目标或判断抽样 定额抽样 滚雪球抽样
简单随机抽样在编码前无须使之随机; 系统抽样须在排列时使之随机
2.分层抽样(Stratified Sampling) Q :当总体异质性高时,为了避免抽取过 大的样本,如何抽样? 操作方法: 1)选择分层变量:要与想描述的变量紧密 相关 例1:调查各类人员对经济体制改革的看法 例2:调查高校在校生的就职倾向 例3:调查企业职工读书的数量
三、概率抽样(Probability Sampling) ▲抽样的核心原则: 使样本能代表总体 => 使任何要素都具有 同等的、独立于任何其他事件的被抽到 的概率(如抽样过程中要素之间的影响)
=>要素的特征的结构与总体相似
1 . 简 单 随 机 抽 样 ( Simple Random Sampling ) 和 系 统 抽 样 ( Systematic Sampling) 简单随机抽样=建立了合适的抽样框后, 编码,然后利用随机数字表来抽样 (1)利用随机数字表来进行简单随机抽样 例:从1100人中抽100人 ---把1100人编号 ---确定4位随机数字 ---确定4位随机数字的选择方法 (方法要固 定)
▲ 注意: ---只挑在1—1100间的数 ---若碰到了以前选过的数:跳过
(2)系统抽样(=等距抽样):每隔K (抽样间距)个要素抽一个
▲ 术语: 抽样比率=样本数/总体数 抽样间距(K)=总体数/样本数
▲ 要求:(两个随机) ---抽样框中要素在抽样前随机排列 ---开始抽的第一个号码须随机
2.总体(Population)=研究总体(袁方书) 研究总体=理论上界定的研究要素的特定集合体 (内容,单位,范围,时间) 如:妇女(15-50岁),人,中国,2004年 3.调查总体(Study Population)=研究者从中 实际抽取调查样本的全体要素的总和 如(上例):除台湾以外、不在医院和监狱里 的
▲抽样成功案例 1968,G. Gallup 的美国民意调查研究 所(American Institute of Public Opinion) 仅用2000人作为样本成功地预 测总统候选人R. Nixon的得票率(抽样调 查预测的支持率为43%,实际得票率 42.9%)。
一、抽样调查(Survey Sampling)的概念与术 语
1 . 要 素 / 元 素 ( Element ) 与 抽 样 单 位 (Sampling Unit) 要素 = 搜集信息的单位(人,家庭,组织,社 区;文章,词,杂志,歌曲;汽车) 抽样单位 = 抽样各阶段中选取的要素或要素集 合(省,市,县 / 区,街道 / 乡,居委会 / 村, 家庭/个人)
▲ 危险:当抽样框中要素,依照其某个特征 变量的值发生有规律的排列时,抽样结果有可 能会产生重大偏误.特别注意如下两种情况: (1)循环排列(Cyclical Pattern) (2)高低有序排列(如学生按成绩从高到底排)
解决方法: ---打乱,使之随机 ---在每个间隔内用简单随机抽样
■简单随机抽样与系统抽样的比较
2)进行分层抽样: 方法 1 :按相对比例从分层得到的次级集 合中随机抽样/系统抽样 方法 2 :把各次级集合连续列表,然后对 列表进行一个随机起始的系统抽样
Q1:在方法2中,能否对各次级集合的连续 列表进行简单随机抽样?
注意:在方法2中,不能对各次级集合的连 续列表进行简单随机抽样!因为这样一来 又回到了简单随机抽样 ( 简单随机抽样对 要素的排列顺序无任何要求)
抽样调查
一 二 三 四
抽样调查的概念与术语 抽样的程序 概率抽样 非概率抽样
▲著名的抽样失败案例 1936,美国《文学文摘》(Literary Digest )预测总统候选人A. Landon 和F. Roosevelt的得票率。 从电话薄的车牌登记名单中抽出1000 万人,收到200万人回应。
抽样调查预测A. Landon的支持率为 57%, F. Roosevelt的支持率为43%,但实 际他以61%的优势获胜。
▲抽子群的方法:随机抽样/系统抽样 例:一个城市中的若干小学;居委会;一 个县的若干村
▲分层抽样与整群抽样的比较
4 . 多 阶 段 整 群 抽 样 (Multistage Cluster Sampling) 是按抽样元素的隶属关系或层次关系, 把抽样过程分成几个阶段进行. 适用的场合 : 在大规模抽样 ( 总体规模大 / 分 布范围广)时,当: 1)子群数或子群内个体数较多 并且, 2)子群间或子群内个体之间差异不大时
2.编制抽样框 3.设计和抽取样本 设计:各阶段抽取多少(根据抽样方法的要求计算) 例:入户访问填答问卷时 不在家或拒答的情况:二访或三访/选左邻
4.评估样本并对总体进行估计
(1)准确性:抽样严格按随机原则;设法 减少无回答率
(2)精确性:比较随机抽取的样本与总体 的特征是否符合(如调查人均受教育年 限时抽取的样本的性别比;调查家庭人 均收入时抽取的样本的户均人口数分布)