抽样方法与样本量估计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
.
配额抽样
配额抽样可以被看成两阶段有约束的判断抽样 • 第一阶段,由确定总体中的个体的控制类别或者配额组成,
配额确保了样本的组成与总体的组成在特定特征方面相同; • 第二阶段,样本个体在便利或者判断的基础上被选择出来 缺点是: 缺乏对总体的代表性,无法计算抽样误差; 优点是: 低成本,为每个配额选择个体对访谈人员而言较为容易。
.
案例2
牛宏俐: 设计600户,实际只有435户(原因是拒访)
胡瑞: 按地区东中西(共6个县)、按县乡卫生机构(医院1-2所,
卫生院10家),共抽取262人,按30%扩大样本至360人。
.
案例3
研究者用15个对象做试验, 先按药物作用时间长短随机均 分成5组,每组3个对象; 接着又按药物的3种剂量将每组中 的3个对象再均分成3个小组,每小组仅有1个对象。这个试验 研究中的样本含量应当是15?还是1呢?
抽样方法与样本量估计
张文斌 2013.12
.
为什么要抽样
抽样:经济、有效,是科学的。
.
抽样方法创始人-盖洛普
乔治·盖洛普(Gallup,GeorgeHorace,1901—1984,美国数学家)
盖洛普1925-1928年就读爱荷华州立大学(文学学士、心理学硕士、新闻学 博士)。他的博士论文题目是《应用客观方法衡量读者对报纸兴趣的一种新技 术》,这篇论文包含着后来发展为盖洛普民意测验和舆论统计的思想。
.
常用的抽样方法
抽样方法
概率抽样
非概率抽样
单纯 系统 分层 整群 方便 滚雪球 配额 典型
另外:不等概率抽样方法(probability proportional to size , PPS)
.
便利抽样
以研究者或访问者方便来选择被访者,通常被访者由于碰 巧在恰当的时间正处在恰当的地点而被选中 • 使用学生以及社会组织成员; • 医院拦截患者; • “街上的行人”访谈。 优点:便利抽样在所有抽样技术中成本最低、耗时最少,抽样 单位易于接近; 缺点:不能代表总体。
.
如何确定恰当的抽样误差?
有专家认为,抽样调查估计值的相对误差控制在10%以 内,数据质量好,控制15%以内,数据质量较好,控制 20 %以内,数据可用。一些国家在进行国家级抽样调查时,给出 主要调查指标相对误差应控制的范围,规定了估计值的相对误差 超过30%不能公布。
.
案例1
某研究论文中按“病情和就诊的先后顺序分组”。 因 病人就诊的先后顺序往往暗示其病情不同,尤其是当病人 的病情轻重难以判断时若将先来就诊者分在一组,后来就 诊者分在另一组,就不可避免的引入顺序误差( 即一组病人 的病情较另一组病人的病情重) ,从而得出错误结论。
1955年,盖洛普在新泽西州的普林斯顿创立美国舆论研究所,正式举办有关 政治和社会事业问题的各种全国性民意调查——包括对世界人民的态度、恐惧、 希望、宗教信仰和风俗刁惯等的调查。这个研究所的成立,迅速使盖洛普民意测 验具有了权威性,该研究所也称为盖洛普民意测验所。
.
盖洛普的成功
.
盖洛普方法
盖洛普使用的民意调查方法是一种代表性抽样调查方法,是 他在从事新闻工作中发展起来的,根据对象的年龄、性别、教育 程度、职业等标准,在全国各地区按比例选择测验对象,派调查 员亲自去调查访问,根据统计测验结果进行分析,做出说明。这 种方法就是所谓的“定额抽样法”,即将总体各单位按某些主要 标识划分类型后抽取比例样本,是一种非概率抽样。
.
概率抽样与非概率抽样间作抉择
决择考虑方面
研究的性质 抽样误差与非抽样误差的相对大小 总体的变异程度 统计上的考虑 操作上的考虑
有利于使用的条件 非概率抽样 概率抽样
.
一、定义总体
程抽 样
二、确定抽样框架
设 三、选择抽样技术
计
过 四、确定样本容量
五、执行抽样过程
.
抽样调查的主要问题
.
抽样误差
抽样调查目的是用样本调查数据推断总体。但任何样本 数据推断总体,都不可能得到确切的总体真值。即存在抽样 误差。抽样调查理论基础在于用样本数据估计的总体值与总 体真值之间的误差,不会影响数据的使用和对问题的决策。
.
如何正确认识抽样误差?
调查数据存在着误差是绝对的,而误差的大小是相对的, 其相对性取决于研究的问题和需要的决策。在抽样方案设计时, 需要对调查主要指标有一个误差的要求,即样本的抽样误差控 制在什么范围,使其调查数据的使用对分析和决策问题没有影 响或影响很小。这一误差标准没有统一的规定,取决于数据使 用者分析问题与决策的要求。指标相对误差很小,数据精度太 高,样本量需求量大;指标相对误差很大,精度太低,对使用 者来讲数据不能用。
.
滚雪球抽样
通常是先选出一组最初的调查对象,通常是随机选出的, 在访谈之后,要求这些被访者推荐一些属于目标总体的其他 人,根据这些推选出后面的被访者。与随机的方式相比,被 推举的人将具备与推荐人更为翔实的人口及心理特征。 优点是:主要目的是估计总体中wk.baidu.com常稀少的某些特征。 缺点是:这种方式非常耗时。
.
抽样调查的特点
特点1:抽取的样本作为一个“代表团”来代表总体。而不是随意 挑选的个别单位代表总体。 特点2:调查样本一般按随机的原则抽取,在总体中每个单位被抽 取的机会相等。因此被抽中的单位在总体中是均匀分布的,不致出 现倾向性误差,代表性强。 特点3:所抽取的调查样本数量是根据误差的要求并经过科学的计 算确定,在调查样本的数量上有可靠保证。 特点4:抽样误差在调查前就可以根据样本量和总体中各单位之间 的差异程度进行计算,并控制在允许范围内,调查结果的准确程度 较高。
.
对抽样误差认识与使用的误区
一些研究者甚至部分官员不愿意或不习惯接受数据的误差 范围,一谈到误差,惟恐别人说数据不准,将数据误差绝对。 由于对数据误差的认识存在着误区,在如何使用数据上也存在 着误区。抽样调查的数据拿来就用,不谈抽样误差和调查误差, 认为调查数据就是总体的真值。在进行工作政绩考核或进行地 区间的数据对比时,调查指标数据的高低变成了地区之间排队、 政绩评比的依据,忽视了对数据误差的评估。现有的调查数据 不仅没有正确地使用,反而还带来地区之间数据高低的相互攀 比,同时也影响了以后抽样调查的数据质量。
配额抽样
配额抽样可以被看成两阶段有约束的判断抽样 • 第一阶段,由确定总体中的个体的控制类别或者配额组成,
配额确保了样本的组成与总体的组成在特定特征方面相同; • 第二阶段,样本个体在便利或者判断的基础上被选择出来 缺点是: 缺乏对总体的代表性,无法计算抽样误差; 优点是: 低成本,为每个配额选择个体对访谈人员而言较为容易。
.
案例2
牛宏俐: 设计600户,实际只有435户(原因是拒访)
胡瑞: 按地区东中西(共6个县)、按县乡卫生机构(医院1-2所,
卫生院10家),共抽取262人,按30%扩大样本至360人。
.
案例3
研究者用15个对象做试验, 先按药物作用时间长短随机均 分成5组,每组3个对象; 接着又按药物的3种剂量将每组中 的3个对象再均分成3个小组,每小组仅有1个对象。这个试验 研究中的样本含量应当是15?还是1呢?
抽样方法与样本量估计
张文斌 2013.12
.
为什么要抽样
抽样:经济、有效,是科学的。
.
抽样方法创始人-盖洛普
乔治·盖洛普(Gallup,GeorgeHorace,1901—1984,美国数学家)
盖洛普1925-1928年就读爱荷华州立大学(文学学士、心理学硕士、新闻学 博士)。他的博士论文题目是《应用客观方法衡量读者对报纸兴趣的一种新技 术》,这篇论文包含着后来发展为盖洛普民意测验和舆论统计的思想。
.
常用的抽样方法
抽样方法
概率抽样
非概率抽样
单纯 系统 分层 整群 方便 滚雪球 配额 典型
另外:不等概率抽样方法(probability proportional to size , PPS)
.
便利抽样
以研究者或访问者方便来选择被访者,通常被访者由于碰 巧在恰当的时间正处在恰当的地点而被选中 • 使用学生以及社会组织成员; • 医院拦截患者; • “街上的行人”访谈。 优点:便利抽样在所有抽样技术中成本最低、耗时最少,抽样 单位易于接近; 缺点:不能代表总体。
.
如何确定恰当的抽样误差?
有专家认为,抽样调查估计值的相对误差控制在10%以 内,数据质量好,控制15%以内,数据质量较好,控制 20 %以内,数据可用。一些国家在进行国家级抽样调查时,给出 主要调查指标相对误差应控制的范围,规定了估计值的相对误差 超过30%不能公布。
.
案例1
某研究论文中按“病情和就诊的先后顺序分组”。 因 病人就诊的先后顺序往往暗示其病情不同,尤其是当病人 的病情轻重难以判断时若将先来就诊者分在一组,后来就 诊者分在另一组,就不可避免的引入顺序误差( 即一组病人 的病情较另一组病人的病情重) ,从而得出错误结论。
1955年,盖洛普在新泽西州的普林斯顿创立美国舆论研究所,正式举办有关 政治和社会事业问题的各种全国性民意调查——包括对世界人民的态度、恐惧、 希望、宗教信仰和风俗刁惯等的调查。这个研究所的成立,迅速使盖洛普民意测 验具有了权威性,该研究所也称为盖洛普民意测验所。
.
盖洛普的成功
.
盖洛普方法
盖洛普使用的民意调查方法是一种代表性抽样调查方法,是 他在从事新闻工作中发展起来的,根据对象的年龄、性别、教育 程度、职业等标准,在全国各地区按比例选择测验对象,派调查 员亲自去调查访问,根据统计测验结果进行分析,做出说明。这 种方法就是所谓的“定额抽样法”,即将总体各单位按某些主要 标识划分类型后抽取比例样本,是一种非概率抽样。
.
概率抽样与非概率抽样间作抉择
决择考虑方面
研究的性质 抽样误差与非抽样误差的相对大小 总体的变异程度 统计上的考虑 操作上的考虑
有利于使用的条件 非概率抽样 概率抽样
.
一、定义总体
程抽 样
二、确定抽样框架
设 三、选择抽样技术
计
过 四、确定样本容量
五、执行抽样过程
.
抽样调查的主要问题
.
抽样误差
抽样调查目的是用样本调查数据推断总体。但任何样本 数据推断总体,都不可能得到确切的总体真值。即存在抽样 误差。抽样调查理论基础在于用样本数据估计的总体值与总 体真值之间的误差,不会影响数据的使用和对问题的决策。
.
如何正确认识抽样误差?
调查数据存在着误差是绝对的,而误差的大小是相对的, 其相对性取决于研究的问题和需要的决策。在抽样方案设计时, 需要对调查主要指标有一个误差的要求,即样本的抽样误差控 制在什么范围,使其调查数据的使用对分析和决策问题没有影 响或影响很小。这一误差标准没有统一的规定,取决于数据使 用者分析问题与决策的要求。指标相对误差很小,数据精度太 高,样本量需求量大;指标相对误差很大,精度太低,对使用 者来讲数据不能用。
.
滚雪球抽样
通常是先选出一组最初的调查对象,通常是随机选出的, 在访谈之后,要求这些被访者推荐一些属于目标总体的其他 人,根据这些推选出后面的被访者。与随机的方式相比,被 推举的人将具备与推荐人更为翔实的人口及心理特征。 优点是:主要目的是估计总体中wk.baidu.com常稀少的某些特征。 缺点是:这种方式非常耗时。
.
抽样调查的特点
特点1:抽取的样本作为一个“代表团”来代表总体。而不是随意 挑选的个别单位代表总体。 特点2:调查样本一般按随机的原则抽取,在总体中每个单位被抽 取的机会相等。因此被抽中的单位在总体中是均匀分布的,不致出 现倾向性误差,代表性强。 特点3:所抽取的调查样本数量是根据误差的要求并经过科学的计 算确定,在调查样本的数量上有可靠保证。 特点4:抽样误差在调查前就可以根据样本量和总体中各单位之间 的差异程度进行计算,并控制在允许范围内,调查结果的准确程度 较高。
.
对抽样误差认识与使用的误区
一些研究者甚至部分官员不愿意或不习惯接受数据的误差 范围,一谈到误差,惟恐别人说数据不准,将数据误差绝对。 由于对数据误差的认识存在着误区,在如何使用数据上也存在 着误区。抽样调查的数据拿来就用,不谈抽样误差和调查误差, 认为调查数据就是总体的真值。在进行工作政绩考核或进行地 区间的数据对比时,调查指标数据的高低变成了地区之间排队、 政绩评比的依据,忽视了对数据误差的评估。现有的调查数据 不仅没有正确地使用,反而还带来地区之间数据高低的相互攀 比,同时也影响了以后抽样调查的数据质量。