1.2基本概念+1.3几种方法+1.4抽样调步骤

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

简单随机抽样
单纯随机抽样:按照等概率原则直接从含有



N个元素的总体中随机抽取n个元素组成样本 (N>n)。 常用的方法:抽签、随机数字表 优点:可能产生代表性样本 缺点: 1.抽样框难做 2.单元较分散 3.未能充分利用辅助信息
分层抽样


分层抽样(stratified sampling)又称类别抽样, 它是先将总体所有单位按某些重要标志进行分 类(层),然后在各类(层)中独立,随机地抽取 样本单位的一种抽样方式。 例如,对员工收入状况进行调查,就可将员工 按职业不同,分为生产人员、销售人员、管理 人员等各层,再从各层中抽取员工。
第一章 引言
1.1 调查与抽样调查
1.2 基本概念
1.3几种基本的抽样方法 1.4 抽样调查步骤
1.2 基本概念


一 目标总体与抽样总体 二 抽样框与抽样单元 三 总体参数与统计量 四 估计量方差、偏倚、均方误差 五 抽样误差与非抽样误差 六 精度与费用
1.2
基本概念
一、目标总体与抽样总体
N
统计量



统计量是根据样本的n个单元的变量值计算出的 一个量,也叫估计量,用于对总体参数进行估 计。 注:估计量是随机变量 研究统计量的期望与方差是抽样理论的主要问题。
四 估计量方差、偏倚、均方误差


估计量分布的方差称为估计量方差,它 是从平均的意义上说明估计值与待估参 数的差异状况,也是我们对抽样方案进 行评价的标准之一。 估计量方差表达式:
系统抽样
等距抽样或机械抽样,将总体的单位编
号排序后,按照固定的间隔抽取个体组 成样本的方法.
优点:简便易行
缺点:估计量方差较难估计.
第四节
抽样调查步骤
1. 确定调研问题
2. 抽样方案设计
3. 问卷设计
4. 实施调查过程
5. 数据处理分析
6. 撰写调查报告
确定调研问题
整个调查的第一步,也是至关重要的一步。在 这个过程中首先需要明确的定义问题,包括对整个 问题的的叙述以及确定研究问题的具体组成部分。 只有问题定义清楚了,才有可能进一步设计和执行。
简单随机抽样:简单随机抽样也称纯随机抽样,是从抽样框内的 N个抽样单元中随机地、一个一个地抽取n个单元作为样本,在每 次抽选中,所有未入样的待选单元入选样本的概率是相等的,这n 个被抽中的单元就构成了简单随机样本。
例题: 某大学欲了解该校研究生中打算报考
托福人数的比例,全校研究生共有570人,随 机抽取了100人,其中有14人准备参加托福 考试,试以95%的把握程度对研究生中欲报 考托福人数的比例作出估计。
问卷设计
问卷设计的基本问题
1. 设置的问题应当围绕调查的目的展开。 2. 访问时间的长短要适当控制。 3. 在问卷的开头往往设置问题以区别被访问者的类型。
4. 所提问题要清晰,用词要妥帖,并注意礼貌。
5. 问题要有层次地展开,市场调查等问卷中要注意有比较。 6. 注意问卷的格式。 7. 一般问卷中应设有编码栏。
N
2. 总体均值(population
N
mean):Y 1 N
Y
i 1
N
i
3. 总体比例(proportion):如全部产品中合格品所占比 Y 例:
P
i 1 i
当第i单元具有某个特定的特征时,Yi=1,否则 Yi=0。 4. 总体比率(population ratio): Y Y 式中Y、 Y R X X 和X、 X 为两个总体指标值。
ˆ ˆ ˆ V ( ) E E ( )


2
偏倚是指按照某一抽样方案反复进行抽样,
估计值的数学期望与待估参数之间的离差。 ˆ ˆ 偏倚的表达式 :B( ) [ E ( ) ] 对于无偏估计量 ,偏倚为零 。
均方误差(Mean Square Error, MSE )指所有可能的 估计值与待估参数之间离差平方的均值,它等于估计量 方差加偏倚的平方,即



总体参数:是总体某个特征或属性的 数量表现。 常见的总体参数有4种:(1)总体总 值;(2)总体均值;(3)总体比例; (4)总体比率 注:总体总值、总体均值、总体比例 三者是统一的,它们都可以用总体均 why 值来表示。
三、总体参数与样本统计量
1. 总体总量(population total): Y Yi i 1
(6)抽样设计和估计程序:清楚说明调查中所使用的抽样单 元、抽样框、样本大小和抽样方法,指出估计时所用的 公式。 (7)结论的描述:列表资料应该以清楚且易于理解的方式列 出。
(8)精确度:调查结果中应该列出估计所达到的精确程度、 检验及比较的结果、对调查质量的评估。还必须指出无 回答者的种类、比例以及对最后结果的影响程度。 (9)责任:主办机构及指挥此调查的机构须在报告中提出。
分层抽样
类型抽样,将总体中的所有单位按照某种特征或标





志划分为若干类型或层次,在每个类型或层次中采 用简单随机抽样或系统抽样的方法抽取一个子样 本,共同构成研究的样本. 优点: 1.在不增加样本规模的前提下降低抽样误差,提高 抽样精度,增大代表性 2.便于了解总体内不同层次的情况,以及对总体中 的不同层次进行单独研究或者进行比较. 注意: 1.分层的标准问题 2.分层的比例问题
注:另一个影响精度与费用的因素是抽样方法和估计方法
最优抽样设计:指以最小的费用达到要求的精度或者在给定费用的 情况下达到最大的精度。
1.3几种基本的抽样方法
概率抽样调查 非概率抽样调查
•简单随机抽样 •分层抽样 •整群抽样 •多阶段抽样 •系统抽样等
• • • •
判断抽样 便利抽样 自愿抽样 配额抽样等
有元素构成样本. 优点: 1. 简化抽样过程 2. 降低收集资料的费用 3. 扩大抽样范围 缺点:估计的精度较差
4. 多阶段抽样:采用类似整群抽样的方法,首先抽 取群,但不是调查群内的所有基本单元,而是再进 行一步抽样,从选中的群中抽取出若干个基本单元 进行调查(二阶段调查)。
如果每个次级单位又可以进一步分为更小的三级单位,那 么在每个被抽中的二级单位中再抽取三级单位,这称为三 阶段抽样,以此类推,可以定义更多阶段的抽样。
确定调研问题所要回答的是“要做什么样的调 查研究”和“为什么要做这项研究”。调研人员需 要考虑研究的目的、相关的背景材料、所需要的信 息以及这些信息在分析时如何使用。
抽样方案设计
抽样方案要描述样本是如何抽取的。调查中有 不同的数据收集方法,如面访调查、电话调查、邮 寄调查等。不同的收集方法需要不同的抽样框,抽 样方案设计也包括抽样框的设计。
3. 整群抽样:将总体中若干个基本单元合并 为组,这样的组称为群。抽样时直接抽取 群,然后对中选群中的所有基本单元全部 实施调查,这样的抽样方法称为整群抽样。
例如,某大学要调查学生的视力,可以将班做为一个群, 随机抽取几个班,对这些班的全部学生进行调查。
整群抽样
从总体中随机抽取一些小群体,将小群体的所
系统抽样


系统抽样是将N个总体单位按一定顺序 排列,先随机抽取一个单位作为样本的 第一个单位,然后按某种确定的规则抽 取样本的其它单位。 其中最简单也是最常用的规则是等间隔 抽取。所以系统抽样又称等距抽样。
系统抽样
例如,从600名大学生中抽选50名大学生



利用学校现有名册按顺序编号排序,从第 001号编至600号。 抽选距离=N/n=600/50=12(人) 如从第一个12人中用简单随机抽样方式,抽 取第一个样本单位,如抽到的是8号,依次 抽出的是20号,32号,44号……等。
2 ˆ ˆ ˆ) E V ( ) B 2 ( ) ˆ MSE (
五 抽样误差与非抽样误差

抽样误差:抽样误差是由于抽取样本的随机
性造成的样本值与总体值之间的差异。

估计量方差及估计量标准差都为抽样误差的表 现形式。

非抽样误差:由于其它多种原因引起的估计 值与总体参数之间的差异。

抽样框的类型:名录框,区域框,自然框
抽样框的要求: (1)抽样框必须是有序的,即抽样单元必须编号。 (2)抽样框应与目标总体保持一致。 ()尽可能多地提供与研究的目标量有关的辅助信息。 抽样单元:是构成抽样框的基本要素,抽样单元可以只包含一个 个体,也可以包含若干个个体,抽样单元还可以分级。
三 总体参数和统计量
目标总体:简称为总体,是指所要研究对象的 全体,它由研究对象中所有性质相同的个体组成, 组成总体的各个个体称为总体单元或单位。 抽样总体:是指从中抽取样本的总体。
思考:两者是否一致?
二、抽样框与抽样单元
抽样框:是一份包含所有抽样单元的名单,给每 一个抽样单元编上一个号码,就可以按照一定的随 机化程序进行抽样。抽样总体的具体表现是抽样框。
数据处理分析
调查的收获阶段,它为撰写调查报告提供基本 的素材。在这个阶段,首先要对经过调查获得的原 始数据进行检查、核对,对验收合格的调查问卷进 行编码和录入。数据录入后,多数情况下需要进行 数据的预处理,为统计分析做好准备。
数据的预处理包括:录入数据的再编码,它是对原编码 的补充和调整,满足某些统计分析软件对编码的特殊要求, 也是根据研究要求对数据的重新归类分组;对缺失值进行插 补,以构造出完整的数据集;进行变量的转换,进而进行常 规的统计分析;计算目标量的估计值、方差及变异系数的估 计值等。
实施调查过程
在这个过程中要获得样本单元的调查数据,关 键的问题是要保证原始数据的质量,这就需要对调 查过程进行有效的管理和监控。
调查实施前需要对调查员进行技术培训,使调查员熟悉 调查问卷,掌握访谈技巧,并增强责任心。 在调查过程中加强质量检验,出现问题及时总结,及 时补救。 调查人员要有操作手册,调查过程中也要有管理制度 和措施,使得从事具体调查的人员有章可循。
撰写调查报告
(1)主题:清楚地指出此调查的目的,并提出对调查结果的使 用方式。 (2)范围:正确地描述调查范围,包括指定的研究定义及调查 的地理区域。
(3)调查对象:详细叙述此调查所收集的资料项目及为列表项 目的原因。
(4)资料收集方法:清楚地叙述所采用的收集资料的方法。此 外,收集资料过程中遇到的困难及解决的方法,均应详细 说明。 (5)调查期、参考期和报告期。
此外对样本又有不同的抽取方法,在制定抽样 方案时既要考虑方法的科学性,又要照顾实际的可 行性。
2 抽样方案设计
1. 界定总体及目标量:范围与界限 2. 制定抽样框:收集总体中全部抽样单位的 名单,并对名单统一编号。 分段、分层抽样时则要分别建立起几个不 同的抽样框 3 确定收集数据的方法 4. 决定抽样方案:确定抽样方法、样本规模、 主要目标量的精确程度,确定总体目标量 的估算方法。
• 包括:抽样框误差、计量误差、无回答误差等
六 精度与费用
精度由误差来表现。 抽样误差与样本量有关, 样本量越大,在其它条 件相同情况下,抽样误 差就越小,抽样调查的 精度就越高。 调查的费用是一个与样
抽 样 误 差
样本容量 的算术平 方根
本量有关的函数,最简 单的是线性费用函数。
C c0 c1n
多阶段抽样
多级抽样或分段抽样,按照抽样元素的隶属关系
或层次关系,把抽样过程分为几个阶段进行。 步骤: 1. 以大群为单位编制抽样框 2. 抽取若干大群 3. 以小群为单位给每个大群编制抽样框 4. 分别从每个大群中抽取小群 5. 根据需要重复3、4步骤 6. 得到基本元素,构成研究样本 优点:方便易行,样本相对集中,节约调查费用
(6)抽样设计和估计程序:清楚说明调查中所使用的抽样单 元、抽样框、样本大小和抽样方法,指出估计时所用的 公式。 (7)结论的描述:列表资料应该以清楚且易于理解的方式列 出。
(10)参考文献。
(5)撰写调查报告
(1)主题:清楚地指出此调查的目的,并提出对调查结果的使 用方式。 (2)范围:正确地描述调查范围,包括指定的研究定义及调查 的地理区域。
(3)调查对象:详细叙述此调查所收集的资料项目及为列表项 目的原因。
(4)资料收集方法:清楚地叙述所采用的收集资料的方法。此 外,收集Fra Baidu bibliotek料过程中遇到的困难及解决的方法,均应详细 说明。 (5)调查期、参考期和报告期。
相关文档
最新文档