(应用统计学经济与管理中的数据分析)第六章抽样调查基础

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

6
三、精度、信度与效度
7
图6-1描述了ABC三种抽样调查对各自的总体均值参数的估 计情况,图中的空心圆圈表示均值参数真值的位置,而散点 表示了抽样样本。从图中可以直观地看到,A偏倚小(可以理 解成样本“重心”和均值参数真值位置之间的系统性误差) 而样本的方差(可以理解为调查中的随机误差)大,称这样的 抽样调查效度(validity)高而信度(reliability)低;B的系统性 误差大而随机误差小,称这样的抽样调查效度差而信度高; 相比之下,C的系统误差与随机误差都小,即均方误差小, 精度高。
系统抽样调查的精确度一般要高于简单随机抽样。但由于系统抽样中第一个样 本单位的位置确定以后,其余的样本单位的位置也就自动确定,因此要避免由 于所采用的样本间距和所研究对象本身的周期循环性(如果存在的话)相重合而引 起系统性的偏差。另外,由于系统抽样不是严格的概率抽样,因此系统抽样的 方差估计比较困难。
21
三、群规模大小相等时的估计量及其性质
(一)总体特征的估计量 (二)方差的估计
1. 总体方差的估计 2. 总体特征的方差
22
23
第六节 系 统 抽 样
系统抽样(systematic sampling)又称为机械抽样,首先将总体的全部单元按照 某一已知变量排队,接着依简单随机抽样方法从总体中抽取第一个样本点,然 后按某种固定顺序和规律一次抽取其余样本点,最终构成样本。
3
第一节 基 本 概 念
抽样调查涉及的概念比较多。首先对抽样(sampling)做一个大的分类:概率抽 样(probability sampling)和非概率抽样(non-probability sampling),其中概 率抽样又可以称为随机抽样(random sampling)。概率抽样具有以下几个基本 特点:①能够确切地定义(或区分)不同的样本,即能够明确表明一个确定的样本 包含哪些个体;②对每个可能的样本,都赋予一个被抽到的概率;③通过某种 随机形式从总体中抽取一个样本,使这个样本被抽中的概率等于所赋予的概率 ;④从样本估计总体参数时需要与抽样概率相联系。概率抽样的优点在于可以 估计抽样误差,可获得估计的精度。非概率抽样主要依赖主观判断,或根据操 作方便的原则进行。非概率抽样一般不能估计其抽样误差。本章的重点是概率 抽样,对非概率抽样只讨论系统抽样。
对于第一个问题,群的划分应尽可能使群与群之间的差异小,而群内的 差异越大越好。这样,每个群才有足够好的代表性。如果所有的群都相 似,那么只抽取少数群就可获得相当好的精度;反之,若群内的单元比 较相似,而群与群之间的差别较大,则整群抽样的效率就会很低,所以 分群的原则与分层的原则是相反的。图6-5直观地表明了理想的分层与 整群抽样的思想,其中相同字母表示有相近的观测值的单元,左图表示 分层抽样,实线,图6-5是层内的单元,右图表示整群抽样,虚线是群 内的单元。
二阶段抽样的实施,首先按一定的方法从总体中随机抽 取 个初级单元,再对每个被抽中的初级单元抽取若干个 二级单元,因此在求二阶段抽样估计量的均值与方差时 ,就必须把这个二阶段抽样过程中产生的所有样本加以 平均。
16
一、多阶段抽样概述
17
二、估计量及其性质
(一)估计量
1. 总体均值 2. 总体比例
(二)估计量的性质
(2) 估计有两种思路,一种是不借助任何辅助变量直接估计 ,另一种是借助相关辅助变量间接估计。在没有总体其他相 关辅助变量信息可以利用的情况下,用样本特征直接估计总 体特征,是简单估计。比估计是一种间接估计。如果在调查 中,除了调查指标y之外,还有一个指标 的信息可以利用( 比如它的总体均值 或者总值 已知;也可以直接利用 的样本 信息),而且y与 之间存在着比例关系,则可以利用辅助变 量 的信息构造比估计量,以提高估计的精度。
28
二、案例研究
(一)分层并确定抽样单位数 (二)层内的整群抽样 (三)估计省级人口变动情况
(1) 计算总人口出生率 (2) 计算抽样误差的公式 (3) 假设省级的人口统计表
29
本章小结
(1) 误差一般理解为估计值与真实值之间的差异。误差越小 ,估计量的精度越高。精度可以用误差平方的均值来定义。 均方误差可以分解成估计量的方差以及估计量的均值对总体 参数真值的偏倚的平方。偏倚小而方差大,称这样的抽样调 查效度高而信度小;偏倚大而方差小,称这样的抽样调查效 度差而信度高。
1. 总体均值的方差 2. 总体总值方差 3. 总体比例的方差
18
第五节 整群随机抽样
一、整群随机抽样概述
一些调查中,尽管调查对象是次级单元,但不易得到包含所有这些 单元的抽样框。例如,一个城市就很难找到一份现成的包含其所有 居民或房屋的名册,但有可能较容易地得到一个包括所有社区居委 会的名册。在这种情况下采取整群抽样,简单易行,并可以节约费 用。
8
第二节 简单随机抽样
简单随机抽样(simple random sampling)有两种等价的定 义:第一,从总体 个单元中,一次抽取 个单元,使全部可 能的 种不同的结果每种被抽到的概率都等于 ,通过这种抽 样得到的样本叫做简单随机样本,样本容量为 ;第二,从 总体 个单元中,逐个不放回地抽取单元,每次抽取到尚未 入样中的任何一个单元的概率都相等,直到抽足 个单元为 止,这样所得的 个单元也组成一个简单随机样本。图6-2形 象地表示了简单随机抽样。
27
一、统计软件应用
第3步:在弹出的“函数参数”对话框中单击【确定】 按钮,如图6-10所示。 此时会出现如图6-11所示的界面。 按要求修改函数,比如,使随机数在0~3038之间取整 数,如图6-12所示。 单击单元格A1的右下角往下拖动,一直到出现400个随 机数,即取完样本随机数,如图6-13所示。
2
第六章 抽样调查基础
【本章导读及学习目标】
抽样调查是统计学中两个具体研究样本获得方法的分支 之一(另外一个是本书第八章讨论的试验设计),它按一 定的程序从所研究的对象的全体(总体)中抽取一部分(样 本)进行调查或者观测,再根据获得的样本数据对总体的 未知参数做推断(本章主要是估计)。抽样调查有较深的 数学处理,本章只介绍一些基础。本章的主要目的是掌 握几类重要的随机抽样以及系统抽样的基本思想,掌握 简单随机抽样的样本容量确定方法,了解其他几类随机 抽样的样本配置方法,掌握各类抽样的总体参数的简单 估计方法,了解估计量的方差性质,知道比估计的概念 。
(二)估计量的性质
1. 简单估计 2. 比估计
15
第四节 多阶段抽样
一、多阶段抽样概述
多阶段抽样(multi-stage sampling)是将整个抽样过程分 成若干个阶段,每个阶段抽出一个级别的单位,最终抽 出被调查者。多阶段抽样可以是两阶段、三阶段或者更 多阶段抽样。这里主要介绍两阶段抽样。
假设总体由 个初级单元组成,每个初级单元又由若干个 二级(次级)单元组成,若在总体中按一定的方法抽取 个 初级单元,对每个被抽中的初级单元再抽取若干二阶单 元进行调查,这种抽样被称为二阶段抽样(two-stage sampling)。
24
一、系统抽样的实施方法
(一)直线等距抽样 (二)圆形等距抽样
25
二、估计量及其性质
(一)总体特征的估计 (二)方差及其性质
1. 估计量的方差
(1) 系统抽样与整群抽样之间的关系 (2) 系统抽样与分层抽样之间的关系
2. 估计量的方差的性质
26
第七节 统计软件应用与案例研究
一、统计软件应用
利用随机数表、随机数骰子、计算器或计算机产生的随机数进行抽 样,若代表同一单元的随机数出现两次或两次以上,则从第二次开 始就弃去不用,再抽下一个,直到抽足 个不同的单元为止。 第1步:打开一个空白Excel表,选择任意一列(图中显示的是A列) ,选中单元格A1,单击【插入】菜单,如图6-8所示。 第2步:从弹出框中选中【函数】选项,这时会出现【插入函数】 弹出框,在【选择函数】列表框中选择RAND函数,单击“确定” 按钮,如图6-9所示。
设总体由一些大单元,即初级单元(primary unit)组成,每个初级单 元又由若干个较小的次级单元(secondary unit)组成。从总体中按某 种方式抽取某些初级单元,观测其中包含的所有次级单元,这样的 抽样称为整群抽样(cluster sampling),或者称为单阶整群抽样 (single-stage cluster sampling)。如果总体中的单元可以分为多级 ,则可以对前几级单元采用多阶段抽样,而在最后一阶段中对该级 抽样单元中所包含的全部最低级单元进行观测,此即多阶段整群抽 样(multi-stage cluster sampling)。 图6-4给出了一个从124个班中随机抽取5个班的整群抽样的例子。
30
本章小结
31
思考与练习题
一、思考题 二、练习题
参见教材P166
32
案例分析
泊美公司女性健美沙龙活动促销调研
参见教材P169 分析与提示:可以通过项目实施前后各种指标的比较 来判断是否有效,同时参考简单随机抽样方法以及置 信区间计算等部分的内容进行进一步分析。
(资料来源:卫海英. 应用统计学. 广州:暨南大学出版 社,2001)
9
一、样本容量的确定
(一)参数为总体总和或总体均值的情形 (二)参数为总体比例的情形
10
二、估计方法
(一)估计方法
1. 简单估计 2. 比估计
(二)估计量的无偏性
(1) 总体均值 (2) 总体总值 (3) 总体比例 (4) 总体比率
11
三、方差与区间估计
1. 总体特征的方差的简单估计 2. 比估计量的方差估计
12
第三节 分层随机抽样
13
一、层数确定与样本量分配
(一)确定层数的基本思想 (二)每层样本量的分配
1. 比例分配 2. 最优分配 3. 奈曼最优分配(Neyman optimum allocation)
14
二、估计量及其性质
(一)估计量
1. 简单估计 2. 比估计
(1) 分别比估计: (2) 联合比估计:
系统抽样有两个特点:第一是抽样之前必须将 个单元进行排序;第二是第一个 或第一组样本点之外的其他样本点的选取规则既不同于第一个或第一组样本点 ,也不是随机的。
这里之所以称这种方法为系统抽样,是由于第一个样本点一经抽出,整个样本 就完全确定了,这种整体性可以被看作是系统的。
在实际操作中,系统抽样有比较广泛的应用。比如,工厂生产线上进行产品质 量检查时就常常采用这个抽样方法。系统抽样的优点是抽样方式简单,对抽样 框的要求不高,在某些情况下甚至可以不需要抽样框,因而容易实施。而且, 系统抽样能使样本在总体中均匀分布,系统样本一般具有较好的代表性。
抽样可以逐个进行,即每次只从总体中抽取一个个体(或单元),也可以整个样本 一次同时抽取。在逐个抽取时,每次被抽到的个体可以不放回也可以重新放回 整体中去,前者称为不放回抽样(sampling without replacement),后者称为 放回抽样(sampling with replacement)。如果整个样本一次同时抽取也是一种 不放回抽样。另外,当抽取总体中的每个个体时,个体被抽中的概率可以是相 等的,也可以是不等的。前者称为等概率抽样(sampling with equal probabilities),后者称为不等概率抽样(sampling with unequal probabilities)。
19
一、整群随机抽样概述
N=124 个班
42
40
38
37
41
39
40 …… 41
39



人Baidu Nhomakorabea





40
37
39
45
39
随机抽取 5 个班





样本 200 人
20
二、群划分的原则
关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然 形成的单位时,如何确定每个群的组成;二是如何确定群的规模,即群 的大小。
相关文档
最新文档